글 수 219
https://www.venturesquare.net/838473
심심이나 이루다가 큰 인기를 얻은 이유는 그 다양성에 있다고 봅니다. 방대한 데이터에 기반하고 있어서 어떤 질문에도 그럴듯한 대답을 합니다. 그래서 지루하지 않게 대화를 이어갈 수 있습니다. 이루다는 이 데이터를 카카오톡 대화기록에서 추출했습니다. 반면에 심심이는 사용자가 직접 말을 가르치는 방법을 사용합니다.
예전 Jabberwacky란 챗봇이 있었습니다. 가장 큰 특징은 대화를 통해 문장을 스스로 학습한다는 것입니다. 예를 들어, 챗봇의 질문에 내가 대답을 하면, 그걸 Q/A로 만들어 학습DB에 저장합니다. 유저의 대답이 다시 챗봇의 질문이 되고, 그 질문에 다른 유저가 대답을 합니다. 이렇게 계속 새로운 학습 데이터가 생성됩니다. 그래서 심심이와 달리 유저가 직접 가르칠 필요가 없었습니다. 제 기억엔 이 챗봇도 방대한 범위의 대화가 가능해서 매우 재미있었습니다.
MS가 만든 Tay도 아마 비슷한 방식을 썼던 것 같습니다. 대화를 통해 혼자 말을 배웠습니다. 다만 인종차별적이고 폭력적인 말을 그대로 여과없이 사용해서 16시간만에 서비스가 종료되었습니다. 하지만 그만큼 큰 인기를 끌었던 것도 사실입니다.
일상대화 챗봇을 만들려면 무엇보다 방대한 학습 데이터가 가장 중요합니다. 그걸 어디서 구할지, 그리고 어떻게 필터링을 할지가 문제이긴 하지만요.