레플리
글 수 188


Reply Retrieval Model
Next Utterance Prediction Model
Query-Reply 50 Pair (single )
Query, Reply Sentence Encoder concat F...

 

https://www.slideshare.net/NaverEngineering/generaldomain-conversation-overview?fbclid=IwAR3TKgvasJO8fFn0IEztQ5DBqVtTD93RrnDvVqUAf8acPygkRSprtAohPGM

 

 

 

일상대화 챗봇인 핑퐁의 최신 기술을 다룬 발표 자료입니다. 핑퐁을 만든 스캐터랩은 사용자의 카톡 대화를 받아 분석하여 알려주는 서비스를 운영하였습니다. 여기서 수집한 데이터를 가지고 핑퐁의 인공지능을 구현하였습니다.

 

가장 대표적인 것이 Reaction 모델입니다. 전체 대답을 클러스터링하여 1200개의 클래스로 구분합니다. 그래서 어떤 입력이 들어와도 거기에 맞는 적당한 답변을 할 수 있습니다. 다만 너무 일반적인 대답이다 보니, 문장이 짧고 구체적인 내용이 없다는 단점이 있습니다. 그렇다고 클래스를 무작정 늘리는 것은 부담이 됩니다.

 

 

 

이를 보완하기 위해 Reply Retrieval Model을 새로 추가하였습니다. 두 입력이 주어졌을 때 서로 이어지는 문장인지 판별하는 역할을 합니다. 먼저 카톡 대화셋을 통해 학습을 수행하고, Reaction과 별도로 특정 영역의 답변셋을 작성합니다. 그다음 사용자가 문장을 입력하면 RRM으로 가장 잘 이어지는 대답을 찾습니다.

 

< Reaction >

질문 : 짜장면 먹고 싶다

답변 : 나도 배고파 ㅠㅠ

 

< RRM >

답변셋 목록

- 초밥이 맛있지!

- 탕수육은 어때?

- 불고기 먹으러 가자 ㅎㅎ

질문 : 짜장면 먹고 싶다

답변 : 탕수육은 어때?

 

위와 같이 리액션은 두리뭉실한 답변이지만, RRM은 좀 더 구체적인 내용이 가능합니다. 먼저 RRM으로 알맞은 문장을 찾고, 없으면 리액션으로 적당히 대답합니다. 이렇게 두 가지 모델을 동시에 사용하면 훨씬 그럴듯한 대화를 할 수 있습니다.

 

 

 

개인적으로 국내에서 일상대화 능력이 가장 높은 챗봇은 역시 핑퐁이 아닐까 생각합니다. 우선 이렇게 방대한 대화 데이터를 가진 곳이 거의 없습니다. 그래서 다른 곳에서 쉽게 따라하기 어렵다는 허들이 있습니다. 앞으로 멀티턴 같은 새로운 기능들이 계속 추가되기를 기대해 봅니다.

 

 

 

< 발표 동영상 >

-> https://www.youtube.com/watch?v=T4wjg9_E3K4

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
Replika, GPT3 도입 준비 깊은바다 2020-07-02 483
일상대화 챗봇이 쉽게 지루해지는 이유 file 깊은바다 2020-05-09 1211
시리의 개발자, 애덤 체이어의 발표 영상 깊은바다 2020-04-10 235
드라마 반의반, 사람의 인격을 가상의 인공지능으로 구현 깊은바다 2020-04-04 258
인공지능을 의인화하는 일라이자 효과(ELIZA Effect) file 깊은바다 2020-03-26 1167
핑퐁 빌더를 도입하면 챗봇이 2배 더 좋아지는 이유 - 일상대화 장점 깊은바다 2019-12-12 447
설문조사에서 구글홈보다 아마존 알렉사의 선호도가 높은 이유 깊은바다 2019-11-04 678
정신과와 외과 의사는 인공지능에서 자유로울까 - 가상 상담사 엘리 깊은바다 2019-10-14 444
챗봇 접객 자동화 3가지 영역 - 웹 컨시어지 챗봇 깊은바다 2019-10-03 4832
챗봇 열풍을 불러온 페이스북, 이제 딥러닝 자연어처리에 집중 깊은바다 2019-09-27 431
사용자가 직접 대답을 작성하는 알렉사 앤서(Alexa Answers) file 깊은바다 2019-09-17 335
AI스피커 보급 3년...“쓸만해요?” 물었더니 - 국내 설문조사 깊은바다 2019-09-01 594
챗봇이 '챗'봇이어야 하는 이유 - 의도분류를 넘어 일관된 대화를 하려면 깊은바다 2019-08-11 661
챗봇의 대화 자체는 수익 모델이 아니다 file 깊은바다 2019-08-06 939
알렉사 스킬 블루프린트(Skill Blueprints) - 웹사이트에서 쉽게 제작하는 스킬 깊은바다 2019-07-27 259