레플리
글 수 214


K-001.png

 

K-002.png

 

K-003.png

 

https://arxiv.org/pdf/1812.08989.pdf

 

 

 

지난번에 MS의 소셜챗봇인 샤오이스에 대한 논문을 소개하였습니다(http://aidev.co.kr/chatbots/7931). 하지만 챗봇의 종류 및 기능에 대한 일반적인 내용이 대부분이었습니다. 작년 12월에 새로운 논문이 발표되었는데, 좀 더 세부적인 사항에 대해서 다루고 있습니다. 특히 Dialogue Manager와 Core Chat이 자세히 나와 있습니다.

 

 

 

Dialogue Manager는 전체 시스템의 컨트롤 타워입니다. 샤오이스는 모든 대화가 주제에 따라 분류되어 있습니다. 또한 스킬이라는 형식으로 날씨, 유머 등 특정 기능을 수행합니다. 이런 토픽과 스킬을 적절하게 관리하여 대화를 이끄는 역할을 담당합니다.

 

Core Chat은 일상 대화를 처리하는데 크게 3가지 방법으로 구성되어 있습니다. 첫째, 질문-대답 목록을 검색합니다. 처음에는 인터넷에서 사람들이 주고받은 문장들을 크롤링하였습니다. 하지만 지금은 샤오이스가 유저들과 나눈 대화 데이터가 70% 이상이라고 합니다. 둘째, Seq2Seq 모델로 문장을 직접 생성합니다. 셋째, 크롤링한 정보에서 질문-대답이 아닌 단문을 활용합니다. 예를 들어, '베이징에 대해 알려줘'라고 물어보면, 베이징과 관련된 문장을 찾습니다. 그리고 '베이징에서는 만리장성이 가장 유명해' 같이 대답합니다. 마지막으로 이렇게 만들어진 문장 후보들에 점수를 부여합니다. 이때 바로 앞 질문만이 아니라 전체 맥락을 고려하는 등 여러가지 기법이 사용됩니다.

 

사실 논문의 내용만으로는 구체적인 구현 방법을 알기가 어렵습니다. 크롤링한 대화 데이터를 주제별로 분류, 부적절하거나 올바르지 않은 문장을 제거하는 품질 유지, 대답 문장 후보들의 랭킹 계산 등 진짜 핵심적인 노하우는 빠져있습니다. 그래도 소셜챗봇의 구조를 파악하고 싶은 분들은 꼭 읽어보시길 추천드립니다.

 

 

 

최근 딥러닝이 발전하면서 자연어처리도 End-To-End 방식이 많이 연구되고 있습니다. 하지만 하나의 모델로 완벽하게 대화를 할 수 있는 인공지능은 당분간 어려울 듯 합니다. 화제유지, 목적지향 기능, 정보검색, 유저 프로파일링 등 이 모든 것을 학습만으로 구현하기엔 한계가 있습니다. 아마 구글 듀플렉스도 어느정도 하이브리드 방식이 아닐까 생각됩니다. 만약 이게 가능해진다면 인간과 비슷한 AGI에 상당히 가까워진 것이 아닐까요.

List of Articles
제목 글쓴이 날짜sort 조회 수
아마존 에코쇼 리뷰 기사 깊은바다 2018-06-25 189
죽은 남자친구의 문자메시지를 사용해 만든 챗봇 - Roman chatbot 깊은바다 2018-06-26 453
원격 의료상담 챗봇 - 바빌론 헬스 깊은바다 2018-06-30 355
아마존 에코에서 즐기는 스카이림 게임 깊은바다 2018-07-12 137
플로차트로 만드는 간단한 챗봇 빌더 - Landbot.io 깊은바다 2018-07-20 330
Landbot.io로 만든 어벤져스 인피니티워 브랜딩 챗봇 file 깊은바다 2018-07-20 170
AI야구정보 '페이지' 선뵌 엔씨, AI 연구 이정표 만들고 싶다 깊은바다 2018-07-25 130
심리상담으로 하는 인공지능 - 트로스트 깊은바다 2018-07-28 522
인공지능소녀 별이 열한살 깊은바다 2018-07-31 436
150만 명의 연애운을 봐준 서비스 - 타로챗봇 라마마 인터뷰 깊은바다 2018-08-07 266
네이버 도라에몽 인공지능 스피커 깊은바다 2018-08-21 204
'지니! 타월 가져다 줘~' 말로 하는 호텔 가보니... 깊은바다 2018-08-23 167
네이버 클로바 미니 도라에몽 에디션 리뷰 깊은바다 2018-09-02 224
‘안드로이드 오토’ 써봤더니 깊은바다 2018-09-04 359
일상대화 인공지능 API - 핑퐁 file 깊은바다 2018-09-12 1135