레플리
글 수 211


K-001.png

 

K-002.png

 

K-003.png

 

https://arxiv.org/pdf/1812.08989.pdf

 

 

 

지난번에 MS의 소셜챗봇인 샤오이스에 대한 논문을 소개하였습니다(http://aidev.co.kr/chatbots/7931). 하지만 챗봇의 종류 및 기능에 대한 일반적인 내용이 대부분이었습니다. 작년 12월에 새로운 논문이 발표되었는데, 좀 더 세부적인 사항에 대해서 다루고 있습니다. 특히 Dialogue Manager와 Core Chat이 자세히 나와 있습니다.

 

 

 

Dialogue Manager는 전체 시스템의 컨트롤 타워입니다. 샤오이스는 모든 대화가 주제에 따라 분류되어 있습니다. 또한 스킬이라는 형식으로 날씨, 유머 등 특정 기능을 수행합니다. 이런 토픽과 스킬을 적절하게 관리하여 대화를 이끄는 역할을 담당합니다.

 

Core Chat은 일상 대화를 처리하는데 크게 3가지 방법으로 구성되어 있습니다. 첫째, 질문-대답 목록을 검색합니다. 처음에는 인터넷에서 사람들이 주고받은 문장들을 크롤링하였습니다. 하지만 지금은 샤오이스가 유저들과 나눈 대화 데이터가 70% 이상이라고 합니다. 둘째, Seq2Seq 모델로 문장을 직접 생성합니다. 셋째, 크롤링한 정보에서 질문-대답이 아닌 단문을 활용합니다. 예를 들어, '베이징에 대해 알려줘'라고 물어보면, 베이징과 관련된 문장을 찾습니다. 그리고 '베이징에서는 만리장성이 가장 유명해' 같이 대답합니다. 마지막으로 이렇게 만들어진 문장 후보들에 점수를 부여합니다. 이때 바로 앞 질문만이 아니라 전체 맥락을 고려하는 등 여러가지 기법이 사용됩니다.

 

사실 논문의 내용만으로는 구체적인 구현 방법을 알기가 어렵습니다. 크롤링한 대화 데이터를 주제별로 분류, 부적절하거나 올바르지 않은 문장을 제거하는 품질 유지, 대답 문장 후보들의 랭킹 계산 등 진짜 핵심적인 노하우는 빠져있습니다. 그래도 소셜챗봇의 구조를 파악하고 싶은 분들은 꼭 읽어보시길 추천드립니다.

 

 

 

최근 딥러닝이 발전하면서 자연어처리도 End-To-End 방식이 많이 연구되고 있습니다. 하지만 하나의 모델로 완벽하게 대화를 할 수 있는 인공지능은 당분간 어려울 듯 합니다. 화제유지, 목적지향 기능, 정보검색, 유저 프로파일링 등 이 모든 것을 학습만으로 구현하기엔 한계가 있습니다. 아마 구글 듀플렉스도 어느정도 하이브리드 방식이 아닐까 생각됩니다. 만약 이게 가능해진다면 인간과 비슷한 AGI에 상당히 가까워진 것이 아닐까요.

List of Articles
제목 글쓴이 날짜 조회 수sort
캐나다 홈리스들을 위한 챗봇 깊은바다 2019-08-08 537
메타의 일상대화 AI - Meta AI와 28명의 캐릭터, AI Studio file [1] 깊은바다 2023-09-29 525
Character.ai에 이미지 생성과 음성을 추가한 서비스 - Talkie file 깊은바다 2023-10-04 523
심리상담으로 하는 인공지능 - 트로스트 깊은바다 2018-07-28 521
가상인간 바텐더 - Cecilia.ai 깊은바다 2022-01-05 515
청소년들을 위한 심리상담 챗봇 - 상냥이 file 깊은바다 2022-10-13 509
일본 MZ세대에게 인기를 끌고 있는 앱 - 이야기 듣는 삼촌 file [2] 깊은바다 2024-03-04 509
네이버 인공지능 주문예약 AiCall 상용화 시작 깊은바다 2020-02-06 507
일상대화 AI 최초로 유니콘 탄생 - Character.AI file 깊은바다 2023-03-22 492
상대방이 모두 AI인 데이팅 서비스 - 사만다 file 깊은바다 2023-07-31 487
KT의 초거대모델 믿음(MIDEUM)을 사용한 상담챗봇 - 오은영 AI 육아상담 서비스 file 깊은바다 2022-11-17 470
가상도시에서 NPC와 LLM으로 자유롭게 대화 - Replica Smart NPCs file [2] 깊은바다 2023-10-12 468
일상대화 챗봇 '드림이' 제작기 깊은바다 2018-12-21 466
가상 상담사 - 엘리 깊은바다 2016-03-25 458
네이버 블로그 스마트봇 file 깊은바다 2017-12-04 453