레플리
글 수 214


K-001.png

 

K-002.png

 

K-003.png

 

https://arxiv.org/pdf/1812.08989.pdf

 

 

 

지난번에 MS의 소셜챗봇인 샤오이스에 대한 논문을 소개하였습니다(http://aidev.co.kr/chatbots/7931). 하지만 챗봇의 종류 및 기능에 대한 일반적인 내용이 대부분이었습니다. 작년 12월에 새로운 논문이 발표되었는데, 좀 더 세부적인 사항에 대해서 다루고 있습니다. 특히 Dialogue Manager와 Core Chat이 자세히 나와 있습니다.

 

 

 

Dialogue Manager는 전체 시스템의 컨트롤 타워입니다. 샤오이스는 모든 대화가 주제에 따라 분류되어 있습니다. 또한 스킬이라는 형식으로 날씨, 유머 등 특정 기능을 수행합니다. 이런 토픽과 스킬을 적절하게 관리하여 대화를 이끄는 역할을 담당합니다.

 

Core Chat은 일상 대화를 처리하는데 크게 3가지 방법으로 구성되어 있습니다. 첫째, 질문-대답 목록을 검색합니다. 처음에는 인터넷에서 사람들이 주고받은 문장들을 크롤링하였습니다. 하지만 지금은 샤오이스가 유저들과 나눈 대화 데이터가 70% 이상이라고 합니다. 둘째, Seq2Seq 모델로 문장을 직접 생성합니다. 셋째, 크롤링한 정보에서 질문-대답이 아닌 단문을 활용합니다. 예를 들어, '베이징에 대해 알려줘'라고 물어보면, 베이징과 관련된 문장을 찾습니다. 그리고 '베이징에서는 만리장성이 가장 유명해' 같이 대답합니다. 마지막으로 이렇게 만들어진 문장 후보들에 점수를 부여합니다. 이때 바로 앞 질문만이 아니라 전체 맥락을 고려하는 등 여러가지 기법이 사용됩니다.

 

사실 논문의 내용만으로는 구체적인 구현 방법을 알기가 어렵습니다. 크롤링한 대화 데이터를 주제별로 분류, 부적절하거나 올바르지 않은 문장을 제거하는 품질 유지, 대답 문장 후보들의 랭킹 계산 등 진짜 핵심적인 노하우는 빠져있습니다. 그래도 소셜챗봇의 구조를 파악하고 싶은 분들은 꼭 읽어보시길 추천드립니다.

 

 

 

최근 딥러닝이 발전하면서 자연어처리도 End-To-End 방식이 많이 연구되고 있습니다. 하지만 하나의 모델로 완벽하게 대화를 할 수 있는 인공지능은 당분간 어려울 듯 합니다. 화제유지, 목적지향 기능, 정보검색, 유저 프로파일링 등 이 모든 것을 학습만으로 구현하기엔 한계가 있습니다. 아마 구글 듀플렉스도 어느정도 하이브리드 방식이 아닐까 생각됩니다. 만약 이게 가능해진다면 인간과 비슷한 AGI에 상당히 가까워진 것이 아닐까요.

List of Articles
제목 글쓴이 날짜 조회 수
GenZ 여성들에게 챗GPT 남자친구와 대화하는게 유행 file 깊은바다 2024-04-22 37
생성AI SNS에서 사람과 AI가 소통하는 세상 - 디어메이트 file 깊은바다 2024-04-12 70
뤼튼, 웹 검색 후 최신 정보 반영 file 깊은바다 2024-04-05 72
마인드로직의 페르소나 챗봇 - 전 SM엔터 이수만 회장 70억 투자 file 깊은바다 2024-03-28 128
NVIDIA와 파트너십을 맺은 AI 간호사 서비스 - Hippocratic AI file 깊은바다 2024-03-21 156
Claude 3가 가끔씩 사람처럼 느껴질 때 file 깊은바다 2024-03-19 184
Claude 3와 GPT-4의 일상대화 비교 file 깊은바다 2024-03-15 208
Claude-3와 영화 Her의 사만다 file 깊은바다 2024-03-10 162
Claude-3와 GPT-4의 감성대화 능력 비교 file 깊은바다 2024-03-10 235
일본 MZ세대에게 인기를 끌고 있는 앱 - 이야기 듣는 삼촌 file [2] 깊은바다 2024-03-04 624
GetGPT의 가장 인기 챗봇 - 행발 작성 프로그램 file 깊은바다 2024-02-19 203
클로바X, GPT-3.5, GPT-4의 일상대화 능력 비교 file 깊은바다 2024-02-13 209
버추얼 아이돌 메이브와 대화할 수 있는 AI 챗봇 file 깊은바다 2024-02-08 193
Rabbit의 R1은 뉴로-심볼릭으로 LAM(Large Action Model) 구현 file 깊은바다 2024-01-21 376
혁명적인 AI 네이티브 휴대용 기기 - Rabbit의 R1 file 깊은바다 2024-01-12 509