레플리
글 수 214


Alexa Prize는 아마존에서 매년 개최하는 일상대화 챗봇 대회입니다. 영화, 음악, 동물 같은 주제에 대해서 20분 동안 대화를 이어가는게 목적입니다. 2020년 대회에서 2등을 수상한 스탠포드대의 챗봇을 소개해드립니다. 구조를 보면 크게 NLP Pipeline와 Response Generators로 이루어져 있습니다.

 

K-001.png

 

 

 

NLP Pipeline은 사용자의 발화를 이해하는 부분입니다. CoreNLP는 토큰화, 품사분석, 파싱 등 자연어처리를 수행합니다. Dialogue Act Classifier는 문장의 의도를 분류합니다. Entity Linker는 개체명을 인식합니다. 특히 위키피디아에서 어떤 항목을 검색할지결정하는데 주로 사용됩니다. 예를 들어, 현재 entity가 BTS라면 위키에서 BTS 항목의 글을 참조하여 대답을 생성합니다.

 

RG(Response Generators)는 여러개의 모듈로 구성되어 있습니다. Treelets는 시나리오 방식으로 대화의 흐름을 미리 작성합니다. Neural Chat은 GPT-2로 멀티턴을 고려하여 문장을 생성합니다. Wiki는 위키피디아에서 현재 entity 주제를 검사하여 다양한 사실들을 알려줍니다. 이때 이전 대화 히스토리와 위키에서 찾은 문장을 GPT-2 모델에 넣어 문장을 최종 생성합니다.

 

K-004.png

 

RG 중 Opinion은 이 챗봇의 가장 독특한 기능입니다. 먼저 트위터에서 'i (love|like|hate|dislike) TOPIC because REASON' 형식의 문장들을 수집합니다. 그리고 사용자가 TOPIC에 대해 얘기하면 REASON의 의견을 대답으로 사용합니다. 위키 정보를 보여주는 것은 다른 챗봇에서도 많이 활용하고 있습니다. 하지만 위키는 사실 정보에 기반하기 때문에 좀 지루한 편입니다. 트위터의 의견은 그보다 더 생생하고 재미있는 대답이 많다는 장점이 있습니다.

 

 

 

https://stanfordnlp.github.io/chirpycardinal/live_demo/

 

위에 링크에서 직접 테스트해보실 수 있습니다. 확실히 이전 Alexa Prize 챗봇보다 다채로운 대화가 가능해졌습니다. 그렇지만 대화의 흐름이 미리 짜여진 구조로 이어진다는 단점이 있습니다. Alexa Prize의 챗봇들은 보통 룰베이스와 머신러닝의 하이브리드로 개발되었습니다. 몇 년 대회가 계속되면서 지켜보니 결국 이 방식도 한계가 있는 것 같습니다. 향후에는 일상대화 챗봇도 GPT-3 같은 딥러닝 방식으로 발전해야 되지 않을까 생각됩니다.

 

 

 

K-002.png

K-003.png

 

 

 

K-005.png

 

List of Articles
제목 글쓴이 날짜 조회 수
Alexa Prize에서 2등을 차지한 스탠포드대의 챗봇 - Chirpy Cardinal file 깊은바다 2021-11-12 925
심심이와 비슷한 미국의 일상대화 챗봇 - SmarterChild file 깊은바다 2021-10-31 1062
자신의 복제 챗봇을 만들어주는 서비스 - Mind Bank AI 깊은바다 2021-10-19 774
왜 타로·사주 챗봇을 월 9900원에 구독할까 - 헬로우봇 깊은바다 2021-06-20 352
오프라인 매장도 없는 '카카오 뱅크'가 고속 성장한 이유는? 깊은바다 2021-04-26 280
네슬레의 버추얼 휴먼 - Ruth 깊은바다 2021-03-05 310
야마하의 노래하는 소셜로봇 - 찰리 깊은바다 2021-02-28 394
자동으로 화면을 이동하는 아마존 에코쇼 10 3세대 깊은바다 2021-02-25 260
일 파나소닉, 가정용 커뮤니케이션 로봇 '니코보' 발표 깊은바다 2021-02-19 251
카카오 i 랜선 친구 외개인아가 - 일상대화 챗봇 깊은바다 2020-11-30 444
카카오 스마트스피커를 목에 걸고 다녀야 하는 이유 - 미니링크 깊은바다 2020-09-30 196
어시스턴트, 시리, 빅스비, 알렉사에게 50개 질문 성능 테스트 깊은바다 2020-08-19 266
2020년 Alexa Prize 소셜봇 우승팀 - Emora file 깊은바다 2020-08-07 358
GPT3로 업그레이드한 텍스트 어드벤처 게임 - AI Dungeon 깊은바다 2020-07-22 752
구글 AI 스피커 써보니 - 네스트 허브 깊은바다 2020-07-08 236