레플리
글 수 284


이루다는 요즘 화제가 되고 있는 일상대화 챗봇입니다. 얼마 전 정식으로 출시가 됐는데요. 구체적인 동작 방식에 대해 설명한 발표영상입니다.

 

전에 소개해드린 레플리카(http://aidev.co.kr/chatbotdeeplearning/10029)와 조금 유사합니다. 먼저 DialogBERT로 문맥을 포함한 입력을 벡터로 임베딩합니다. 그리고 Retrieval에서 입력과 대답목록를 코사인 유사도로 비교합니다. 이렇게 뽑은 후보문장들을 다시 Ranker에서 Poly encoder(https://blog.pingpong.us/ranker-model/)로 최종 답변을 얻습니다. 이는 앞의 입력과 뒤의 답변이 잘 이어지는지 판단하는 신경망 모델입니다.

 

알파에서는 Retrieval을 tf-idf로 유사도 비교를 했습니다. 반면에 베타에서는 DialogBERT로 임베딩한 벡터를 사용한 것이 가장 큰 차이점입니다. 또한 성능에 큰 영향을 주지 않던 모듈들을 제거하여 속도를 높이기도 했습니다.

 

저도 이루다와 대화를 해봤는데요. 개인적으로 Meena나 Blender, 레플리카에 뒤지지 않는 성능이라고 생각합니다(샤오이스는 중국어라 못해봤습니다^^;). 앞으로 전세계를 대표하는 챗봇으로 발전하길 기대합니다.

 

 

 

iruda1.jpg

 

 

 

iruda2.jpg

 

 

 

iruda3.jpg

 

 

 

iruda4.jpg

 

 

 

iruda5.jpg

 

 

 

iruda6.jpg

 

 

 

iruda7.jpg

 

iruda8.jpg

 

 

 

< 발표 영상 >

https://m.tv.naver.com/v/16968268

 

List of Articles
제목 글쓴이 날짜 조회 수sort
OpenAI Transformer GPT2로 만든 언어 모델 깊은바다 2019-02-17 2980
카카오 형태소 분석기(khaiii) 설치와 은전한닢(mecab) 형태소 분석기 비교 깊은바다 2018-12-02 2828
구글 딥러닝 자연어 처리 오픈소스 SyntaxNet file 깊은바다 2017-12-28 2784
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2784
추론이 가능한 딥러닝인 Relational Networks [2] 깊은바다 2017-06-11 2740
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용 깊은바다 2017-08-25 2582
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2569
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2503
딥러닝을 사용하여 의도 및 엔티티를 파악하는 챗봇 소스코드 file 깊은바다 2019-06-25 2329
개체명인식 with Naver 깊은바다 2018-11-20 2320
BERT로 토익 문제를 푸는 프로젝트 file 깊은바다 2019-04-30 2283
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2208
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2198
GPT2로 만든 텍스트 어드벤처 게임 깊은바다 2019-12-09 2010
딥러닝으로 욕설 탐지하기 깊은바다 2018-08-06 1881