레플리
글 수 284

MS의 딥러닝 대화 모델 - DialoGPT

조회 수 457 추천 수 0 2020.04.24 17:23:24


K-001.png

 

 

 

MS에서 발표한 딥러닝 대화 모델인 DialoGPT입니다. 이름 그대로 GPT2를 기본으로 하고, 이를 대화 도메인에 맞게 약간 변형하였습니다. 각 턴의 텍스트를 End Token으로 구분하고 이어붙여서 입력으로 사용합니다. 래딧의 댓글들을 크롤링하여 질문과 대답의 학습 데이터로 생성하였다고 합니다.

 

모델의 파라미터가 762M인데요. GPT2가 1500M, 구글 Meena가 2600M인 것에 비하면 조금 작습니다. 그래서인지 성능이 그리 뛰어나지는 않은 듯 합니다. 2턴 이상의 문맥은 어느정도 이어지지만, 대답이 짧은 편입니다. 또한 같은 말을 계속 반복하는 경향이 너무 심합니다. Meena가 빨리 공개되어서 한 번 테스트를 해봤으면 좋겠네요.

 

 

 

< 논문 >

-> https://arxiv.org/abs/1911.00536

 

< Colab 실행 코드 >

-> https://colab.research.google.com/drive/1D67YQ7_Rfu8DN2ciYdxfb3KNbRCgiyJh

 

List of Articles
제목 글쓴이 날짜sort 조회 수
GPT3 유료화 가격 공개 file 깊은바다 2020-09-04 1749
GPT-3의 다섯 가지 한계 깊은바다 2020-08-23 1054
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2788
한국어로 대화하는 생성 모델의 학습을 위한 여정 - Transformer와 GPT2 깊은바다 2020-08-13 3566
KoGPT2, KoBERT, KoELECTRA로 만든 심리상담 챗봇 file 깊은바다 2020-08-05 6374
GPT3가 상식을 가지고 있을까 깊은바다 2020-07-24 742
GPT3 튜링 테스트 깊은바다 2020-07-23 669
네이버 뉴스 댓글로 사전훈련한 구어체 모델 - KcBERT 깊은바다 2020-07-20 815
GPT3로 하는 리액트 프로그래밍 file 깊은바다 2020-07-19 770
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2210
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2503
KoGPT2를 파인튜닝하여 만든 챗봇 깊은바다 2020-06-23 3534
주석을 프로그램으로 변환하는 GPT 모델 깊은바다 2020-06-21 481
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2198
GPT3 유료화 기능 소개 영상 깊은바다 2020-06-15 915