레플리
글 수 281

MS의 딥러닝 대화 모델 - DialoGPT

조회 수 453 추천 수 0 2020.04.24 17:23:24


K-001.png

 

 

 

MS에서 발표한 딥러닝 대화 모델인 DialoGPT입니다. 이름 그대로 GPT2를 기본으로 하고, 이를 대화 도메인에 맞게 약간 변형하였습니다. 각 턴의 텍스트를 End Token으로 구분하고 이어붙여서 입력으로 사용합니다. 래딧의 댓글들을 크롤링하여 질문과 대답의 학습 데이터로 생성하였다고 합니다.

 

모델의 파라미터가 762M인데요. GPT2가 1500M, 구글 Meena가 2600M인 것에 비하면 조금 작습니다. 그래서인지 성능이 그리 뛰어나지는 않은 듯 합니다. 2턴 이상의 문맥은 어느정도 이어지지만, 대답이 짧은 편입니다. 또한 같은 말을 계속 반복하는 경향이 너무 심합니다. Meena가 빨리 공개되어서 한 번 테스트를 해봤으면 좋겠네요.

 

 

 

< 논문 >

-> https://arxiv.org/abs/1911.00536

 

< Colab 실행 코드 >

-> https://colab.research.google.com/drive/1D67YQ7_Rfu8DN2ciYdxfb3KNbRCgiyJh

 

List of Articles
제목 글쓴이 날짜 조회 수
GPT-4의 특징 정리 file 깊은바다 2023-03-15 1368
7B의 Alpaca가 175B의 GPT-3.5와 동급의 성능을 보임 file 깊은바다 2023-03-14 958
Together가 공개한 오픈소스 LLM - OpenChatKit 깊은바다 2023-03-12 419
ChatGPT 영어회화 깊은바다 2023-03-09 217
노암 촘스키의 ChatGPT 기고문 깊은바다 2023-03-09 316
GenAI 컨퍼런스 대담 요약 - 어떻게 AI가 비즈니스를 재편할 것인가 깊은바다 2023-03-08 318
ChatGPT로 폴 그레이엄 에세이 검색해서 대답 file 깊은바다 2023-03-03 249
ChatGPT API 정식 공개 file 깊은바다 2023-03-02 449
글쓰기 보조 서비스 JasperAI, ChatGPT 때문에 어려움 직면 깊은바다 2023-03-01 9692
네이버 케어콜의 장기기억 기능 - 맞춤 케어를 위한 기억하기 챗봇 file 깊은바다 2023-03-01 293
OpenAI의 샘 알트만, AGI를 향한 계획 깊은바다 2023-02-25 209
인공지능과 친구가 될 수 있을까요 - 이루다의 페르소나 구축 방법 file 깊은바다 2023-02-21 335
ChatGPT의 가장 큰 특징인 in-context learning file 깊은바다 2023-02-21 1334
OpenAI가 ChatGPT를 개발할 수 있었던 이유 깊은바다 2023-02-20 175
콜센터 챗봇에 ChatGPT를 적용하는 방법 깊은바다 2023-02-20 321