레플리
글 수 295

MS의 딥러닝 대화 모델 - DialoGPT

조회 수 543 추천 수 0 2020.04.24 17:23:24


K-001.png

 

 

 

MS에서 발표한 딥러닝 대화 모델인 DialoGPT입니다. 이름 그대로 GPT2를 기본으로 하고, 이를 대화 도메인에 맞게 약간 변형하였습니다. 각 턴의 텍스트를 End Token으로 구분하고 이어붙여서 입력으로 사용합니다. 래딧의 댓글들을 크롤링하여 질문과 대답의 학습 데이터로 생성하였다고 합니다.

 

모델의 파라미터가 762M인데요. GPT2가 1500M, 구글 Meena가 2600M인 것에 비하면 조금 작습니다. 그래서인지 성능이 그리 뛰어나지는 않은 듯 합니다. 2턴 이상의 문맥은 어느정도 이어지지만, 대답이 짧은 편입니다. 또한 같은 말을 계속 반복하는 경향이 너무 심합니다. Meena가 빨리 공개되어서 한 번 테스트를 해봤으면 좋겠네요.

 

 

 

< 논문 >

-> https://arxiv.org/abs/1911.00536

 

< Colab 실행 코드 >

-> https://colab.research.google.com/drive/1D67YQ7_Rfu8DN2ciYdxfb3KNbRCgiyJh

 

List of Articles
제목 글쓴이 날짜 조회 수
ChatGPT 톺아보기 - 인공지능의 역사부터 신경망, 초거대AI, ChatGPT까지 file 깊은바다 2023-02-01 402
ChatGPT 한글 자동번역 크롬 확장프로그램 깊은바다 2023-01-17 1920
Koko 심리상담 서비스에서 GPT-3 대답 추천 기능을 도입 file 깊은바다 2023-01-11 388
ChatGPT보다 한글을 더 잘 대답하는 모델 - Claude file 깊은바다 2023-01-10 958
ChatGPT와 유사한 서비스 - Chatsonic file 깊은바다 2023-01-09 887
페이지링크와 ChatGPT 대화를 동시에 지원하는 검색엔진 - You.com 깊은바다 2022-12-27 289
ChatGPT에게 챗봇을 만들어보라고 해봤습니다 file 깊은바다 2022-12-26 483
ChatGPT는 새로운 검색엔진이 될까 file 깊은바다 2022-12-06 558
OpenAI의 대화전용 딥러닝 모델 - ChatGPT file 깊은바다 2022-12-02 1035
네이버의 초거대모델인 하이퍼클로바 가격 공개 깊은바다 2022-08-24 2000
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1302
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1253
러시아의 구글 얀덱스, 100B 초거대모델 무료 공개 깊은바다 2022-06-26 873
구글의 초거대모델 PaLM의 추론과 상식 능력 file 깊은바다 2022-05-20 888
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo file 깊은바다 2022-05-10 1634