레플리
글 수 293

MS의 딥러닝 대화 모델 - DialoGPT

조회 수 588 추천 수 0 2020.04.24 17:23:24


K-001.png

 

 

 

MS에서 발표한 딥러닝 대화 모델인 DialoGPT입니다. 이름 그대로 GPT2를 기본으로 하고, 이를 대화 도메인에 맞게 약간 변형하였습니다. 각 턴의 텍스트를 End Token으로 구분하고 이어붙여서 입력으로 사용합니다. 래딧의 댓글들을 크롤링하여 질문과 대답의 학습 데이터로 생성하였다고 합니다.

 

모델의 파라미터가 762M인데요. GPT2가 1500M, 구글 Meena가 2600M인 것에 비하면 조금 작습니다. 그래서인지 성능이 그리 뛰어나지는 않은 듯 합니다. 2턴 이상의 문맥은 어느정도 이어지지만, 대답이 짧은 편입니다. 또한 같은 말을 계속 반복하는 경향이 너무 심합니다. Meena가 빨리 공개되어서 한 번 테스트를 해봤으면 좋겠네요.

 

 

 

< 논문 >

-> https://arxiv.org/abs/1911.00536

 

< Colab 실행 코드 >

-> https://colab.research.google.com/drive/1D67YQ7_Rfu8DN2ciYdxfb3KNbRCgiyJh

 

List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝을 이용한 자연어 처리 깊은바다 2018-08-01 562
아마존, End-to-End 딥러닝 기술을 고객서비스에 챗봇에 적용 깊은바다 2020-03-17 570
ChatGPT API 정식 공개 file 깊은바다 2023-03-02 570
텍스트 스타일을 바꾸는 딥러닝 기술 깊은바다 2021-06-01 572
GPT-2를 사용한 텍스트 압축 기법 file 깊은바다 2021-02-19 577
ChatGPT를 앱스토어 같은 플랫폼으로 확장 - ChatGPT 플러그인 file 깊은바다 2023-03-24 577
MS의 딥러닝 대화 모델 - DialoGPT file 깊은바다 2020-04-24 588
텐서플로에서 사전 훈련된 임베딩을 사용하는 예제 깊은바다 2019-02-02 591
딥러닝 상식추론 모델- COMET file 깊은바다 2020-05-04 593
딥러닝 학습으로 배우는 대화 인공지능 - 구글 듀플렉스 깊은바다 2018-05-09 596
Poe에 추가된 업스테이지의 LLM, Solar-70b file 깊은바다 2023-09-18 598
검색기반 거대모델인 딥마인드의 RETRO 깊은바다 2021-12-20 601
꼼꼼하고 이해하기 쉬운 ELECTRA 논문 리뷰 깊은바다 2020-05-15 607
GPT-4 세부구조에 대한 정보 유출 깊은바다 2023-07-20 620
딥러닝을 이용한 자연어처리 깊은바다 2018-05-17 622