레플리
글 수 282

MS의 딥러닝 대화 모델 - DialoGPT

조회 수 456 추천 수 0 2020.04.24 17:23:24


K-001.png

 

 

 

MS에서 발표한 딥러닝 대화 모델인 DialoGPT입니다. 이름 그대로 GPT2를 기본으로 하고, 이를 대화 도메인에 맞게 약간 변형하였습니다. 각 턴의 텍스트를 End Token으로 구분하고 이어붙여서 입력으로 사용합니다. 래딧의 댓글들을 크롤링하여 질문과 대답의 학습 데이터로 생성하였다고 합니다.

 

모델의 파라미터가 762M인데요. GPT2가 1500M, 구글 Meena가 2600M인 것에 비하면 조금 작습니다. 그래서인지 성능이 그리 뛰어나지는 않은 듯 합니다. 2턴 이상의 문맥은 어느정도 이어지지만, 대답이 짧은 편입니다. 또한 같은 말을 계속 반복하는 경향이 너무 심합니다. Meena가 빨리 공개되어서 한 번 테스트를 해봤으면 좋겠네요.

 

 

 

< 논문 >

-> https://arxiv.org/abs/1911.00536

 

< Colab 실행 코드 >

-> https://colab.research.google.com/drive/1D67YQ7_Rfu8DN2ciYdxfb3KNbRCgiyJh

 

List of Articles
제목 글쓴이 날짜sort 조회 수
콜센터 챗봇에 ChatGPT를 적용하는 방법 깊은바다 2023-02-20 327
와튼스쿨 에단 몰릭 교수의 Bing 사용 후기 깊은바다 2023-02-19 135
MS 직원의 GPT 기반 콜센터 챗봇 사용기 깊은바다 2023-02-18 158
구글의 초거대AI LaMDA, 과연 의식을 가지고 있을까 깊은바다 2023-02-17 107
ChatGPT와 대화 인공지능의 미래 깊은바다 2023-02-17 124
하이퍼클로바 기반의 심리상담 챗봇 개발 경험 깊은바다 2023-02-17 238
ChatGPT 프롬프트 엔지니어링 - 다양한 말투로 대답하기 file 깊은바다 2023-02-17 800
ChatGPT, 타임지 표지 장식 깊은바다 2023-02-17 254
ChatGPT의 3가지 핵심 특징 깊은바다 2023-02-16 166
ChatGPT가 Stack Overflow를 대체할까 깊은바다 2023-02-16 105
테드 창, ChatGPT는 엄청나게 효율이 높은 손실 압축임 깊은바다 2023-02-13 237
MS의 목적은 ChatGPT로 구글이 장악한 검색시장 자체를 무너뜨리는 것 깊은바다 2023-02-11 122
ChatGPT와 통합된 Bing 사용후기 영상 깊은바다 2023-02-10 166
MS, Bing과 Edge에 ChatGPT 통합 file 깊은바다 2023-02-08 154
구글, ChatGPT의 라이벌인 Bard 공개 file 깊은바다 2023-02-07 148