챗봇 딥러닝 - 구글의 일상대화 딥러닝 모델

글 수 293

구글의 일상대화 딥러닝 모델 - Meena

조회 수 2048 추천 수 0 2020.01.30 02:20:02

깊은바다 *.68.247.186 https://aidev.co.kr/8881

Reformer가 나온지 얼마 되지도 않았는데, 구글이 또 엄청난 모델을 공개했습니다. Meena란 이름의 일상대화 딥러닝 모델로 Evolved Transformer를 사용했습니다. AutoML 처럼 자동으로 트랜스포머의 구조를 결정하는 방식입니다. 사진과 같이 인코더 블록 1개와 디코더 블록 13개로 되어 있습니다. End-to-End로 문장을 생성할때는 디코더가 더 중요한 역할을 한다고 합니다.

우선 모델 파라미터가 2.6B으로 GPT2의 1.5B보다 1.7배 더 커졌습니다. 학습 데이터도 361GB로 GPT2의 40GB보다 8배 이상 많습니다. 7개의 문장의 멀티턴 대화 질문과 그다음 답변으로 구성된 페어 8억개 정도로 훈련을 했습니다. TPU-v3 2048개 코어로 30일 동안 돌렸는데요. 구글 클라우드 가격으로 대충 계산해보니 13억이 듭니다. XLNet이 TPU-v3 512개 코어 x 3일 = 6천만원이란걸 비교해보면 무지막지한 모델입니다.

위의 대화 예시를 보면 문맥을 고려하여 상당히 자연스럽게 대답을 하고 있습니다. 또한 단순히 맞장구 치는 것을 넘어서, 영화란 콘텐츠에 맞게 구체적인 내용을 알려줍니다.

사람 : 오스카 후보로 오른 영화가 어떨까. 하나 추천해줄래?

Meena : 최근 오스카 수상작들은 잘 모르는데. 하지만 그랜드 부다페스트 호텔이란 영화를 보고 싶었어.

사람 : 아, 그 영화에 대해서 더 말해줘봐.

Meena : 문라이즈 킹덤과 같은 감독과 작가야. 웨스 앤더슨은 재미있고 컬러풀한 영화로 매우 유명해. 매우 좋은 작품이라고 들었어.

이런 생성 모델은 평가 기준이 상당히 애매한 편입니다. 이를 위해 SSA(Sensibleness and Specificity Average)라는 새로운 방법을 제시합니다. 모델의 대화 결과를 사람이 직접 평가를 합니다. Sensibleness는 말이 이어지는지 판단합니다. 여기에 Specificity라는 항목을 같이 고려합니다. '잘모르겠는데', '그래서?', '맞아' 같이 두리뭉실한 대답보다 좀 더 구체적인 문장에 더 높은 점수를 부여합니다.

Mitsuku, Cleverbot, DialGPT, XiaoIce 같은 다른 챗봇보다 Meena의 SSA가 월등히 뛰어납니다. 또한 자동화된 평가방법으로 가장 유명한 Perplexity와도 비교를 했습니다. 그래프를 보면 사람이 측정한 SSA와 수식으로 계산한 Perplexity의 상관관계가 높음을 알 수 있습니다. 이후 대화 시스템을 평가할때 좋은 기준이 될 것 같습니다.

그동안 챗봇은 거의 룰베이스 유사도와 통계 방식을 기반으로 했습니다. 의도를 먼저 분류하고 거기에 맞는 템플릿 문장을 출력합니다. Seq2Seq로 대답 문장을 직접 생성하기도 하지만 아직까지는 거의 사용되지 않습니다. Meela의 성능을 보니 이제 대화 서비스도 End-to-End로 바뀔 날이 얼마 남지 않은 듯 합니다. 다만 데이터가 적을 경우 딥러닝으로 학습이 힘들다는 문제가 있습니다. 이것도 전이학습 같은 방법을 적용하면 충분히 극복할 수 있다고 생각합니다. 당장은 어렵겠지만 앞으로 3~5년이면 큰 변화가 오지 않을까요.

< 구글 블로그 >

-> https://ai.googleblog.com/2020/01/towards-conversational-agent-that-can.html

< 논문 >

-> https://arxiv.org/abs/2001.09977

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
Meme 자동 생성기	깊은바다	2020-05-11	1174
딥러닝 상식추론 모델- COMET	깊은바다	2020-05-04	655
페이스북의 일상대화 딥러닝 모델 - BlenderBot	깊은바다	2020-05-01	1237
MS의 딥러닝 대화 모델 - DialoGPT	깊은바다	2020-04-24	650
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 [1]	깊은바다	2020-04-19	1253
장문의 대답을 평가하는 자연어처리 벤치마크 - TuringAdvice	깊은바다	2020-04-17	387
아마존, End-to-End 딥러닝 기술을 고객서비스에 챗봇에 적용	깊은바다	2020-03-17	639
딥러닝 질의응답 시스템인 cdQA-suite	깊은바다	2020-03-08	1303
LG 사이언스파크에서 만든 한글 MRC(기계독해) 데모 [2]	깊은바다	2020-03-07	1126
페르소나에 따라 대화를 하는 딥러닝 챗봇 by Hugging Face	깊은바다	2020-03-06	1232
SKT가 공개한 한글 GPT2 - KoGPT2	깊은바다	2020-02-02	5557
구글의 일상대화 딥러닝 모델 - Meena	깊은바다	2020-01-30	2048
핑퐁의 리액션 모델 - Dialog-BERT 만들기	깊은바다	2020-01-28	1562
책 한권을 입력으로 받는 구글의 딥러닝 모델 - Reformer	깊은바다	2020-01-17	778
GPT2 텍스트 어드벤처 게임, AI Dungeon 앱 출시	깊은바다	2019-12-23	571

쓰기

첫 페이지 8 9 10 11 12 13 14 15 16 17 끝 페이지