챗봇 딥러닝 - 핑퐁의 리액션 모델

글 수 282

핑퐁의 리액션 모델 - Dialog-BERT 만들기

조회 수 1381 추천 수 0 2020.01.28 01:50:48

깊은바다 *.68.247.186 http://aidev.co.kr/8878

일상대화 챗봇인 핑퐁에 사용된 Dialog-BERT에 대한 글입니다. 작년 7월에 처음 연재되었는데, 최근에 4편으로 완결되었습니다. 핑퐁은 '연애의 과학'이란 앱에서 수집한 카톡 데이터로 학습을 하였습니다. 이를 전처리하고, 토큰으로 분리하고, BERT로 사전훈련하고, 최종적으로 파인튜닝하는 과정들을 자세히 보여주고 있습니다.

리액션 모델은 핑퐁의 핵심적인 알고리즘입니다. 먼저 어떤 입력이라도 대략 1000개 정도의 클래스로 분류합니다. 그다음 거기에 맞는 답변 템플릿 중 하나를 랜덤하게 선택합니다. 과거에는 한 턴만 가능했지만, 지금은 Dialog-BERT를 통해 2~3턴까지 고려하고 있습니다.

무엇보다 핑퐁은 카카오톡에서 수집한 방대한 데이터가 강점입니다. 뿐만 아니라 머신러닝과 딥러닝으로 학습하는 기술력 역시 독보적입니다. 오랫동안 쌓아온 노하우를 공개해주신 분들에게 감사드립니다. 일상대화 챗봇에 관심있는 분들은 꼭 읽어보시길 추천드립니다.

1. 카톡 데이터는 어떻게 정제할 수 있을까?
-> https://blog.pingpong.us/dialog-bert-1/

2. 누가누가 잘하나! 대화체와 합이 잘 맞는 Tokenizer를 찾아보자!
-> https://blog.pingpong.us/tokenizer/

3. 카톡 대화 데이터를 BERT로 잘 학습시킬 수 있을까?
-> https://blog.pingpong.us/dialog-bert-pretrain/

4. 대화의 Context를 반영한 답변을 생성할 수 있을까?
-> https://blog.pingpong.us/ml-dialog-bert-multiturn

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
클로바X의 사용량 제한 - QPM과 TPM	깊은바다	2024-04-01	84
Pi를 만든 Inflection AI, MS로 대거 이직한 이유	깊은바다	2024-03-25	104
LLaMA나 Mistral이 계속 무료로 유지될 수 있을까	깊은바다	2024-03-05	227
GPT-3.5와 클로바X 가격 비교	깊은바다	2024-02-25	263
OpenAI, 성능은 높아지고 가격은 싸진 새로운 모델 공개	깊은바다	2024-01-26	319
AI 휴대용 기기 R1을 만든 Rabbit의 대표 Jesse Lyu	깊은바다	2024-01-12	246
화면을 보고 스마트폰 앱 사용방법을 배우는 모델 - AppAgent	깊은바다	2024-01-08	298
LLM의 새로운 기법 - Merge와 DPO	깊은바다	2024-01-02	1121
업스테이지 SOLAR 10.7B에서 사용한 DUS 모델 확장 방법	깊은바다	2023-12-27	444
죽은 아들의 AI 아바타를 만든 중국의 부모	깊은바다	2023-12-21	178
Private sLLM - 어떻게 만들고 어떻게 배포할까?	깊은바다	2023-12-18	349
GPT-4가 내 여자친구보다 나를 더 잘 알까?	깊은바다	2023-12-12	166
FSM과 생성 에이전트의 차이점	깊은바다	2023-11-22	179
RAG를 사용한 페르소나 챗봇 - ChatHaruhi	깊은바다	2023-10-17	688
LLM Multi Agent: Customer Service를 기깔나게 자동화하는 방법 [1]	깊은바다	2023-10-09	630

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지