레플리
글 수 284


 

 

https://blog.pingpong.us/ranker-model/

 

 

 

스캐터랩의 일상대화 챗봇인 핑퐁은 여러 방식의 알고리즘을 사용합니다. 첫째는 리액션입니다. 질문을 카테고리로 분류하여 적당하게 맞장구를 합니다. 둘째는 유사도 비교입니다. 일반 챗봇이 주로 쓰는 기법으로 질문과 가장 비슷한 Q문장을 찾아 그 A문장을 출력합니다. 셋째는 답변매칭입니다. 유사도 비교는 QA문장을 작성하지만 여기서는 A문장만 입력합니다. 그리고 이전 질문과 이어지는 가장 적합한 A문장을 선택하여 대답합니다.

 

이 글은 답변매칭을 어떻게 구현했는지를 아주 자세하게 설명하고 있습니다. 제 기억에 초기 버전은 BERT의 Next sentence prediction을 사용해서 한 턴만 비교할 수 있었습니다. 지금은 여러 턴의 문맥을 처리하도록 새로운 모델을 도입했습니다. 그 밖에 유용한 기법들이 많으니 시간을 내어 읽어보시길 추천드립니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
스캐터랩의 오픈도메인 챗봇 루다 육아일기 - 모델의 구조 및 동작방식 file 깊은바다 2020-12-30 1191
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1191
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1180
딥러닝 기반 자연어 언어모델 BERT - Colab 실습 코드 포함 file 깊은바다 2019-09-02 1179
쉽게 씌어진 Word2Vec [2] 깊은바다 2017-12-25 1178
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1178
커뮤니케이션과 AI - Multi-channel CNN을 이용한 한국어 감성분석 깊은바다 2018-11-22 1156
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델 file 깊은바다 2020-05-30 1156
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1156
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1155
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1144
다이나믹 메모리 네트워크 정리 file 깊은바다 2018-09-29 1135
딥러닝을 이용한 자연어 처리 입문 - 위키독스 깊은바다 2018-09-21 1108
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 file [1] 깊은바다 2020-04-19 1093
딥러닝으로 욕설 탐지하기 file [2] 깊은바다 2018-05-04 1073