레플리
글 수 283


 

https://brunch.co.kr/@andkakao/98?fbclid=IwAR09zTD26ffD2QwypEIDT_U2eesxqPDZjby4wF7dWJD-RzighrdCwDNuXdw

 

 

 

카카오의 유사도 판별 엔진인 심슨에 대한 소개입니다. 카카오 고객 센터 챗봇에 도입되었다고 합니다. 사용자가 질문을 하면 먼저 카카오 i 오픈빌더에 정의된 의도를 찾아 해당 시나리오를 실행합니다. 만약 일치하는 의도가 없다면 FAQ에서 질문과 가장 유사한 답변들을 목록으로 보여줍니다. 이건 오픈빌더가 아니라 스킬 서버에서 처리하는데, 아마 여기에서 문장의 유사도를 판별하기 위해 사용된 알고리즘 같습니다.

 

기본적으로는 doc2vec이나 sent2vec 같이 문장을 벡터로 변환하여 각 벡터 사이의 거리를 구합니다. 동영상을 보니 단어마다 가중치를 달리 설정하는게 차이가 있는 듯 합니다.

 

이런 기능을 챗봇 빌더 자체에 포함시킬 수는 없을까요. 지금은 각 의도마다 가능한 문장들을 수십개씩 입력해야 합니다. 챗봇 제작자 입장에서는 가장 손이 많이 가고 귀찮은 일입니다. 몇 개 문장만 정의하고 자동으로 유사도를 파악하면 상당히 편해집니다. 다만 특정 영역이 아니라 모든 텍스트에 대해서 유사도 벡터를 만드는게 쉽지 않습니다. 상용화할 만큼 정확도를 높이는게 문제라고 생각합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
BERT 톺아보기 깊은바다 2018-12-17 26395
딥러닝을 사용한 챗봇 개발방법 정리 file 깊은바다 2018-02-03 25439
초거대모델의 파인튜닝 방법 - P-tuning과 LoRA file 깊은바다 2022-04-05 12062
글쓰기 보조 서비스 JasperAI, ChatGPT 때문에 어려움 직면 깊은바다 2023-03-01 9693
RAG(Retrieval-Augmented Generation) - LLM의 환각을 줄이는 방법 file 깊은바다 2023-07-04 9687
딥러닝 RNN으로 구현한 챗봇 깊은바다 2017-08-01 8135
문장을 학습하는 딥러닝 RNN의 Seq2Seq 모델 설명 file 깊은바다 2017-09-15 7327
챗봇에 딥러닝 학습을 적용하기 어려운 이유 file 깊은바다 2018-03-23 6641
KoGPT2, KoBERT, KoELECTRA로 만든 심리상담 챗봇 file 깊은바다 2020-08-05 6353
문장을 입력하면 비슷한 짤방을 보여주는 프로젝트 file 깊은바다 2019-01-28 6172
SKT가 공개한 한글 GPT2 - KoGPT2 깊은바다 2020-02-02 5296
챗봇에서 유사한 문장 자동인식 방법 file 깊은바다 2018-04-27 5151
네이버 영화리뷰 감정분석 with Hugging Face BERT file 깊은바다 2019-12-17 4667
사전학습을 통한 구글의 자연어처리 언어 모델 - BERT file 깊은바다 2018-11-03 4299
인라이플의 한글 BERT 대형모델 깊은바다 2020-05-18 4246