레플리
글 수 220

end-to-end 챗봇 질문

조회 수 175 추천 수 0 2019.02.20 21:59:32


안녕하세요. 딥러닝을 이용한 대화 시스템에 대해서 공부하고 있는 대학원생입니다.

 

seq2seq 나, attention 모델을 사용해서 end-to-end 챗봇을 구현하고 싶은데, 크게 두 가지 사항에 대해서 여쭤보고 싶어 글을 올립니다.

 

1. log-likelihood 를 loss 로 두어 학습하면, 앞 문장에 대해 뒷 문장이 나오도록 학습하게 되어, 다양한 답변의 데이터를 갖추지 못한 경우에, 의미가 없거나 (trivial) 짧은 답변이 가장 적은 loss 값을 가져 최종 답변으로 출력되는 경우가 있습니다.

 

2. 대화 시스템에서 중요시 되는 특성 중 하나가 답변의 다양성인데, 현재 상태를 나타내는 context weight 에 대해서만 전환하기에는 학습에 무리가 있습니다. (대화 내용이 상황의 다양성을 전부 표현하지는 못하기 때문에)

 

1) trivial 하고 짧은 답변을 피하면서, 문법 구조를 파괴시키지 않는 방법 중에 가장 간단한 방법이 어떤 것이 있을 지 궁금합니다.

 

2) end-to-end 학습방식의 챗봇에서 다양한 상황에 따라 다양한 답변을 출력하기 위해선 어떤 방법들이 사용될 수 있나요. (입력 문장은 같지만 전후 맥락에 대한 다른 답변)

 

이에 대해 관련된 자료나 답변이 있으신 경우, 도움을 주시면 감사하겠습니다. 

태그
엮인글 :

깊은바다

2019.02.22 01:57:19
*.68.247.186

seq2seq beam search로 검색해보면 좋을 듯 합니다. k개 만큼 각각 다른 대답을 얻게 학습하는 방법입니다. 

 

https://medium.com/the-artificial-impostor/implementing-beam-search-part-1-4f53482daabe

 

https://arxiv.org/pdf/1606.02960.pdf

 

List of Articles
제목 글쓴이 날짜 조회 수
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리 file 깊은바다 2024-01-17 359
AI 개발자, 데이터과학자 모임 오픈 채팅방 링크 공유 Dfinite 2022-07-23 807
kaggle 사이트 관련 [1] gat 2022-06-21 1025
카카오톡 오픈채팅방 문의 [1] 외계공룡 2022-06-19 884
챗봇 빌더와 챗봇 모델을 사용하여 직접 개발하는 방법의 차이점은 무엇인가요? [1] 에이아이 2022-06-17 889
해당 기술에 대해 궁금합니다. 아까그분 2022-06-14 448
안녕하세요. 잘부탁드려요~!!! [1] jungjunn 2022-03-31 1568
메타, 메타버스 개발용 AI '빌더 봇' 선봬 깊은바다 2022-02-26 806
Yolov5 디바이스 사양 추천 부탁드립니다. rhee 2022-02-14 789
일상대화 챗봇 기반 메타버스 플랫폼을 만드실 백엔드 개발자 모집 깊은바다 2022-01-12 456
word2vec 질문입니다. [1] 노력하는돌 2021-09-13 1152
안녕하세요. 제가 속해있는 회사에서 딥러닝 엔지니어를 채용합니다. 깊은바다 2021-08-02 1048
딥러닝에 대한 질문드려용 [1] 병쥐 2021-05-17 222
GPT-3를 사용한 AI Dungeon, 문장 필터링에 문제 발생 깊은바다 2021-05-07 294
최근에 KoGpt2 모델 써보신분 있으신가요? [2] 안녕하세영 2021-04-15 617
기존 RNN, Transformer 보다 강력한 시계열 망 입니다. 가을전설 2021-04-08 260