챗봇 딥러닝 - 문장을 학습하는 딥러닝 RNN의 Seq2Seq 모델 설명

글 수 283

조회 수 7327 추천 수 0 2017.09.15 04:24:29

깊은바다 *.68.247.188 http://aidev.co.kr/2273

Seq2Seq는 RNN을 사용해서 문장을 학습할 수 있는 모델입니다. 여러가지 문서를 찾아봤는데 위의 링크가 그중에서 가장 잘 설명하고 있는 것 같습니다.

Seq2Seq는 2개의 RNN 셀로 구성됩니다. 위 그림에서 ABC를 입력으로 받는 것이 인코더 RNN 셀이고 오른쪽의 <go>WXYZ를 입력으로 받는 것이 디코더 RNN 셀입니다.

그림에서는 모두 8개의 셀이 있지만 실제로는 2개의 인코더와 디코더 셀만 존재합니다. RNN은 자신의 출력도 입력으로 받기 때문에 위 그림은 순차적인 입력을 풀어서 표현한 것입니다.

ABC라고 입력하면 WXYZ라고 대답하도록 훈련하고 싶다면 인코더에 ABC를 순서대로 집어넣습니다. 그리고 <go>WXYZ를 디코더에 순차적으로 입력하고 각각 출력이 WXYZ<eos>가 되도록 학습합니다.

정리하자면 ABC<go>WXYZ -> ___WXYZ<eos>으로 훈련을 시킨다고 보시면 됩니다. 여기서 <go>는 문장의 시작을, <eos>는 문장의 끝을 나타냅니다. 그리고 각 단어는 Word2Vec 같은 방법을 사용해서 벡터로 표현합니다.

이렇게 트레이닝이 된 모델을 사용해서 문장을 예측할 수 있습니다. ABC라고 인코더에 순차적으로 입력하고 디코더에 <go>를 넣은후 그 출력인 W를 다음번 입력으로 합니다.

이렇게 반복해서 디코더에 넣다가 <eos>가 나오면 종료합니다. 디코더의 출력을 합치면 WXYZ<eos>의 답변문장을 구할 수 있습니다.

보다 자세한 사항은 아래의 챗봇 구현 코드를 참고하시기 바랍니다.

딥러닝 RNN으로 구현한 챗봇

< 챗봇 개발자 모임 >

- 페이스북 그룹에 가입하시면 챗봇에 대한 최신 정보를 쉽게 받으실 수 있습니다.

List of Articles

제목	글쓴이	날짜	조회 수
DALL-E를 능가하는 OpenAI의 GLIDE	깊은바다	2021-12-27	838
GPT-3를 강화학습으로 업그레이드한 InstructGPT	깊은바다	2022-01-30	2566
프로그램을 작성하는 딥마인드의 알파코드	깊은바다	2022-02-04	1005
구글의 대화기반 초거대모델 LaMDA, 논문 공개	깊은바다	2022-02-08	1361
네이버의 초거대모델인 하이퍼클로바 사용 후기	깊은바다	2022-02-14	3170
하이퍼클로바 활용예 및 사용가이드	깊은바다	2022-03-05	3570
교육용 챗봇의 미래!? 구글 람다 (LaMDA)	깊은바다	2022-03-11	1362
초거대모델의 파인튜닝 방법 - P-tuning과 LoRA	깊은바다	2022-04-05	12110
GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM	깊은바다	2022-04-07	1408
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개	깊은바다	2022-05-04	1191
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo	깊은바다	2022-05-10	1429
구글의 초거대모델 PaLM의 추론과 상식 능력	깊은바다	2022-05-20	838
러시아의 구글 얀덱스, 100B 초거대모델 무료 공개	깊은바다	2022-06-26	806
최신 자연어처리 모델 소개	깊은바다	2022-07-11	1180
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3	깊은바다	2022-08-06	1154

쓰기

첫 페이지 7 8 9 10 11 12 13 14 15 16 끝 페이지