챗봇 딥러닝 - 딥러닝과 자연어처리의 집중 메커니즘

글 수 282

딥러닝과 자연어처리의 집중 메커니즘

조회 수 1019 추천 수 0 2018.09.08 15:21:58

깊은바다 *.68.247.188 http://aidev.co.kr/5848

http://wizardsnote.tumblr.com/post/136672232610/%EB%94%A5%EB%9F%AC%EB%8B%9D%EA%B3%BC-%EC%9E%90%EC%97%B0%EC%96%B4%EC%B2%98%EB%A6%AC%EC%9D%98-%EC%A7%91%EC%A4%91-%EB%A9%94%EC%BB%A4%EB%8B%88%EC%A6%98

신경망 번역이나 챗봇에서도 자주 쓰이는 딥러닝의 Seq2Seq는 RNN으로 구성된 인코더와 디코더로 이루어져 있습니다. 문장이 입력으로 들어오면 새로운 문장이 바로 출력으로 나오는 구조입니다.

인코더의 출력 벡터가 입력 문장의 전체 정보를 가지고 있고 이것이 디코더의 입력으로 들어갑니다. 하지만 벡터값 하나에 모든 정보를 담고 있다 보니 문장이 길어질수록 정확도가 떨어지는 문제가 있습니다. 이런 단점을 보완하기 위해 어텐션(attention)이란 기법을 사용하는데 여기에 대해 아주 쉽게 설명한 글입니다.

간단히 설명하면 인코더에서 각 단어마다 반복되는(RNN의 특성인) 히든스테이트의 출력을 모아서 새로운 어텐션 신경망을 만들고 이것을 디코더의 출력 순서에 맞게 입력으로 같이 사용합니다. 그래서 디코더의 각 단계마다 입력 문장의 어느 부분에 더 집중을 할지 알 수 있습니다. 좀 더 자세한 사항은 아래 링크를 참조하시기 바랍니다.

< Attention Mechanism 시각화 >
- http://docs.likejazz.com/attention/

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
Llama 2의 RLHF 구현 방법	깊은바다	2023-07-19	723
GPT3가 상식을 가지고 있을까	깊은바다	2020-07-24	741
LLM이 서로 협력하여 프로그램을 개발 - ChatDev	깊은바다	2023-08-16	751
HyperCLOVA로 만드는 캐릭터 챗봇	깊은바다	2021-11-26	761
GPT3로 하는 리액트 프로그래밍	깊은바다	2020-07-19	769
ChatGPT와 유사한 서비스 - Chatsonic	깊은바다	2023-01-09	794
GPT-3 패러다임을 바꿀 미친 성능의 인공지능 등장 및 활용 사례 10가지	깊은바다	2020-09-14	799
ChatGPT 프롬프트 엔지니어링 - 다양한 말투로 대답하기	깊은바다	2023-02-17	799
러시아의 구글 얀덱스, 100B 초거대모델 무료 공개	깊은바다	2022-06-26	806
네이버 뉴스 댓글로 사전훈련한 구어체 모델 - KcBERT	깊은바다	2020-07-20	813
DALL-E를 능가하는 OpenAI의 GLIDE	깊은바다	2021-12-27	836
구글의 초거대모델 PaLM의 추론과 상식 능력	깊은바다	2022-05-20	838
ChatGPT보다 한글을 더 잘 대답하는 모델 - Claude	깊은바다	2023-01-10	848
인간의 언어를 이해하는 기계, NLU	깊은바다	2019-05-17	850
잡담봇 삽질기 - 문봇에서 딥러닝 Seq2Seq로 문장 생성	깊은바다	2018-03-25	857

쓰기

첫 페이지 5 6 7 8 9 10 11 12 13 14 끝 페이지