챗봇 딥러닝 - Jay Alammar의 트랜스포머 한글 번역글

글 수 293

Jay Alammar의 트랜스포머 한글 번역글

조회 수 1303 추천 수 0 2019.05.09 19:34:54

깊은바다 *.68.247.186 https://aidev.co.kr/7529

https://nlpinkorean.github.io/illustrated-transformer/

Jay Alammar의 트랜스포머 글이 한글로 번역이 되었습니다. 개인적으로는 'Attention is all you need' 논문보다는 이 글을 보고 이해가 되었습니다. BERT와 GPT2의 기본이 되는 트랜스포머에 관심있는 분들은 꼭 읽어보시길 추천드립니다. 간단하게 설명을 드리면 다음과 같습니다.

보통 LSTM 기반의 Seq2Seq는 어텐션을 사용하여 중요한 단어에 집중을 합니다. 인코더의 출력을 버리지 않고 모아 어텐션 레이어에 입력으로 넣습니다. 그리고 소프트맥스로 핵심이 되는 단어에 가중치를 주고, 그 정보를 디코더에 보내 같이 계산하여 출력 문장을 생성합니다.

반면에 트랜스포머는 LSTM 같은 순환신경망을 빼버리고 셀프 어텐션만 사용합니다. 인코더에서 어텐션 레이어를 거쳐 디코더로 정보를 전달하지 않습니다. 인코더 또는 디코더 내부에서만 어텐션을 수행합니다. 예를 들어, '나는 너를 사랑해'라는 문장이 입력으로 들어온다고 생각해보겠습니다.

인코더1 : 나는 너를 사랑해
인코더2 : 나는 너를 사랑해
인코더3 : 나는 너를 사랑해

위와 같이 각 인코더를 거치면서 이전 인코더와 각 입력 단어들을 서로 곱합니다. 소프트맥스로 중요한 단어들에 집중하면서 단어와 단어 사이의 연결 의미가 그 안에 새롭게 포함됩니다. 3단어일 경우 3x3=9번의 계산이 이루어집니다.

이런 과정을 거치면 처음 입력의 '사랑해'와 그 다음 인코더의 '사랑해'는 의미가 달라집니다. 인코더를 통과한 '사랑해'는 '사랑해(나는+너를+사랑해)'와 같이 '사랑해'와 나머지 단어들과의 관계가 통합되어 있습니다. 여기서 관련이 높은 단어에 가중치가 더 부여됩니다. 이렇게 인코더에서 핵심적인 의미만 남기고 디코더로 전달합니다. 그러면 긴 문장도 더 잘 기억을 하고 올바른 출력 문장을 생성할 수 있습니다.

좀 더 자세한 내용은 링크의 글을 참고하시기 바랍니다.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
딥러닝 자연어처리 강의 - Natural Language Processing with PyTorch	깊은바다	2019-07-06	858
딥러닝을 사용하여 의도 및 엔티티를 파악하는 챗봇 소스코드	깊은바다	2019-06-25	2529
가짜뉴스를 생성 또는 판별하는 딥러닝 모델 - Grover	깊은바다	2019-06-01	1139
GPT2를 Colab에서 테스트할 수 있는 코드	깊은바다	2019-05-21	1998
인간의 언어를 이해하는 기계, NLU	깊은바다	2019-05-17	1036
Jay Alammar의 트랜스포머 한글 번역글	깊은바다	2019-05-09	1303
BERT로 토익 문제를 푸는 프로젝트	깊은바다	2019-04-30	2536
워드 임베딩에 대한 아주 쉬운 설명 - The Illustrated Word2vec	깊은바다	2019-04-09	881
대화 인공지능 대회 - ConvAI	깊은바다	2019-03-25	809
문장의 유사성을 예측하고 평가하는 AI - 카카오 심슨	깊은바다	2019-03-20	1637
OpenAI Transformer GPT2로 만든 언어 모델	깊은바다	2019-02-17	3163
텐서플로에서 사전 훈련된 임베딩을 사용하는 예제	깊은바다	2019-02-02	656
목적지향 대화 학습 - Learning End-to-End Goal-Oriented Dialog	깊은바다	2019-02-02	1750
문장을 입력하면 비슷한 짤방을 보여주는 프로젝트	깊은바다	2019-01-28	6514
Word2Vec의 학습 방식	깊은바다	2019-01-17	1087

쓰기

첫 페이지 10 11 12 13 14 15 16 17 18 19 끝 페이지