챗봇 딥러닝 - 그림으로 아주 쉽게 설명한, The Illustrated GPT-2

글 수 283

그림으로 아주 쉽게 설명한, The Illustrated GPT-2

조회 수 2783 추천 수 0 2020.08.15 16:51:07

깊은바다 *.68.248.98 http://aidev.co.kr/9538

시각화의 장인 Jay Alammar가 설명하는 GPT2입니다. 정말 쉽게, 그리고 매우 자세히 모델의 동작방식을 보여주고 있습니다. GPT2는 BERT와 마찬가지로 트랜스포머가 기반입니다. 다만 BERT는 트랜스포머의 인코더만 사용하는데 반해, GPT2는 디코만으로 구성됩니다. 예측한 토큰이 다시 입력으로 들어가며 반복해서 토큰을 생성하기 때문입니다. 이를 자동회귀(auto regression)라 부릅니다.

뒷부분에는 트랜스포머의 핵심인 셀프 어텐션(self-attention)을 다루고 있습니다. 이전 글(https://nlpinkorean.github.io/illustrated-transformer/)에서 빠져 있던 Masked self-attention이 추가되었습니다. BERT는 모든 입력 시퀀스 전체에 대해 셀프 어텐션을 수행합니다. 하지만 GPT2에서 같은 방법을 적용하면 문제가 발생합니다. 미리 앞에 나올 토큰을 볼 수 있어 답을 알고 맞추게 됩니다. 그래서 현재까지 예측한 토큰까지만 마스킹을 하여 셀프 어텐션을 합니다.

요즘 GPT3에 관심있는 분들이 많으실 텐데요. 거의 같은 구조이니 이 글을 참조하시기 바랍니다.

< The Illustrated GPT-2 >
- http://jalammar.github.io/illustrated-gpt2/

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
BERT를 이용한 챗봇 구현	깊은바다	2019-01-07	4113
GPT-3 데모 사이트 - gpt3demo.com	깊은바다	2021-07-13	3707
한국어 자연어처리를 위한 딥러닝	깊은바다	2018-02-14	3652
하이퍼클로바 활용예 및 사용가이드	깊은바다	2022-03-05	3570
한국어로 대화하는 생성 모델의 학습을 위한 여정 - Transformer와 GPT2	깊은바다	2020-08-13	3565
KoGPT2를 파인튜닝하여 만든 챗봇	깊은바다	2020-06-23	3522
구글의 딥러닝 대화 알고리즘	깊은바다	2016-03-25	3356
여러 한국어 GPT 모델들 [1]	봄눈	2021-11-21	3337
네이버 영화 리뷰 감정 분석	깊은바다	2018-09-07	3292
욕설을 찾는 BERT 모델 - Purifier	깊은바다	2019-08-28	3269
딥러닝으로 챗봇 만들기	깊은바다	2017-05-03	3173
네이버의 초거대모델인 하이퍼클로바 사용 후기	깊은바다	2022-02-14	3170
6B 파라미터의 GPT-J_6B 오픈소스 모델	깊은바다	2021-07-01	3138
케라스로 만든 한글 Seq2Seq 챗봇 소스코드	깊은바다	2019-07-13	3091
구글의 Transformer 신경망 모델 [2]	깊은바다	2018-10-13	3022

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지