레플리
글 수 219

Transformer 구조에 대해서 질문하나 드립니다.

조회 수 177 추천 수 0 2019.01.15 11:19:21


BERT 논문에서 말하기를

 

Transformer의 encoder 부분은 bidirectional이고

 

decoder 부분은 left-to-right의 unidirectional이라고 합니다.

 

이게 잘 이해가 안되서

 

혹시 왜 encoder가 bidirectional인지, decoder는 왜 left-to-right인지 지식 공유해주시면 감사하겠습니다!

엮인글 :

깊은바다

2019.01.16 02:15:39
*.207.106.177

인코더의 bidirectional은 lstm처럼 왼쪽, 오른쪽 두번 학습하는 건 아닙니다. 트랜스포머는 기본적으로 양쪽 레이어의 모든 노드들이 연결되어 있는데요. 그렇기 때문에 자연스럽게 bidirectional이 됩니다. 예를 들어, "나는 너를 사랑해" -> "나는 너를 사랑해"로 셀프 어텐션을 하게 되면 위쪽 레이어의 '너를'은 아래쪽 '나는/너를/사랑해'와 연결되어 있습니다. 그래서 문장 양쪽의 정보를 모두 참조합니다.

 

인코더는 입력에서 모두 문장을 한번에 입력 받습니다. 반면에 디코더는 한번에 한 단어만 출력되고 이를 계속 반복합니다. 이때 단어를 뽑아낼때 현재 위치 이전의 단어만 참조합니다. 예를 들어, 인코더 "나는 너를 사랑해" -> 디코더 "나도 너를 좋아해"를 보겠습니다. 디코더에서 '너를'을 출력할때 '나도'만 참고합니다. 인코더처럼 '나도/너를/좋아해'를 동시에 참고하지 않습니다. 사실 '너를/좋아해'는 아직 출력되지 않았기 때문에 당연합니다. 이를 위해 masked multiheader attention 기법을 사용합니다. 현재 단어에서 오른쪽 노드들을 마스킹하고 사용하지 않습니다. 그래서 left-to-right라 볼 수 있습니다.

 

아래 링크에서 자세한 내용을 참고하시기 바랍니다.

https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html

http://jalammar.github.io/illustrated-transformer/

 

List of Articles
제목 글쓴이 날짜 조회 수
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리 file 깊은바다 2024-01-17 354
서울시 AI 자동화 로봇 교육 인턴 교육생 모집 (알바말고 인턴어때? 인턴급여 총 717만원 지급, 교육여비 총 100만원 지급) newfile 싱킹가든 2024-04-19 5
안녕하세요 ^^ [1] kajun2 2024-04-13 48
[전액국지비원] [빅데이터/AI] [2024 채용연계형 SW 전문인재양성 무료 교육과정 교육생 모집] file 벡스 2024-04-11 34
서울시 AI 자동화 교육 인턴교육생 모집 (알바말고 인턴어때? 인턴급여 3개월 지급, 교육여비 100만원 지급) 싱킹가든 2024-04-09 70
가입인사 드립니다. [1] 리얼허브 2024-04-02 50
논문 이해의 필요성(질문) [1] 썸머ai 2024-01-08 199
메타버스+초거대AI 서비스 기획 공모전 file [1] 깊은바다 2023-08-16 175
음성 데이터셋 정보를 한 번에 탐색 할 수 있는 아카이브를 만들었습니다! (SODA) file ODA 2023-06-14 92
딥러닝 관련 질문 (CPU -> GPU 설정 변환후, keras-tuner 돌릴때 error 발생) J814 2023-06-14 110
(주)레플리에서 일상대화 AI에 도전하실 분을 찾습니다 깊은바다 2023-01-19 219
안녕하세요 처음으로 만들어본 챗봇 공유해봅니다. [1] KimYH 2023-01-18 266
카카오 Kogpt 파인튜닝. [3] 영화관람권익보장 2022-11-12 2500
[질문드립니다] 전이학습 개념 관련 [2] 테리웁스 2022-08-23 841
AI 개발자, 데이터과학자 모임 오픈 채팅방 링크 공유 Dfinite 2022-07-23 807