게시판 - Transformer 구조에 대해서 질문하나 드립니다.

AI Dev - 인공지능 개발자 모임
게시판

글 수 222

Transformer 구조에 대해서 질문하나 드립니다.

조회 수 177 추천 수 0 2019.01.15 11:19:21

김만수 *.180.117.185 http://aidev.co.kr/6796

BERT 논문에서 말하기를

Transformer의 encoder 부분은 bidirectional이고

decoder 부분은 left-to-right의 unidirectional이라고 합니다.

이게 잘 이해가 안되서

혹시 왜 encoder가 bidirectional인지, decoder는 왜 left-to-right인지 지식 공유해주시면 감사하겠습니다!

이 게시물을

엮인글 :

2019.01.16 02:15:39
*.207.106.177

인코더의 bidirectional은 lstm처럼 왼쪽, 오른쪽 두번 학습하는 건 아닙니다. 트랜스포머는 기본적으로 양쪽 레이어의 모든 노드들이 연결되어 있는데요. 그렇기 때문에 자연스럽게 bidirectional이 됩니다. 예를 들어, "나는 너를 사랑해" -> "나는 너를 사랑해"로 셀프 어텐션을 하게 되면 위쪽 레이어의 '너를'은 아래쪽 '나는/너를/사랑해'와 연결되어 있습니다. 그래서 문장 양쪽의 정보를 모두 참조합니다.

인코더는 입력에서 모두 문장을 한번에 입력 받습니다. 반면에 디코더는 한번에 한 단어만 출력되고 이를 계속 반복합니다. 이때 단어를 뽑아낼때 현재 위치 이전의 단어만 참조합니다. 예를 들어, 인코더 "나는 너를 사랑해" -> 디코더 "나도 너를 좋아해"를 보겠습니다. 디코더에서 '너를'을 출력할때 '나도'만 참고합니다. 인코더처럼 '나도/너를/좋아해'를 동시에 참고하지 않습니다. 사실 '너를/좋아해'는 아직 출력되지 않았기 때문에 당연합니다. 이를 위해 masked multiheader attention 기법을 사용합니다. 현재 단어에서 오른쪽 노드들을 마스킹하고 사용하지 않습니다. 그래서 left-to-right라 볼 수 있습니다.

아래 링크에서 자세한 내용을 참고하시기 바랍니다.

https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html

http://jalammar.github.io/illustrated-transformer/

List of Articles

제목	글쓴이	날짜	조회 수
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리	깊은바다	2024-01-17	374
장고와 카카오 i 오픈 빌더 사용법 질문 ㅠㅠ [1]	애뚱이	2020-09-19	321
챗봇회사인 플런티가 삼성전자에 인수되었습니다 [2]	깊은바다	2017-11-30	313
Text Summarization에 관련한 질문 [2]	Nike	2021-01-28	298
Seq2Seq에 Attention 구현 성공했습니다! [2]	NeuroWhAI	2018-12-04	297
GPT-3를 사용한 AI Dungeon, 문장 필터링에 문제 발생	깊은바다	2021-05-07	294
방향을 잡지못해 질문 드립니다. [3]	몽이삼촌	2019-07-10	286
인공지능 개발자 분들의 따끔한 조언 부탁드립니다. [1]	ai꿈나무	2019-07-09	285
AI가 그린 그림 900만원에 팔려..예술 넘보는 인공지능 [1]	깊은바다	2016-04-08	280
말 만들어주는 인공지능 만들었어요! [1]	mail	2020-09-08	279
안녕하세요 그나마 이사이트 국내에서는 제일 좋은듯 합니다. [1]	맛동산	2018-11-13	277
카테고리 자동분류 [1]	와니와니	2018-10-24	276
안녕하세요 처음으로 만들어본 챗봇 공유해봅니다. [1]	KimYH	2023-01-18	271
혹시 여기 전부 대학생들만 있으시나요? [5]	맛동산	2018-02-27	271
인공지능개발자를 꿈꾸고있습니다 [6]	AIdogfoot	2018-03-18	269
웨스트월드라는 미드 재미있네요	깊은바다	2017-03-23	264

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지

Transformer 구조에 대해서 질문하나 드립니다.

깊은바다