레플리
글 수 203


K-001.png

 

https://arxiv.org/pdf/1906.05909.pdf

 

 

 

구글이 또 흥미로운 논문을 발표했습니다. 요즘 보면 딥러닝 연구는 구글이 다 하는 것 같네요^^; 보통 이미지 인식은 CNN을 주로 사용합니다. 그러다 최근 어텐션을 추가하여 성능을 높이는 방법이 제안되었는데, 이번에 아예 어텐션만으로 구성된 모델이 나왔습니다.

 

사실 어텐션은 자연어처리인 Seq2Seq에서 처음 적용되었습니다. 인코더의 단어에서 중요한 부분에 집중(attention)하여 디코더로 전달하고, 이를 같이 계산하여 출력 단어를 생성합니다. 그후 셀프 어텐션(인코더에서 디코더가 아니라 인코더 또는 디코더 자체적으로 어텐션 수행)만으로 이루어진 트랜스포머가 등장했습니다. 그리고 얼마 지나지 않아 BERT, GPT2 등이 트랜스포머를 채택하면서 자연어처리 분야를 휩쓸고 있는 중입니다.

 

 

 

스크린샷을 보면 셀프 어텐션의 과정을 이해하실 수 있습니다. 먼저 한 점을 Query로, 그 주변 k 범위 만큼을 Key와 Value로 변환합니다. 그리고 Query와 Key를 곱하고, 다시 Value와 소프트맥스로 계산합니다. 간단히 설명하면 현재 점에서 그 주변의 점들 사이에 중요한 부분에 가중치를 주어 새로운 점이 만들어집니다.

 

트랜스포머는 모든 입력 단어끼리 모두 Q와 K를 곱하지만, 여기서는 일정 주변만 계산한다는 차이가 있습니다. 사실 이건 컨볼루션이 필터의 영역만큼 이동하며 특징을 뽑아내는 것과 유사합니다. 다만 차이점은 단순히 필터를 거친 특징이 아니라, 일정한 이미지 영역에서 중요한 부분에 집중한다는 것입니다. 컨볼루션 부분을 셀프 어텐션으로 바꾼 것을 빼고는, 풀링과 완전연결층은 동일합니다. 실험 결과를 보면 모두 어텐션을 적용한 것 보다는 컨볼루션과 어텐션을 조합했을 때 더 정확도가 높다고 합니다.

 

 

 

사람도 물체를 판별할 때 전체를 다 고려하지는 않습니다. 예를 들어, 얼굴을 인식할 때 다른 사람과 다른 몇몇 특징에 더 주안점을 둡니다. 그런 면에서 어텐션이 뇌의 동작 방식에 더 가까울 지도 모르겠습니다. 앞으로 어텐션이 자연어처리 뿐만 아니라 이미지 인식에서도 핵심적인 기법으로 떠오를 듯 합니다.

 

List of Articles
제목 글쓴이 날짜 조회 수
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 865
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1317
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐 깊은바다 2021-07-14 913
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래 깊은바다 2021-07-08 875
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색 깊은바다 2021-07-05 1090
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS 깊은바다 2021-06-25 637
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush 깊은바다 2021-06-24 654
GameGAN으로 직접 화면을 생성하는 GTA5 게임 깊은바다 2021-06-20 634
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1434
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2788
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP file 깊은바다 2021-04-04 1816
GPT-3로 광고문구를 만드는 서비스 - Copy.ai 깊은바다 2021-03-22 647
딥러닝의 창시자인 제프리 힌튼이 구글에 합류하게 된 스토리 깊은바다 2021-03-18 418
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견 file 깊은바다 2021-03-12 573
스냅챕의 디즈니 필터 깊은바다 2021-03-12 528