레플리
글 수 203

딥러닝의 미래는 바로 비지도학습

조회 수 6368 추천 수 0 2019.06.06 04:04:01


autoencoder_schema

 

https://www.dlology.com/blog/how-to-do-unsupervised-clustering-with-keras/

 

 

 

머신러닝은 크게 세가지 종류로 구분됩니다. 첫째는 지도학습(supervised learning)입니다. 입력에 따른 정답을 알려주고 똑같은 결과가 나오도록 학습합니다. 둘째는 비지도학습(unsupervised learning)입니다. 라벨이 없이 스스로 입력 데이터의 패턴을 구분하도록 배웁니다. 셋째는 강화학습(reinforcement learning)입니다. 라벨이 없는 것은 비지도학습과 비슷하지만, 환경으로부터 보상값을 받아야 하는 차이가 있습니다. 또한 연속된 행동을 수행하는데 적합합니다.

 

비지도학습의 대표적인 방법으로 클러스터링(clustering)이 있습니다. 입력의 특성값이 유사한 것끼리 서로 묶어 패턴을 파악합니다. 이런 방법을 딥러닝을 이용하여 구현하는 글입니다. 먼저 오토인코더(autoencoder)로 입력값의 정보가 압축된 벡터를 얻습니다. 그리고 이를 K-Means 알고리즘으로 클러스터링을 하였습니다. MNIST 손글씨 데이터를 라벨없이 학습했는데 96%의 정확도를 달성하였습니다.

 

 

 

오토인코더는 자기지도학습(self-supervised learning)이라 볼 수 있습니다. 클러스터링과 달리 라벨이 필요하긴 합니다. 다만 입력에서 스스로 라벨을 만들어 지도학습을 합니다. 최근 자연어처리에서 BERT나 GPT2도 이런 기법을 사용합니다. 얀 르쿤은 비지도학습을 자기지도학습으로 부르자고 제안하기도 했습니다. 개인적으로도 비지도학습과 자기지도학습은 같은 것이라 생각됩니다. 둘 다 입력에서 스스로 패턴을 뽑아내는 것이기 때문입니다.

 

최근 제프리 힌튼과 얀 르쿤이 강조하는게, 앞으로 비지도학습이 딥러닝의 새로운 주역으로 떠오를 것이라고 말합니다. 지금처럼 사람이 일일이 데이터에 라벨을 부여하는 방식은 한계가 있습니다. 기계 스스로 배워나가야 합니다. 그래야 범용적인 인공지능이 가능해집니다.

 

사람은 주변을 관찰하면서 혼자 세상의 원리를 파악하고 법칙을 이해합니다(비지도학습). 그리고 책이나 다른 사람들이 가르쳐주면 그걸 자기가 알고있던 패턴과 연결합니다(지도학습). 또한 지금까지 습득한 지식을 기반으로 직접 해보고, 그 결과에 따라 경험으로 배우기도 합니다(강화학습). 이처럼 모든 학습은 기본적으로 비지도학습을 통한 패턴 인식이 가장 선행되어야 합니다.

 

 

 

현재 강화학습은 입력 받은 이미지에서 바로 행동을 학습합니다. 만약 비지도학습으로 미리 이미지의 패턴을 이해하고, 이 추상화된 정보만 사용하여 강화학습을 한다면 더욱 효과적일지도 모릅니다. 구글에서 발표한 월드 모델(world models)이 이런 방식과 비슷합니다.

 

http://aidev.co.kr/deeplearning/4304

 

VAE로 과거와 현재 이미지의 추상화된 패턴(latent vector)을 얻습니다. 그다음 RNN을 통해 바로 다음에 올 미래 이미지를 예측합니다. 최종적으로 이들 정보를 가지고 행동을 학습합니다. DQN과 같은 강화학습이지만 비지도학습이 사용되었다는 점에서 차이가 있습니다.

 

현재 딥러닝에서 큰 인기를 얻고 있는 생성 모델인 GAN과 VAE도 비지도학습의 한 종류라 볼 수 있습니다. 앞으로 범용 인공지능(artificial general intelligence)을 구현하기 위한 핵심은 바로 비지도학습에 있다고 믿습니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 865
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1317
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐 깊은바다 2021-07-14 913
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래 깊은바다 2021-07-08 875
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색 깊은바다 2021-07-05 1090
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS 깊은바다 2021-06-25 637
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush 깊은바다 2021-06-24 651
GameGAN으로 직접 화면을 생성하는 GTA5 게임 깊은바다 2021-06-20 634
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1434
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2788
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP file 깊은바다 2021-04-04 1816
GPT-3로 광고문구를 만드는 서비스 - Copy.ai 깊은바다 2021-03-22 647
딥러닝의 창시자인 제프리 힌튼이 구글에 합류하게 된 스토리 깊은바다 2021-03-18 418
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견 file 깊은바다 2021-03-12 573
스냅챕의 디즈니 필터 깊은바다 2021-03-12 528