레플리
글 수 203

딥마인드의 Agent57, 아타리 게임 벤치마크 정복

조회 수 456 추천 수 0 2020.04.03 03:25:00


f6b5f285173d4449285a8e812b8385f45c03f710

 

https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

 

 

 

ALE(Arcade Learning Environment)는 2012년 처음 나온 범용 인공지능 벤치마크입니다. 57개의 아타리 게임들로 구성되어 있으며, 하나의 모델로 모든 게임들을 학습할 수 있어야 합니다. 2013년 딥마인드의 DQN이 처음으로 큰 성과를 올리며 주목을 받았습니다. 그후 구글에 인수되었고 알파고로 전세계에 딥러닝 열풍을 불러일으켰습니다.

 

그동안 다양한 모델이 ALE에 도전했지만, 몇몇 어려운 게임들을 넘어서지 못했습니다. 얼마 전 딥마인드의 Agent57이란 모델이 드디어 57개의 게임을 모두 정복했다고 합니다. NGU(Never Give Up), Meta-Controller 등 다양한 기법들을 활용했습니다.

 

저도 최근 강화학습 트렌드에는 익숙하지 않아서, 정확히 어떤 내용인지는 잘 모르겠네요. 딥러닝 중에서도 가장 변화가 빠른 분야가 강화학습인 것 같습니다. 그만큼 공부하기가 어렵지만 발전가능성도 높다고 생각합니다. 현재까지 AGI(Artificial General Intelligence)에 가장 가까운 기술이니까요.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥러닝 시대에 글로벌 대기업들을 따라잡을 수 있을까 깊은바다 2020-01-30 371
얀 르쿤이 만든 최초의 CNN 테스트 영상 깊은바다 2020-01-19 2247
어떻게 해야 기계에게 글을 잘 읽고 말할 수 있게 할까? - 기계독해(MRC) 깊은바다 2020-01-14 836
딥페이크로 만든 실베스터 스탤론의 터미네이터2 깊은바다 2019-12-29 577
최신 딥러닝 모델들의 학습 비용 깊은바다 2019-12-12 1268
딥러닝이 작동하는 원리는? 깊은바다 2019-11-17 770
GAN을 활용한 My handwriting styler 깊은바다 2019-10-20 915
가중치를 하나로 공유하고 모델의 구조만 찾는 WANN 깊은바다 2019-09-10 916
네이버의 손글씨 자동생성 인공지능 file 깊은바다 2019-09-08 7163
R-CNN 에서 부터 Mask R-CNN 까지 깊은바다 2019-09-03 1407
만화 캐릭터를 자동으로 생성하는 서비스 - Waifu file 깊은바다 2019-08-23 20456
AutoML을 이용한 Architecture Search 소개 및 NASNet 논문 리뷰 깊은바다 2019-08-18 1207
얀 르쿤의 자기지도학습 강의 - The Power and Limits Of Deep Learning file 깊은바다 2019-07-13 1901
딥러닝의 기본 깊은바다 2019-07-12 942
셀프 어텐션만으로 이미지를 인식하는 딥러닝 모델 file 깊은바다 2019-06-26 1868