레플리
글 수 203

딥마인드의 Agent57, 아타리 게임 벤치마크 정복

조회 수 456 추천 수 0 2020.04.03 03:25:00


f6b5f285173d4449285a8e812b8385f45c03f710

 

https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

 

 

 

ALE(Arcade Learning Environment)는 2012년 처음 나온 범용 인공지능 벤치마크입니다. 57개의 아타리 게임들로 구성되어 있으며, 하나의 모델로 모든 게임들을 학습할 수 있어야 합니다. 2013년 딥마인드의 DQN이 처음으로 큰 성과를 올리며 주목을 받았습니다. 그후 구글에 인수되었고 알파고로 전세계에 딥러닝 열풍을 불러일으켰습니다.

 

그동안 다양한 모델이 ALE에 도전했지만, 몇몇 어려운 게임들을 넘어서지 못했습니다. 얼마 전 딥마인드의 Agent57이란 모델이 드디어 57개의 게임을 모두 정복했다고 합니다. NGU(Never Give Up), Meta-Controller 등 다양한 기법들을 활용했습니다.

 

저도 최근 강화학습 트렌드에는 익숙하지 않아서, 정확히 어떤 내용인지는 잘 모르겠네요. 딥러닝 중에서도 가장 변화가 빠른 분야가 강화학습인 것 같습니다. 그만큼 공부하기가 어렵지만 발전가능성도 높다고 생각합니다. 현재까지 AGI(Artificial General Intelligence)에 가장 가까운 기술이니까요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
전신 사진을 생성하는 GAN 깊은바다 2019-05-05 832
알렉스넷과 Seq2Seq의 창시자 일리야 수츠케버(Ilya Sutskever) 깊은바다 2020-11-17 831
당근마켓에서 딥러닝 활용하기 - 불량 게시물 검사 깊은바다 2017-12-23 821
자동회귀(autoregressive)로 이미지를 생성하는 iGPT file 깊은바다 2020-06-18 821
AutoML-Zero, 진화적 알고리즘을 사용하여 신경망 구조 설계 [2] 깊은바다 2020-03-13 820
사진을 텍스트로 설명 - CaptionBot file 깊은바다 2016-04-07 794
딥러닝 이론에서 텐서플로 실습까지 [2] 깊은바다 2017-11-08 786
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 786
스케치와 색을 지정하여 셀카를 편집하는 SC-FEGAN 깊은바다 2019-02-22 771
딥러닝이 작동하는 원리는? 깊은바다 2019-11-17 770
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신 file 깊은바다 2023-03-30 767
딥러닝 역사 깊은바다 2018-07-10 749
Semantic Segmentation을 활용한 차량 파손 탐지 딥러닝 모델 개발기 깊은바다 2020-02-14 734
순차적으로 여러가지 일을 동시에 배우는 신경망 깊은바다 2017-03-16 729
얀 르쿤, 자기지도학습이 강화학습보다 중요 깊은바다 2020-05-03 722