레플리
글 수 203

딥마인드의 Agent57, 아타리 게임 벤치마크 정복

조회 수 456 추천 수 0 2020.04.03 03:25:00


f6b5f285173d4449285a8e812b8385f45c03f710

 

https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

 

 

 

ALE(Arcade Learning Environment)는 2012년 처음 나온 범용 인공지능 벤치마크입니다. 57개의 아타리 게임들로 구성되어 있으며, 하나의 모델로 모든 게임들을 학습할 수 있어야 합니다. 2013년 딥마인드의 DQN이 처음으로 큰 성과를 올리며 주목을 받았습니다. 그후 구글에 인수되었고 알파고로 전세계에 딥러닝 열풍을 불러일으켰습니다.

 

그동안 다양한 모델이 ALE에 도전했지만, 몇몇 어려운 게임들을 넘어서지 못했습니다. 얼마 전 딥마인드의 Agent57이란 모델이 드디어 57개의 게임을 모두 정복했다고 합니다. NGU(Never Give Up), Meta-Controller 등 다양한 기법들을 활용했습니다.

 

저도 최근 강화학습 트렌드에는 익숙하지 않아서, 정확히 어떤 내용인지는 잘 모르겠네요. 딥러닝 중에서도 가장 변화가 빠른 분야가 강화학습인 것 같습니다. 그만큼 공부하기가 어렵지만 발전가능성도 높다고 생각합니다. 현재까지 AGI(Artificial General Intelligence)에 가장 가까운 기술이니까요.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥러닝(Deep Learning)에 대한 소개 깊은바다 2016-03-21 1000
쉽게 풀어쓴 딥 러닝의 거의 모든 것 file 깊은바다 2016-03-21 1612
딥러닝의 전문가 세명 깊은바다 2016-03-21 669
모두를 위한 머신러닝/딥러닝 강의 깊은바다 2016-04-03 1225
사진을 텍스트로 설명 - CaptionBot file 깊은바다 2016-04-07 795
Quick, Draw! - 구글이 만든 그림 맞추기 깊은바다 2017-02-28 10727
기계학습 / 딥러닝이란 무엇인가 깊은바다 2017-02-28 661
AI Duet - 피아노 반주를 자동으로 해주는 인공지능 깊은바다 2017-02-28 3464
스탠포드 딥러닝 강의 한글화 프로젝트 깊은바다 2017-02-28 1555
딥러닝 라이브러리 텐서플로우의 기본 사용법 깊은바다 2017-03-03 949
딥러닝 합성곱 신경망(CNN) 개요 file 깊은바다 2017-03-05 7775
텐서플로우로 선형 회귀 구현 file 깊은바다 2017-03-09 1360
텐서플로우에서 소프트맥스로 숫자 인식 구현 file 깊은바다 2017-03-09 1373
텐서플로우에서 딥러닝 CNN으로 숫자 인식 구현 file 깊은바다 2017-03-11 5013
딥러닝의 종류 간단 설명 file 깊은바다 2017-03-11 25168