레플리
글 수 203

딥마인드의 Agent57, 아타리 게임 벤치마크 정복

조회 수 456 추천 수 0 2020.04.03 03:25:00


f6b5f285173d4449285a8e812b8385f45c03f710

 

https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

 

 

 

ALE(Arcade Learning Environment)는 2012년 처음 나온 범용 인공지능 벤치마크입니다. 57개의 아타리 게임들로 구성되어 있으며, 하나의 모델로 모든 게임들을 학습할 수 있어야 합니다. 2013년 딥마인드의 DQN이 처음으로 큰 성과를 올리며 주목을 받았습니다. 그후 구글에 인수되었고 알파고로 전세계에 딥러닝 열풍을 불러일으켰습니다.

 

그동안 다양한 모델이 ALE에 도전했지만, 몇몇 어려운 게임들을 넘어서지 못했습니다. 얼마 전 딥마인드의 Agent57이란 모델이 드디어 57개의 게임을 모두 정복했다고 합니다. NGU(Never Give Up), Meta-Controller 등 다양한 기법들을 활용했습니다.

 

저도 최근 강화학습 트렌드에는 익숙하지 않아서, 정확히 어떤 내용인지는 잘 모르겠네요. 딥러닝 중에서도 가장 변화가 빠른 분야가 강화학습인 것 같습니다. 그만큼 공부하기가 어렵지만 발전가능성도 높다고 생각합니다. 현재까지 AGI(Artificial General Intelligence)에 가장 가까운 기술이니까요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
팩맨 게임을 딥러닝으로 시뮬레이션한 GameGAN 깊은바다 2020-05-23 703
CNN 시각화 사이트 - CNN Explainer 깊은바다 2020-05-10 1457
얀 르쿤, 자기지도학습이 강화학습보다 중요 깊은바다 2020-05-03 723
미디가 아니라 오디오로 음악을 만들어내는 OpenAI의 생성 모델 - Jukebox file 깊은바다 2020-05-02 662
딥러닝 웹서비스 개발 도전기 - 연예인 얼굴 판별기 깊은바다 2020-05-01 3099
사회적 거리를 지키는지 확인하는 지능형 CCTV 깊은바다 2020-04-23 477
딥페이크로 일론 머스크인 척 친구들을 속이는 영상 깊은바다 2020-04-19 1389
딥마인드의 Agent57, 아타리 게임 벤치마크 정복 깊은바다 2020-04-03 456
AutoML-Zero, 진화적 알고리즘을 사용하여 신경망 구조 설계 [2] 깊은바다 2020-03-13 820
자기지도학습 기반의 이미지 사전훈련 모델 - SimCLR 깊은바다 2020-03-10 3015
딥러닝을 사용한 포즈 인식 - Teachable Machine 깊은바다 2020-02-28 2953
딥러닝 챗봇에 대한 오해 깊은바다 2020-02-25 902
Semantic Segmentation을 활용한 차량 파손 탐지 딥러닝 모델 개발기 깊은바다 2020-02-14 734
딥러닝으로 음성합성을 해주는 서비스 - 네이버 클로바더빙 file 깊은바다 2020-02-09 471
데이팅 앱 틴더(Tinder)에서 이미지 인식으로 자동화된 봇 만들기 깊은바다 2020-02-06 662