레플리
글 수 203

딥마인드의 Agent57, 아타리 게임 벤치마크 정복

조회 수 456 추천 수 0 2020.04.03 03:25:00


f6b5f285173d4449285a8e812b8385f45c03f710

 

https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark

 

 

 

ALE(Arcade Learning Environment)는 2012년 처음 나온 범용 인공지능 벤치마크입니다. 57개의 아타리 게임들로 구성되어 있으며, 하나의 모델로 모든 게임들을 학습할 수 있어야 합니다. 2013년 딥마인드의 DQN이 처음으로 큰 성과를 올리며 주목을 받았습니다. 그후 구글에 인수되었고 알파고로 전세계에 딥러닝 열풍을 불러일으켰습니다.

 

그동안 다양한 모델이 ALE에 도전했지만, 몇몇 어려운 게임들을 넘어서지 못했습니다. 얼마 전 딥마인드의 Agent57이란 모델이 드디어 57개의 게임을 모두 정복했다고 합니다. NGU(Never Give Up), Meta-Controller 등 다양한 기법들을 활용했습니다.

 

저도 최근 강화학습 트렌드에는 익숙하지 않아서, 정확히 어떤 내용인지는 잘 모르겠네요. 딥러닝 중에서도 가장 변화가 빠른 분야가 강화학습인 것 같습니다. 그만큼 공부하기가 어렵지만 발전가능성도 높다고 생각합니다. 현재까지 AGI(Artificial General Intelligence)에 가장 가까운 기술이니까요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
불쾌한 골짜기에서 대유쾌 마운틴으로 - 이미지 생성AI file 깊은바다 2023-03-08 7207
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2173
사인필드 시트콤을 패러디한 AI 생성 애니메이션 방송 file 깊은바다 2023-02-01 404
글로 설명하면 음악을 만들어주는 딥러닝 모델 - MusicLM 깊은바다 2023-01-27 447
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2411
GPT : 도래한 초거대 AI의 시대, 빅테크가 주도할 수 밖에 없는 이유 file 깊은바다 2022-12-22 330
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 786
NVIDIA가 발표한 Text-to-3D 모델 - Magic3D 깊은바다 2022-11-22 654
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1310
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1914
World Models를 만든 David Ha, 구글에서 StabilityAI로 이적 file 깊은바다 2022-10-11 365
인공지능 킬러앱의 등장, 그리고 모바일에서 인공지능으로 패러다임 변환 file 깊은바다 2022-10-10 513
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1195
Text-to-3D인 DreamFusion과 Text-to-Video인 Make-A-Video 깊은바다 2022-10-01 440
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1136