레플리
글 수 27

딥마인드의 모방을 통한 게임 학습

조회 수 926 추천 수 0 2018.06.01 20:23:53


 

https://arxiv.org/pdf/1805.11592.pdf

 

 

 

2014년 딥마인드가 처음으로 아타리 게임을 스스로 배우는 강화학습을 발표하였습니다. 그 후 슈퍼마리오 같이 여러 가지 게임들에서 사람보다 훨씬 뛰어난 실력을 보여주었습니다.

 

하지만 Montezuma's Revenge 같이 복잡한 게임은 아직까지 학습이 불가능했었는데요. 슈퍼마리오는 일직선으로 진행하는데 비해 이 게임은 여러 장소를 방문하여 열쇠를 얻고 함정을 피하는 등 게임 진행이 단순하지 않습니다. 또한 강화학습에 필수적인 보상을 다른 게임처럼 즉각적으로 받지를 않기 때문에 학습이 어려웠습니다.

 

이를 해결하기 위해 사람이 플레이한 영상을 보고 모방(one-shot imitation)하여 학습 속도를 더욱 빠르게 하였다고 합니다. 어쩌면 지도학습과 강화학습의 결합이라고 볼 수 있는데요. 인간도 관찰을 통해 어떻게 하는지 배우고 스스로 해보면서 더욱 익숙해진다는 점에서 실제와 비슷한 학습 방법인 것 같습니다. 앞으로 여러 분야에서 응용할 수 있지 않을까요.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥마인드의 게임을 학습하는 딥러닝 인공지능 깊은바다 2016-03-21 980
MDP 기반의 스케줄링 구현 file [1] 깊은바다 2016-03-24 2122
강화학습 기반의 자율적인 행동 학습 file 깊은바다 2016-03-24 2521
강화학습 기반의 지능적인 가상캐릭터 file 깊은바다 2016-03-24 620
딥러닝 강화학습으로 둠 게임 구현 깊은바다 2017-02-28 709
딥 강화학습 쉽게 이해하기 [2] 깊은바다 2017-02-28 1928
딥 강화학습으로 퐁 게임 학습 file 깊은바다 2017-03-13 1963
텐서플로우에서 DQN 강화학습으로 캐치게임 구현 file 깊은바다 2017-03-18 6860
강화학습 Q-Learning과 DQN에 대한 설명 깊은바다 2017-03-27 9924
신경망 Q-Learning으로 구현한 오목 게임 깊은바다 2017-03-29 15636
알파고를 탄생시킨 강화학습의 비밀 깊은바다 2017-06-25 859
알아두면 쓸데있는 신기한 강화학습 깊은바다 2017-08-24 1145
강화학습과 DQN 소개 깊은바다 2017-10-05 1365
스타크래프트2 강화학습 깊은바다 2017-10-14 1072
DQN 강화학습으로 슈퍼마리오 인공지능 구현 깊은바다 2017-10-30 2728