강화학습 - 딥마인드의 모방을 통한 게임 학습

글 수 27

딥마인드의 모방을 통한 게임 학습

조회 수 1104 추천 수 0 2018.06.01 20:23:53

깊은바다 *.68.247.188 http://aidev.co.kr/5185

https://arxiv.org/pdf/1805.11592.pdf

2014년 딥마인드가 처음으로 아타리 게임을 스스로 배우는 강화학습을 발표하였습니다. 그 후 슈퍼마리오 같이 여러 가지 게임들에서 사람보다 훨씬 뛰어난 실력을 보여주었습니다.

하지만 Montezuma's Revenge 같이 복잡한 게임은 아직까지 학습이 불가능했었는데요. 슈퍼마리오는 일직선으로 진행하는데 비해 이 게임은 여러 장소를 방문하여 열쇠를 얻고 함정을 피하는 등 게임 진행이 단순하지 않습니다. 또한 강화학습에 필수적인 보상을 다른 게임처럼 즉각적으로 받지를 않기 때문에 학습이 어려웠습니다.

이를 해결하기 위해 사람이 플레이한 영상을 보고 모방(one-shot imitation)하여 학습 속도를 더욱 빠르게 하였다고 합니다. 어쩌면 지도학습과 강화학습의 결합이라고 볼 수 있는데요. 인간도 관찰을 통해 어떻게 하는지 배우고 스스로 해보면서 더욱 익숙해진다는 점에서 실제와 비슷한 학습 방법인 것 같습니다. 앞으로 여러 분야에서 응용할 수 있지 않을까요.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
강화학습 관련 노하우 정리	깊은바다	2019-07-29	2969
데미스 하사비스의 카이스트 강연 - 아타리 게임 DQN과 알파고의 원리	깊은바다	2019-07-24	1413
강화학습 블로그 - 숨니의 무작정 따라하기	깊은바다	2019-07-21	1322
OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO	깊은바다	2019-03-06	1165
딥마인드의 알파스타가 프로게이머와의 대결에서 승리 [1]	깊은바다	2019-01-25	884
텐센트의 스타크래프트2 인공지능 - TStarBot	깊은바다	2018-09-21	1077
tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa	깊은바다	2018-07-27	2721
웹브라우저에서 자율주행차 강화학습 프로젝트 [2]	깊은바다	2018-06-21	1448
새로운 강화학습 방식인 니마시니 알고리즘	깊은바다	2018-06-03	1828
딥마인드의 모방을 통한 게임 학습	깊은바다	2018-06-01	1104
강화학습의 개요	깊은바다	2018-05-28	870
스타2 강화학습 튜토리얼 [2]	깊은바다	2018-02-04	1728
DQN 강화학습으로 슈퍼마리오 인공지능 구현	깊은바다	2017-10-30	2918
스타크래프트2 강화학습	깊은바다	2017-10-14	1258
강화학습과 DQN 소개	깊은바다	2017-10-05	1549

쓰기

첫 페이지 1 2 끝 페이지