강화학습 - OpenAI의 멀티 에이전트 강화학습 환경

글 수 27

OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO

조회 수 975 추천 수 0 2019.03.06 20:09:56

깊은바다 *.68.247.186 http://aidev.co.kr/7109

https://blog.openai.com/neural-mmo/

OpenAI에서 새로운 강화학습 환경을 공개했습니다. 기존에 있던 OpenAI Gym은 슈퍼마리오나 블록격파처럼 싱글 게임에 최적화되어 있습니다. 이번에 발표한 Neural MMO는 멀티 에이전트를 위한 가상 환경입니다.

거의 온라인 게임과 비슷하다고 보면 됩니다. 128개의 에이전트가 동시에 동작하는데 랜덤하게 만들어진 타일맵을 돌아다닙니다. 물이나 음식 타일에 가면 체력을 회복하고, 다른 에이전트를 만나면 밀리, 원거리, 마법사 타입에 따라 전투를 합니다. 한 턴마다 보상을 1씩 받는데, 오래 살아남도록 행동을 학습합니다.

훈련 결과를 보면 최대한 경쟁을 피하기 위해 맵 전체로 넓게 퍼지는 경향을 보인다고 합니다. 호모 사피엔스가 아프리카에서 시작하여 새로운 땅을 찾아 전 세계로 이동한 것과 비슷한 것 같습니다.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
강화학습 기반의 지능적인 가상캐릭터	깊은바다	2016-03-24	620
딥마인드의 알파스타가 프로게이머와의 대결에서 승리 [1]	깊은바다	2019-01-25	677
강화학습의 개요	깊은바다	2018-05-28	685
딥러닝 강화학습으로 둠 게임 구현	깊은바다	2017-02-28	710
알파고를 탄생시킨 강화학습의 비밀	깊은바다	2017-06-25	861
텐센트의 스타크래프트2 인공지능 - TStarBot	깊은바다	2018-09-21	892
딥마인드의 모방을 통한 게임 학습	깊은바다	2018-06-01	926
OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO	깊은바다	2019-03-06	975
딥마인드의 게임을 학습하는 딥러닝 인공지능	깊은바다	2016-03-21	980
강화학습 블로그 - 숨니의 무작정 따라하기	깊은바다	2019-07-21	1069
스타크래프트2 강화학습	깊은바다	2017-10-14	1073
알아두면 쓸데있는 신기한 강화학습	깊은바다	2017-08-24	1145
데미스 하사비스의 카이스트 강연 - 아타리 게임 DQN과 알파고의 원리	깊은바다	2019-07-24	1202
웹브라우저에서 자율주행차 강화학습 프로젝트 [2]	깊은바다	2018-06-21	1255
강화학습과 DQN 소개	깊은바다	2017-10-05	1365

쓰기

첫 페이지 1 2 끝 페이지