글 수 27

스타2 강화학습 튜토리얼

조회 수 1260 추천 수 1 2018.02.04 05:41:18


GrP9zo9Z5fNfNOCC852gsV54ANw.png

 

1편 -> https://brunch.co.kr/@chris-song/44

2편 -> https://brunch.co.kr/@chris-song/48

 

 

 

PySC2는 딥마인드와 블리자드가 공동으로 만든 파이썬 라이브러리로

스타크래프트2와 연동하여 학습을 할 수 있는 환경을 제공합니다.

게임의 화면을 데이터를 입력 받고 처리된 결과를 출력으로 보내면 게임 속 유닛을 조작할 수 있습니다.

 

이 모듈을 사용해서 미네랄을 수집하는 간단한 행동을 강화학습을 통해 배우는 예제입니다.

위의 그림에서 디버거에 보이는 배열이 Observation Space의 정보입니다.

여기서 얻은 데이터를 사용하여 학습을 수행한다고 합니다.

 

과연 언제쯤 딥마인드의 스타2 인공지능이 공개될지 궁금하네요.

 

엮인글 :

NeuroWhAI

2018.02.04 06:26:29
*.64.194.131

오오 어떻게 순차적인 동작을 만드는지 궁금하네요.

깊은바다

2018.02.04 06:29:54
*.68.247.188

저도 자세히는 모르지만 강화학습 자체가 특정 상태에서 어떤 액션을 수행해야 하는지를 배우는 것입니다. 위의 예제에서는 동작을 수행할때마다 캐릭터의 위치나 미네랄의 유무 등 상태가 변화합니다. 그래서 달라진 상태에 맞는 행동이 계속 이어질 수 있는 것 같아요.

List of Articles
제목 글쓴이 날짜sort 조회 수
강화학습 관련 노하우 정리 깊은바다 2019-07-29 1305
데미스 하사비스의 카이스트 강연 - 아타리 게임 DQN과 알파고의 원리 깊은바다 2019-07-24 399
강화학습 블로그 - 숨니의 무작정 따라하기 깊은바다 2019-07-21 542
OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO 깊은바다 2019-03-06 703
딥마인드의 알파스타가 프로게이머와의 대결에서 승리 [1] 깊은바다 2019-01-25 400
텐센트의 스타크래프트2 인공지능 - TStarBot file 깊은바다 2018-09-21 683
tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa 깊은바다 2018-07-27 2237
웹브라우저에서 자율주행차 강화학습 프로젝트 [2] 깊은바다 2018-06-21 943
새로운 강화학습 방식인 니마시니 알고리즘 깊은바다 2018-06-03 1219
딥마인드의 모방을 통한 게임 학습 깊은바다 2018-06-01 752
강화학습의 개요 깊은바다 2018-05-28 476
스타2 강화학습 튜토리얼 [2] 깊은바다 2018-02-04 1260
DQN 강화학습으로 슈퍼마리오 인공지능 구현 깊은바다 2017-10-30 2267
스타크래프트2 강화학습 깊은바다 2017-10-14 921
강화학습과 DQN 소개 깊은바다 2017-10-05 1153