레플리
글 수 27

tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa

조회 수 2511 추천 수 0 2018.07.27 15:11:39


Q-network

 

https://hulk89.github.io/reinforcement%20learning/2018/06/14/tfjs_RL2/

 

 

 

tensorflow.js는 올해 4월에 발표된 것인데 자바스크립트로 학습을 할 수 있습니다. 이를 사용해서 웹에서 직접 동작하는 간단한 강화학습을 구현한 글입니다. 녹색 점이 빨간색 장애물을 피해 노란색 목표로 다가가는 방법을 배웁니다.

 

Sarsa는 Q-learng과 거의 비슷한데 다만 Q값을 업데이트 방법이 약간 다릅니다. 다음 상태의 최대 Q값이 아니라 현재 수행한 행동의 Q값을 사용한다는 차이가 있습니다.

 

 

 

코드는 아래 링크를 참고하세요.
-> https://github.com/Hulk89/gridworld_tfjs

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥마인드의 게임을 학습하는 딥러닝 인공지능 깊은바다 2016-03-21 975
MDP 기반의 스케줄링 구현 file [1] 깊은바다 2016-03-24 2117
강화학습 기반의 자율적인 행동 학습 file 깊은바다 2016-03-24 2515
강화학습 기반의 지능적인 가상캐릭터 file 깊은바다 2016-03-24 615
딥러닝 강화학습으로 둠 게임 구현 깊은바다 2017-02-28 709
딥 강화학습 쉽게 이해하기 [2] 깊은바다 2017-02-28 1928
딥 강화학습으로 퐁 게임 학습 file 깊은바다 2017-03-13 1960
텐서플로우에서 DQN 강화학습으로 캐치게임 구현 file 깊은바다 2017-03-18 6844
강화학습 Q-Learning과 DQN에 대한 설명 깊은바다 2017-03-27 9923
신경망 Q-Learning으로 구현한 오목 게임 깊은바다 2017-03-29 15616
알파고를 탄생시킨 강화학습의 비밀 깊은바다 2017-06-25 859
알아두면 쓸데있는 신기한 강화학습 깊은바다 2017-08-24 1145
강화학습과 DQN 소개 깊은바다 2017-10-05 1356
스타크래프트2 강화학습 깊은바다 2017-10-14 1063
DQN 강화학습으로 슈퍼마리오 인공지능 구현 깊은바다 2017-10-30 2716