강화학습 - tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa

글 수 27

조회 수 2723 추천 수 0 2018.07.27 15:11:39

깊은바다 *.68.247.188 http://aidev.co.kr/5539

Q-network

tensorflow.js는 올해 4월에 발표된 것인데 자바스크립트로 학습을 할 수 있습니다. 이를 사용해서 웹에서 직접 동작하는 간단한 강화학습을 구현한 글입니다. 녹색 점이 빨간색 장애물을 피해 노란색 목표로 다가가는 방법을 배웁니다.

Sarsa는 Q-learng과 거의 비슷한데 다만 Q값을 업데이트 방법이 약간 다릅니다. 다음 상태의 최대 Q값이 아니라 현재 수행한 행동의 Q값을 사용한다는 차이가 있습니다.

코드는 아래 링크를 참고하세요.
-> https://github.com/Hulk89/gridworld_tfjs

List of Articles

제목	글쓴이	날짜	조회 수
강화학습 관련 노하우 정리	깊은바다	2019-07-29	2969
데미스 하사비스의 카이스트 강연 - 아타리 게임 DQN과 알파고의 원리	깊은바다	2019-07-24	1414
강화학습 블로그 - 숨니의 무작정 따라하기	깊은바다	2019-07-21	1322
OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO	깊은바다	2019-03-06	1165
딥마인드의 알파스타가 프로게이머와의 대결에서 승리 [1]	깊은바다	2019-01-25	884
텐센트의 스타크래프트2 인공지능 - TStarBot	깊은바다	2018-09-21	1077
tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa	깊은바다	2018-07-27	2723
웹브라우저에서 자율주행차 강화학습 프로젝트 [2]	깊은바다	2018-06-21	1448
새로운 강화학습 방식인 니마시니 알고리즘	깊은바다	2018-06-03	1830
딥마인드의 모방을 통한 게임 학습	깊은바다	2018-06-01	1104
강화학습의 개요	깊은바다	2018-05-28	870
스타2 강화학습 튜토리얼 [2]	깊은바다	2018-02-04	1728
DQN 강화학습으로 슈퍼마리오 인공지능 구현	깊은바다	2017-10-30	2921
스타크래프트2 강화학습	깊은바다	2017-10-14	1258
강화학습과 DQN 소개	깊은바다	2017-10-05	1549

쓰기

첫 페이지 1 2 끝 페이지