- AI Dev - 인공지능 개발자 모임
- 정보공유
- 강화학습
글 수 27
https://hulk89.github.io/reinforcement%20learning/2018/06/14/tfjs_RL2/
tensorflow.js는 올해 4월에 발표된 것인데 자바스크립트로 학습을 할 수 있습니다. 이를 사용해서 웹에서 직접 동작하는 간단한 강화학습을 구현한 글입니다. 녹색 점이 빨간색 장애물을 피해 노란색 목표로 다가가는 방법을 배웁니다.
Sarsa는 Q-learng과 거의 비슷한데 다만 Q값을 업데이트 방법이 약간 다릅니다. 다음 상태의 최대 Q값이 아니라 현재 수행한 행동의 Q값을 사용한다는 차이가 있습니다.
코드는 아래 링크를 참고하세요.
-> https://github.com/Hulk89/gridworld_tfjs