- AI Dev - 인공지능 개발자 모임
- 추천도서
글 수 126
알파고 이후 강화학습이 많은 관심을 받고 있지만 아직 자료가 많지는 않습니다. 아마 국내에서 강화학습을 다룬 책은 이게 처음이지 않을까 합니다.
강화학습은 MDP(Markov Decision Process)를 기반으로 하고 있습니다. MDP는 시간에 따른 순차적인 행동을 어떻게 결정할지 수학적으로 정의한 것입니다.
다이나믹 프로그래밍이란 방법을 사용해서 계산을 할 수 있지만 상태집합이 커지면 시간이 너무 오래 걸린다는 단점이 있습니다. 그래서 강화학습으로 경험을 통해 조금씩 학습하는 방법이 유용하게 사용됩니다.
이 책에서는 이런 강화학습의 기본부터 아타리 게임을 학습하는 프로그램까지 폭넓게 다루고 있습니다. 다만 내용이 좀 어려운 편이고 수식이 많아서 이해하기가 쉽지는 않습니다. 그래도 강화학습을 공부하는 분들에게 많은 도움이 될거라 생각합니다.