- AI Dev - 인공지능 개발자 모임
- 정보공유
- 강화학습
글 수 27
1부 - 강화학습의 정의 및 설명
-> https://brunch.co.kr/@kakao-it/73
2부 - 알파고에서 사용된 몬테카를로 알고리즘과 딥러닝 및 강화학습의 적용 방법
-> https://brunch.co.kr/@kakao-it/102
강화학습은 경험을 통해 보상과 벌칙을 받아 최적의 행동을 결정하도록 학습하는 방법입니다.
알파고에서도 딥러닝과 함께 강화학습 기법이 사용되었습니다.
수식이 조금 있긴 하지만 강화학습에 대해 좀 더 자세히 이해하는데 도움이 되는 글입니다.
아래 글들과 함께 읽으시면 더 좋을 것 같습니다.
MDP 기반의 스케줄링 구현
-> http://aidev.co.kr/learning/429
강화학습 기반의 자율적인 행동 학습