레플리
글 수 27

알파고를 탄생시킨 강화학습의 비밀

조회 수 859 추천 수 0 2017.06.25 11:40:09


1부 - 강화학습의 정의 및 설명

-> https://brunch.co.kr/@kakao-it/73

 

2부 - 알파고에서 사용된 몬테카를로 알고리즘과 딥러닝 및 강화학습의 적용 방법

-> https://brunch.co.kr/@kakao-it/102

 

 

 

강화학습은 경험을 통해 보상과 벌칙을 받아 최적의 행동을 결정하도록 학습하는 방법입니다.

알파고에서도 딥러닝과 함께 강화학습 기법이 사용되었습니다.

 

수식이 조금 있긴 하지만 강화학습에 대해 좀 더 자세히 이해하는데 도움이 되는 글입니다.

아래 글들과 함께 읽으시면 더 좋을 것 같습니다.

 

 

 

MDP 기반의 스케줄링 구현

-> http://aidev.co.kr/learning/429

 

강화학습 기반의 자율적인 행동 학습

-> http://aidev.co.kr/learning/432

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
강화학습 관련 노하우 정리 깊은바다 2019-07-29 2666
데미스 하사비스의 카이스트 강연 - 아타리 게임 DQN과 알파고의 원리 깊은바다 2019-07-24 1190
강화학습 블로그 - 숨니의 무작정 따라하기 깊은바다 2019-07-21 1057
OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO 깊은바다 2019-03-06 964
딥마인드의 알파스타가 프로게이머와의 대결에서 승리 [1] 깊은바다 2019-01-25 668
텐센트의 스타크래프트2 인공지능 - TStarBot file 깊은바다 2018-09-21 880
tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa 깊은바다 2018-07-27 2511
웹브라우저에서 자율주행차 강화학습 프로젝트 [2] 깊은바다 2018-06-21 1245
새로운 강화학습 방식인 니마시니 알고리즘 깊은바다 2018-06-03 1575
딥마인드의 모방을 통한 게임 학습 깊은바다 2018-06-01 916
강화학습의 개요 깊은바다 2018-05-28 674
스타2 강화학습 튜토리얼 [2] 깊은바다 2018-02-04 1522
DQN 강화학습으로 슈퍼마리오 인공지능 구현 깊은바다 2017-10-30 2716
스타크래프트2 강화학습 깊은바다 2017-10-14 1063
강화학습과 DQN 소개 깊은바다 2017-10-05 1356