강화학습 - 알파고를 탄생시킨 강화학습의 비밀

Skip to content

레플리

정보공유

글 수 27

알파고를 탄생시킨 강화학습의 비밀

조회 수 859 추천 수 0 2017.06.25 11:40:09

깊은바다 *.68.247.188 http://aidev.co.kr/1672

1부 - 강화학습의 정의 및 설명

-> https://brunch.co.kr/@kakao-it/73

2부 - 알파고에서 사용된 몬테카를로 알고리즘과 딥러닝 및 강화학습의 적용 방법

-> https://brunch.co.kr/@kakao-it/102

강화학습은 경험을 통해 보상과 벌칙을 받아 최적의 행동을 결정하도록 학습하는 방법입니다.

알파고에서도 딥러닝과 함께 강화학습 기법이 사용되었습니다.

수식이 조금 있긴 하지만 강화학습에 대해 좀 더 자세히 이해하는데 도움이 되는 글입니다.

아래 글들과 함께 읽으시면 더 좋을 것 같습니다.

MDP 기반의 스케줄링 구현

-> http://aidev.co.kr/learning/429

강화학습 기반의 자율적인 행동 학습

-> http://aidev.co.kr/learning/432

이 게시물을

엮인글 :

목록

List of Articles

제목	글쓴이	날짜	조회 수
스타2 강화학습 튜토리얼 [2]	깊은바다	2018-02-04	1534
새로운 강화학습 방식인 니마시니 알고리즘	깊은바다	2018-06-03	1590
딥 강화학습 쉽게 이해하기 [2]	깊은바다	2017-02-28	1928
딥 강화학습으로 퐁 게임 학습	깊은바다	2017-03-13	1963
MDP 기반의 스케줄링 구현 [1]	깊은바다	2016-03-24	2122
강화학습 기반의 자율적인 행동 학습	깊은바다	2016-03-24	2521
tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa	깊은바다	2018-07-27	2528
강화학습 관련 노하우 정리	깊은바다	2019-07-29	2688
DQN 강화학습으로 슈퍼마리오 인공지능 구현	깊은바다	2017-10-30	2728
텐서플로우에서 DQN 강화학습으로 캐치게임 구현	깊은바다	2017-03-18	6860
강화학습 Q-Learning과 DQN에 대한 설명	깊은바다	2017-03-27	9924
신경망 Q-Learning으로 구현한 오목 게임	깊은바다	2017-03-29	15637

목록

쓰기

첫 페이지 1 2 끝 페이지