레플리
글 수 27

강화학습의 개요

조회 수 674 추천 수 0 2018.05.28 19:25:16


행동심리학과 강화학습
1. 굶긴 쥐를 상자에 넣는다.
2. 쥐는 돌아다니다가 우연히 상자 안에 있는
지렛대를 누르게 된다.
3. 지렛대를 누르자 먹이가 나온다.
4. 지렛대를 누르는 행동과 먹이와의 상관관계를
모르는 쥐...

 

https://www.slideshare.net/DongMinLee32/ss-91521646

 

 

 

강화학습의 기본 개념에 대해 설명한 슬라이드입니다. 학습은 보통 다음과 같이 세 가지로 구성됩니다.

 

첫째, 직접 정답이 뭔지 가르치는 지도학습입니다. 엄마가 아이에게 이건 사과, 이건 배라고 알려주는 것을 말합니다. 딥러닝의 CNN에서 사진을 분류하는 방법을 학습하는 것이 여기에 속합니다.

 

둘째, 외부의 도움 없이 스스로 패턴을 인식하는 비지도학습입니다. 사람은 대상을 바라볼때 네모난 것, 둥근 것 등 물체의 모양을 자연스럽게 구분을 할 수 있습니다. 데이터의 특징 정보에 따라 어떤 타입에 속하는지 그룹으로 묶는 클러스터링 기법이 대표적인 예입니다.

 

셋째, 보상과 벌칙을 통해 어떤 행동을 해야 하는지 배우는 강화학습니다. 레이블이 되어 있는 데이터가 필요없다는 점에서 비지도학습과 비슷하지만 환경으로부터 보상과 벌칙이 주어져야 한다는 점에서 큰 차이점이 있습니다. 아기가 어떤 음식을 먹고 맛이 있으면 계속 원하고 맛이 없으면 싫어하는 것도 강화학습이라 볼 수 있습니다.

 

 

 

알파고의 경우 프로기사들의 기보를 학습하는 지도학습과 스스로 대국하여 배우는 강화학습을 사용하였습니다. 가장 최신 버전은 기보 없이 혼자 두는 방식만으로 압도적인 성능을 보였다고 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥마인드의 게임을 학습하는 딥러닝 인공지능 깊은바다 2016-03-21 975
MDP 기반의 스케줄링 구현 file [1] 깊은바다 2016-03-24 2117
강화학습 기반의 자율적인 행동 학습 file 깊은바다 2016-03-24 2515
강화학습 기반의 지능적인 가상캐릭터 file 깊은바다 2016-03-24 615
딥러닝 강화학습으로 둠 게임 구현 깊은바다 2017-02-28 709
딥 강화학습 쉽게 이해하기 [2] 깊은바다 2017-02-28 1928
딥 강화학습으로 퐁 게임 학습 file 깊은바다 2017-03-13 1960
텐서플로우에서 DQN 강화학습으로 캐치게임 구현 file 깊은바다 2017-03-18 6844
강화학습 Q-Learning과 DQN에 대한 설명 깊은바다 2017-03-27 9923
신경망 Q-Learning으로 구현한 오목 게임 깊은바다 2017-03-29 15616
알파고를 탄생시킨 강화학습의 비밀 깊은바다 2017-06-25 859
알아두면 쓸데있는 신기한 강화학습 깊은바다 2017-08-24 1145
강화학습과 DQN 소개 깊은바다 2017-10-05 1356
스타크래프트2 강화학습 깊은바다 2017-10-14 1063
DQN 강화학습으로 슈퍼마리오 인공지능 구현 깊은바다 2017-10-30 2716