강화학습 - 강화학습의 개요

글 수 27

강화학습의 개요

조회 수 870 추천 수 0 2018.05.28 19:25:16

깊은바다 *.68.247.188 http://aidev.co.kr/5151

íëì¬ë¦¬íê³¼ ê°ííìµ
1. êµ¶ê¸´ ì¥ë¥¼ ììì ë£ëë¤.
2. ì¥ë ëìë¤ëë¤ê° ì°ì°í ìì ìì ìë
ì§ë ëë¥¼ ëë¥´ê² ëë¤.
3. ì§ë ëë¥¼ ëë¥´ì ë¨¹ì´ê° ëì¨ë¤.
4. ì§ë ëë¥¼ ëë¥´ë íëê³¼ ë¨¹ì´ìì ìê´ê´ê³ë¥¼
ëª¨ë¥´ë ì¥...

https://www.slideshare.net/DongMinLee32/ss-91521646

강화학습의 기본 개념에 대해 설명한 슬라이드입니다. 학습은 보통 다음과 같이 세 가지로 구성됩니다.

첫째, 직접 정답이 뭔지 가르치는 지도학습입니다. 엄마가 아이에게 이건 사과, 이건 배라고 알려주는 것을 말합니다. 딥러닝의 CNN에서 사진을 분류하는 방법을 학습하는 것이 여기에 속합니다.

둘째, 외부의 도움 없이 스스로 패턴을 인식하는 비지도학습입니다. 사람은 대상을 바라볼때 네모난 것, 둥근 것 등 물체의 모양을 자연스럽게 구분을 할 수 있습니다. 데이터의 특징 정보에 따라 어떤 타입에 속하는지 그룹으로 묶는 클러스터링 기법이 대표적인 예입니다.

셋째, 보상과 벌칙을 통해 어떤 행동을 해야 하는지 배우는 강화학습니다. 레이블이 되어 있는 데이터가 필요없다는 점에서 비지도학습과 비슷하지만 환경으로부터 보상과 벌칙이 주어져야 한다는 점에서 큰 차이점이 있습니다. 아기가 어떤 음식을 먹고 맛이 있으면 계속 원하고 맛이 없으면 싫어하는 것도 강화학습이라 볼 수 있습니다.

알파고의 경우 프로기사들의 기보를 학습하는 지도학습과 스스로 대국하여 배우는 강화학습을 사용하였습니다. 가장 최신 버전은 기보 없이 혼자 두는 방식만으로 압도적인 성능을 보였다고 합니다.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
강화학습 관련 노하우 정리	깊은바다	2019-07-29	2969
데미스 하사비스의 카이스트 강연 - 아타리 게임 DQN과 알파고의 원리	깊은바다	2019-07-24	1414
강화학습 블로그 - 숨니의 무작정 따라하기	깊은바다	2019-07-21	1322
OpenAI의 멀티 에이전트 강화학습 환경 - Neural MMO	깊은바다	2019-03-06	1165
딥마인드의 알파스타가 프로게이머와의 대결에서 승리 [1]	깊은바다	2019-01-25	884
텐센트의 스타크래프트2 인공지능 - TStarBot	깊은바다	2018-09-21	1077
tensorflow-js로 만들어본 RL 예제: 2. Deep-sarsa	깊은바다	2018-07-27	2721
웹브라우저에서 자율주행차 강화학습 프로젝트 [2]	깊은바다	2018-06-21	1448
새로운 강화학습 방식인 니마시니 알고리즘	깊은바다	2018-06-03	1829
딥마인드의 모방을 통한 게임 학습	깊은바다	2018-06-01	1104
강화학습의 개요	깊은바다	2018-05-28	870
스타2 강화학습 튜토리얼 [2]	깊은바다	2018-02-04	1728
DQN 강화학습으로 슈퍼마리오 인공지능 구현	깊은바다	2017-10-30	2921
스타크래프트2 강화학습	깊은바다	2017-10-14	1258
강화학습과 DQN 소개	깊은바다	2017-10-05	1549

쓰기

첫 페이지 1 2 끝 페이지