레플리
글 수 117

기보 없이 강화학습만으로 배우는 알파고 제로

조회 수 434 추천 수 0 2017.10.20 02:19:14


지난해 3월 열린 ‘구글 딥마인드 챌린지’에서 이세돌 9단과 알파고가 대국을 하고 있다. 구글 제공

 

https://brunch.co.kr/@madlymissyou/18

 

 

 

이세돌과 커제와 대결할때 알파고는 먼저 프로기사의 기보 3000만건으로 지도학습을 수행하였습니다.

그 다음에 셀프대국으로 강화학습을 하여 인공지능을 향상시켰습니다.

 

얼마전에 발표한 알파고 제로는 지도학습 과정을 빼고 오직 강화학습만 사용했다고 합니다.

그럼에도 이전 알파고 버전보다 훨씬 강하다고 하네요.

 

바둑에서는 인공지능이 거의 끝을 본 것 같습니다.

이제 다음번 목표인 스타크래프트에서 언제쯤 프로게이머를 이길 수 있을지 기대됩니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
Prolog로 간단한 추론 프로그램 만들기 깊은바다 2018-02-08 3408
베이지안 추론 깊은바다 2018-01-12 1453
데미스 하사비스가 말하는 AI  - 기계에 깃든 정신 깊은바다 2017-10-25 419
알파고 제로 논문 링크 [1] Khan 2017-10-20 1164
기보 없이 강화학습만으로 배우는 알파고 제로 깊은바다 2017-10-20 434
알아두면 쓸데있는 신기한 인공지능 50선 깊은바다 2017-09-24 750
인공지능과의 사랑 file 깊은바다 2017-09-24 344
알파고를 만든 데미스 하사비스의 카이스트 강연 깊은바다 2017-09-12 366
인공지능이 가져올 변화에 대해 쉽게 설명하는 영상 깊은바다 2017-09-08 419
인공지능이 의식을 가질 수 있는가 file [2] 깊은바다 2017-09-05 1973
ai.google [1] LegenDUST 2017-08-25 356
우리나라 AI 기업 현황 조사 보고서 [1] 깊은바다 2017-06-30 1917
지대넓얕 팟캐스트 AI와 영생 - 특이점이 온다 깊은바다 2017-05-02 4245
인공지능이 인간의 직업을 대신할 것인가 깊은바다 2017-04-29 340
초인공지능의 등장과 인간의 영생 또는 멸망 깊은바다 2017-04-08 402