레플리
글 수 108

기보 없이 강화학습만으로 배우는 알파고 제로

조회 수 298 추천 수 0 2017.10.20 02:19:14


지난해 3월 열린 ‘구글 딥마인드 챌린지’에서 이세돌 9단과 알파고가 대국을 하고 있다. 구글 제공

 

https://brunch.co.kr/@madlymissyou/18

 

 

 

이세돌과 커제와 대결할때 알파고는 먼저 프로기사의 기보 3000만건으로 지도학습을 수행하였습니다.

그 다음에 셀프대국으로 강화학습을 하여 인공지능을 향상시켰습니다.

 

얼마전에 발표한 알파고 제로는 지도학습 과정을 빼고 오직 강화학습만 사용했다고 합니다.

그럼에도 이전 알파고 버전보다 훨씬 강하다고 하네요.

 

바둑에서는 인공지능이 거의 끝을 본 것 같습니다.

이제 다음번 목표인 스타크래프트에서 언제쯤 프로게이머를 이길 수 있을지 기대됩니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
모라벡의 역설은 틀렸다? file 깊은바다 2018-06-30 1294
영화 오토마타와 초지능의 탄생 깊은바다 2018-06-04 212
알고리즘 사회, 새로운 사회계약이 필요하다 깊은바다 2018-06-03 92
인공지능과 일자리 file 깊은바다 2018-05-17 182
고독의 시대와 AI 깊은바다 2018-04-01 159
데이터 사이언스 인터뷰 질문 모음집 깊은바다 2018-02-19 912
Prolog로 간단한 추론 프로그램 만들기 깊은바다 2018-02-08 3169
베이지안 추론 깊은바다 2018-01-12 1307
데미스 하사비스가 말하는 AI  - 기계에 깃든 정신 깊은바다 2017-10-25 283
알파고 제로 논문 링크 [1] Khan 2017-10-20 1033
기보 없이 강화학습만으로 배우는 알파고 제로 깊은바다 2017-10-20 298
알아두면 쓸데있는 신기한 인공지능 50선 깊은바다 2017-09-24 608
인공지능과의 사랑 file 깊은바다 2017-09-24 214
알파고를 만든 데미스 하사비스의 카이스트 강연 깊은바다 2017-09-12 230
인공지능이 가져올 변화에 대해 쉽게 설명하는 영상 깊은바다 2017-09-08 265