레플리
글 수 108

기보 없이 강화학습만으로 배우는 알파고 제로

조회 수 298 추천 수 0 2017.10.20 02:19:14


지난해 3월 열린 ‘구글 딥마인드 챌린지’에서 이세돌 9단과 알파고가 대국을 하고 있다. 구글 제공

 

https://brunch.co.kr/@madlymissyou/18

 

 

 

이세돌과 커제와 대결할때 알파고는 먼저 프로기사의 기보 3000만건으로 지도학습을 수행하였습니다.

그 다음에 셀프대국으로 강화학습을 하여 인공지능을 향상시켰습니다.

 

얼마전에 발표한 알파고 제로는 지도학습 과정을 빼고 오직 강화학습만 사용했다고 합니다.

그럼에도 이전 알파고 버전보다 훨씬 강하다고 하네요.

 

바둑에서는 인공지능이 거의 끝을 본 것 같습니다.

이제 다음번 목표인 스타크래프트에서 언제쯤 프로게이머를 이길 수 있을지 기대됩니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
간단히 정리하는 인공지능의 역사 file 깊은바다 2017-03-15 11045
퍼지를 이용한 인공지능 깊은바다 2016-03-25 7660
퍼지논리를 사용한 속도제어 구현 file 깊은바다 2016-03-25 4051
인공지능 관련 테드(TED) 강연 목록 file 깊은바다 2019-10-05 4050
지대넓얕 팟캐스트 AI와 영생 - 특이점이 온다 깊은바다 2017-05-02 3985
Prolog로 간단한 추론 프로그램 만들기 깊은바다 2018-02-08 3169
인공지능과 자의식 깊은바다 2017-03-19 2554
우리나라 AI 기업 현황 조사 보고서 [1] 깊은바다 2017-06-30 1688
인공지능이 의식을 가질 수 있는가 file [2] 깊은바다 2017-09-05 1616
인공지능과 엔트로피 깊은바다 2019-09-18 1579
딥러닝이 상식에 취약한 이유 file 깊은바다 2021-08-21 1577
인공지능 설계 순서 깊은바다 2020-01-12 1546
강인공지능의 출현 시기 file 깊은바다 2018-10-25 1462
베이지안 추론 깊은바다 2018-01-12 1307
모라벡의 역설은 틀렸다? file 깊은바다 2018-06-30 1294