일반 인공지능 - 기보 없이 강화학습만으로 배우는 알파고 제로

글 수 108

조회 수 298 추천 수 0 2017.10.20 02:19:14

깊은바다 *.68.247.188 http://aidev.co.kr/2607

지난해 3월 열린 ‘구글 딥마인드 챌린지’에서 이세돌 9단과 알파고가 대국을 하고 있다. 구글 제공

이세돌과 커제와 대결할때 알파고는 먼저 프로기사의 기보 3000만건으로 지도학습을 수행하였습니다.

그 다음에 셀프대국으로 강화학습을 하여 인공지능을 향상시켰습니다.

얼마전에 발표한 알파고 제로는 지도학습 과정을 빼고 오직 강화학습만 사용했다고 합니다.

그럼에도 이전 알파고 버전보다 훨씬 강하다고 하네요.

바둑에서는 인공지능이 거의 끝을 본 것 같습니다.

이제 다음번 목표인 스타크래프트에서 언제쯤 프로게이머를 이길 수 있을지 기대됩니다.

List of Articles

쓰기

첫 페이지 1 2 3 4 5 6 7 8 끝 페이지