강화학습 - 딥마인드의 게임을 학습하는 딥러닝 인공지능

글 수 27

딥마인드의 게임을 학습하는 딥러닝 인공지능

조회 수 1164 추천 수 0 2016.03.21 00:25:04

깊은바다 *.68.247.188 http://aidev.co.kr/389

http://robohub.org/artificial-general-intelligence-that-plays-atari-video-games-how-did-deepmind-do-it/

http://techholic.co.kr/archives/11586

얼마전에 구글이 DeepMind라는 영국의 한 회사를 5억달러라는 엄청난 액수로 인수하였습니다. 페이스북도 이 회사를 차지하기 위해 많은 노력을 하였는데 결국 구글의 승리로 끝났습니다.

왜 IT 업계의 최고 두 회사가 직원수 75명밖에 안되는 이 작은 업체를 차지하기 위해 경쟁을 하였을까요. 그 이유는 이곳이 바로 세계에서 딥러닝으로 가장 유명한 회사이기 때문입니다.

DeepMind에서 최근에 발표한 기술을 소개해 드리겠습니다. 딥러닝 알고리즘을 이용하여 아타리 게임을 학습하는 인공지능입니다.

게임방법을 학습하는 것은 이전에도 많이 연구되었습니다. 지금까지는 프로그램내에서 정보들을 따로 가공하여 학습을 수행하였습니다. 게임내에 존재하는 캐릭터나 오브젝트들을 데이터로 뽑아내고 이를 학습 알고리즘에서 처리하였습니다.

하지만 이번 발표에서 가장 놀라운 점은 화면 이미지만을 가지고 학습을 한다는 것입니다. 신경망의 입력으로 화면 각 좌표의 색이 주어지면 상하좌우, 버튼 등의 조작이 결과로 출력됩니다.

여러개의 게임을 학습하였지만 각 게임을 위해 따로 처리를 하지 않고 모두 동일한 알고리즘을 사용하였습니다. 이것은 이러한 딥러닝 기법이 여러 분야에서 일반적으로 사용될 수 있음을 의미합니다.

또 하나 주목할 점은 딥러닝에 강화학습을 적용하였다는 것입니다. 신경망은 감독 학습을 할때는 입력과 출력의 데이터셋이 필요합니다. 어떠한 입력이 들어왔을때 올바른 행동을 알려주어야 그에 맞는 학습을 할 수 있습니다.

하지만 이러한 데이터셋을 구하기가 어렵다는 것이 신경망의 단점 중 하나입니다. 또한 만들 수 있다고 해도 그만큼 많은 노력과 시간이 들 수 밖에 없습니다. 만약 데이터셋이 없이 스스로 알아서 학습을 할 수 있다면 구현이 쉽고 범용적으로 사용될 수 있습니다.

DeepMind에서는 이를 위해서 강화학습이란 기법을 통해 해결하였습니다. 어떤 행동을 하였을때 보상과 벌칙을 부여하고 이를 기반으로 신경망의 가중치를 조정한다고 합니다.

예를 들면 게임에서 높은 점수를 얻을때 보상을 주고 게임이 끝나면 벌칙을 주는 방식입니다. 위의 동영상을 보면 여러번의 학습이 수행된 후에 사람보다 더 게임을 잘하는 것을 볼 수 있습니다.

지금까지 나온 여러가지 인공지능 기법중에서 이 기술이 가장 사람과 비슷하지 않을까 생각됩니다. 각각의 문제에 맞게 다시 구현할 필요없이 한번 만들어 놓으면 이를 일반적으로 적용할 수 있습니다. 또한 인간과 마찬가지로 경험에 따른 시행착오를 통해 스스로 학습이 가능합니다.

확실히 딥러닝이 인공지능 분야에서 가장 유망한 기법 중 하나가 될 것 같습니다. 앞으로 구글이 이 기술을 어떻게 사용할 지 궁금합니다.

< 인공지능 개발자 모임 >

- 페이스북 그룹에 가입하시면 인공지능에 대한 최신 정보를 쉽게 받으실 수 있습니다.

- https://www.facebook.com/groups/AIDevKr/

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
알아두면 쓸데있는 신기한 강화학습	깊은바다	2017-08-24	1271
알파고를 탄생시킨 강화학습의 비밀	깊은바다	2017-06-25	976
신경망 Q-Learning으로 구현한 오목 게임	깊은바다	2017-03-29	16187
강화학습 Q-Learning과 DQN에 대한 설명	깊은바다	2017-03-27	10075
텐서플로우에서 DQN 강화학습으로 캐치게임 구현	깊은바다	2017-03-18	21593
딥 강화학습으로 퐁 게임 학습	깊은바다	2017-03-13	2150
딥 강화학습 쉽게 이해하기 [2]	깊은바다	2017-02-28	2070
딥러닝 강화학습으로 둠 게임 구현	깊은바다	2017-02-28	836
강화학습 기반의 지능적인 가상캐릭터	깊은바다	2016-03-24	809
강화학습 기반의 자율적인 행동 학습	깊은바다	2016-03-24	2740
MDP 기반의 스케줄링 구현 [1]	깊은바다	2016-03-24	2360
딥마인드의 게임을 학습하는 딥러닝 인공지능	깊은바다	2016-03-21	1164

쓰기

첫 페이지 1 2 끝 페이지