구글 딥마인드의 데미스 허사비스는 일리야 수츠케버와 함께 가장 뛰어난 AI 연구자입니다. 우리에게는 알파고의 아버지로 잘 알려져있는데요. 작년에는 알파폴드의 성과를 인정받아 노벨 화학상을 수상하기도 했습니다.

3년 전 구글은 ChatGPT에 뒤쳐지면서 코드레드를 발동했습니다. 위기감을 느낀 구글은 구글브레인과 딥마인드로 분산되어 있던 AI 연구조직을 구글 딥마인드로 통합했습니다. 그리고 허사비스가 구글의 AI 최고 책임자가 되어 내부 역량을 집중했습니다. 지금은 오히려 OpenAI가 코드레드를 선언할 정도로 구글이 세계최고의 AI 회사로 성장했습니다.
허사비스는 어릴 때부터 체스 신동이었습니다. 6살에 런던의 U-8 대회의 챔피언이 될 정도였죠. 대회 상금으로 컴퓨터를 처음 구입하고 곧바로 프로그래밍 책을 사서 독학을 합니다. 15살에는 유명한 게임 개발자인 피터 몰리뉴의 회사에 들어가 신디케이트, 테마파크 제작에 참여합니다.

케임브리지대 컴퓨터과학과를 졸업한 후 다시 피터 몰리뉴와 함께 블랙앤화이트란 게임을 만듭니다. 여기서 AI 개발을 담당했는데 당시로서는 혁신적인 기술을 보여줬습니다. 게임내 크리쳐가 사용자로부터 보상과 벌칙을 받으면서 스스로 학습할 수 있었습니다. 주민을 잡아먹으면 벌칙을, 마법으로 주민을 도우면 보상을 주는 식으로 가르칠 수 있었습니다. 물론 그 반대로도 가능했죠. 지금과 같은 강화학습 알고리듬은 아니었고 결정 트리(decision tree)를 실시간으로 생성하는 기법이었습니다. 당시 저도 정말 좋아했던 게임 중 하나였습니다.

그후 독립하여 엘릭서 스튜디오라는 자신만의 게임 개발사를 창업합니다. 7년 정도 운영을 하다 매각하고, 평생의 숙원이었던 인공지능을 공부하기 위해 인지신경과학 박사과정에 진학합니다. 2010년에는 무스타파 슐레이만(현재 MS의 AI 수장), 셰인 레그와 함께 딥마인드를 설립합니다.
2014년에는 DQN(Deep Q-Network)이란 혁신적인 모델을 발표합니다. 제 석사 졸업논문도 Q-Learning을 사용한 강화학습이었습니다. 강화학습은 환경에서 보상이 주어지면 스스로 학습할 수 있는 모델입니다. 당시 보상값 계산을 Q-Table이란 방식을 사용했습니다. N차원의 테이블을 이동하면서 보상값을 업데이트하고 검색했습니다. 하지만 테이블이 커지면 학습이 거의 불가능했습니다. 그래서 간단한 작업이 아닌 현실세계의 복잡한 문제는 해결할 수 없었죠.
DQN은 2012년 제프리 힌튼이 공개한 딥러닝을 Q-Learning에 적용했습니다. 보상값 계산을 테이블이 아닌 딥러닝으로 예측했습니다. 딥러닝의 가장 큰 장점인 일반화 덕분에 상태공간(에이전트가 행동할 수 있는 모든 경우의 수)이 커져도 안정적으로 학습할 수 있었습니다.
딥마인드는 DQN으로 57개의 아타리 게임을 학습하는 모델을 개발했습니다. 물론 당시에도 강화학습으로 게임을 배우려는 시도가 있었습니다. 그러나 상태공간을 줄이기 위해 게임속 데이터들을 모델에 직접 넣어야 했습니다. 주인공과 적의 좌표, 맵의 모양, 현재 점수 등의 데이터를 프로그래머가 따로 추출해서 수치로 변환하는 방식으로요. DQN은 직관적으로 그냥 게임 화면을 그대로 모델에 입력했습니다. 상태공간이 커져도 딥러닝이 게임화면속 패턴을 정확하게 학습했습니다. 덕분에 하나의 모델로 모든 게임에 범용적으로 적용할 수 있었습니다.

딥마인드는 DQN으로 단번에 AI 업계에서 가장 유명한 회사가 되었습니다. 마크 저커버그와 일론 머스크가 인수하려고 시도했지만 허사비스는 중요한 조건을 내걸었습니다. AGI의 위험에 대비하기 위해 윤리위원회를 설치하는 등 안전장치를 마련해야 된다고 요구했습니다. 결국 구글 창업자인 세르게이 브린이 전폭적으로 지원하면서 딥마인드는 구글의 품으로 들어갑니다. 그 다음은 모두가 아는 것처럼 알파고와 알파폴드, 제미나이 등 혁신적인 AI 기술 개발을 주도했습니다.

허사비스는 AGI가 5~10년 이내에 등장할 것이라 예상하고 있습니다. 누가 먼저 거기에 도달할지는 아직 모릅니다. 구글, OpenAI, 메타, xAI, SSI(일리야 수츠케버 설립) 등 글로벌 탑티어 회사들이 치열하게 경쟁하고 있습니다. 딥시크 같은 중국회사들도 마찬가지입니다.
AGI가 아니더라도 내년은 에이전트와 피지컬AI가 우리 사회를 크게 변화시킬 것입니다. 자율주행도 거의 상용화 직전이고요. 제가 오랫동안 꿈꿔왔던 AI의 시대가 이제 바로 눈앞에 있습니다. 그게 유토피아일지 디스토피아일지는 아직 확실하지 않지만요. 개인적으로 너무 흥미롭습니다. 인류 문명의 역사 1만년에서 가장 중요한 시기를 경험하고 있으니까요.
< 2014년 딥마인드 DQN 발표 영상 >
https://www.youtube.com/watch?v=EfGD2qveGdQ