GPT-4o와 구글 I/O를 보고 느낀 점. 또 한번 엄청난 변화가 일어나고 있습니다.
첫째, 멀티모달이 새로운 표준이 됩니다. 텍스트와 음성, 이미지가 하나로 통합되었습니다. 각각 별도의 모델을 거치는게 아니라 한 모델에서 입력과 출력이 동시에 지원됩니다. End-to-end가 가능하기 때문에 속도가 훨씬 빨라지고 이해력도 높아졌습니다.
둘째, API 가격이 급격히 떨어집니다. GPT-4o는 기존 GPT-4-turbo보다 2배 저렴합니다. 게다가 토크나이저의 한글 성능이 1.7배 높아졌습니다. 결국 3.4배 더 싸진 셈입니다. 구글도 Genimi 1.5 Flash를 선보였습니다. 저렴한 경량화 모델인데 성능은 크게 차이가 없습니다. 오픈소스 LLM의 가격 경쟁력이 점점 악화되고 있습니다. 개인정보나 보안 등 특수한 영역에서만 제한적으로 사용될 가능성이 높습니다.
셋째, 감성대화 능력이 중요해집니다. Claude3는 GPT-4와 달리 감성적인 대답으로 크게 주목을 받았습니다. GPT-4o의 음성 대화 역시 정말 놀라웠습니다. 감정을 그대로 표현하며 웃고 즐거워하고 노래도 불러줍니다. 시리의 사무적이고 단조로운 대답은 이제 과거의 유물이 됐습니다. 영하 Her의 테오도르처럼 AI와 사랑에 빠지는 사람이 점점 늘어날 것입니다.
넷째, 국산 LLM의 소버린 AI가 필요합니다. 한국이 과연 빅테크의 발전 속도를 따라잡을 수 있을지 의문이 듭니다. 그렇다고 외산 LLM에 종속되어 버리면 국가 주권 및 경제적 손실이 너무 큽니다. 한컴이 MS의 공격을 이겨낸 것처럼 최소한 정부 및 공공기관에서 적극적으로 국산 LLM을 지원해야 합니다. 또한 아직 외산 LLM은 감성 대화 능력이 떨어집니다. 실생활에서 쓰이는 날 것의 한글 데이터를 국내 업체들이 독점하고 있기 때문입니다. 국산 LLM이 엔터테인먼트, 게임, 멘탈헬스케어 등 감성 대화가 중요한 분야에 집중하는 것도 좋은 방법입니다.
다섯째, AI 애플리케이션의 시대가 옵니다. 점점 빅테크와 기술 경쟁은 어려워지고 있습니다. OpenAI가 한 번 발표할 때마다 스타트업 수백곳이 망한다는 말이 더이상 농담처럼 들리지 않습니다. 결국 서비스에 집중해야 합니다. API 가격이 계속 떨어진다면 LLM을 도입한 애플리케이션도 조만간 손익분기점을 넘을 수 있습니다. 모바일 시대의 틱톡처럼 AI Native한 앱도 곧 등장하리라 봅니다.
지금이 새로운 기회라는 것은 분명합니다. 다만 예전과 달리 빅테크들의 시장 지배력이 더 높아질 듯 합니다. 그래도 그들이 못하는(또는 안하는) 영역도 많으니까요. 다들 자신만의 분야를 찾아 건승하시길 바랍니다.