- AI Dev - 인공지능 개발자 모임
- 정보공유
- 일반 인공지능
GPT-4o의 이미지 생성 기능이 업데이트되면서 전세계를 강타했습니다. 페이스북 피드 역시 다양한 생성 이미지들로 도배가 되었는데요. 대화식으로 하기 때문에 미드저니 같은 이미지 생성 툴보다 훨씬 편리하게 사용할 수 있습니다. 예전 GPT-3에서 ChatGPT로 대중화되던 순간과 비슷합니다.
GPT-4o 이미지 생성이 무료 사용자에게도 풀리면 사람들이 받는 충격은 훨씬 커질 것입니다. 도표를 그리거나 웹툰처럼 이미지 안에 바로 텍스트를 넣을 수도 있습니다. 당장 실생활에 사용할 수 있을 정도의 수준입니다. SNS 짤 만드는데도 너무 유용하고요.
영상을 생성하는 OpenAI Sora는 지금 별도의 사이트에서 실행해야 합니다. ChatGPT에 통합되어 대화로 만들 수 있게 되면 또 한번 세상에 큰 변화를 가져올 것입니다. 지금도 릴스나 숏츠에는 Kling 같은 툴로 생성한 AI 영상이 큰 인기를 얻고 있습니다. 누구나 ChatGPT로 쉽게 영상을 만들 수 있게 된다면 어떨까요. SNS의 거의 절반 이상이 AI 콘텐츠로 넘쳐날지도 모릅니다.
최근 클로드의 MCP가 빠르게 표준으로 자리잡고 있습니다. 경쟁사인 OpenAI도 지원하기로 결정할 정도입니다. 에이전트가 사람의 일을 대신하려면 현실 세계에 직접 액션을 해야 합니다. MCP가 바로 그 역할을 하게 됩니다. 엑셀 MCP는 엑셀을 조작하고, 노션 MCP는 노션 문서에 접근할 수 있습니다. 기존 서비스들이 외부 API를 제공하면 이를 MCP로 만들어 에이전트와 소통할 수 있습니다.
얼마전 나온 구글 제미나이 2.5는 역대 최고의 성능을 자랑합니다. GPT-5도 올해 상반기 안에 선보일 예정입니다. 로봇 역시 마찬가지입니다. 젠승 황은 로봇이 ChatGPT 모먼트에 도달했다고 선언했습니다. 공장에서 일을 하거나 집에서 요리나 빨래를 하는 로봇도 멀지 않았습니다.
올해는 AI가 본격적으로 상용화되기 시작할 것입니다. 에이전트와 로봇이 세상을 바꾸고 있습니다. 기존 ChatGPT는 질문에 대답만 하는 수동적인 모델입니다. 항상 사람이 중간에 개입해야 해서 한계가 있었습니다. 웹 검색 말고는 외부와 소통할 수도 없었고요. 에이전트나 로봇은 사람이 일만 시키면 직접 현실에 뛰어들어 혼자 결과를 만들어냅니다. 이 둘의 차이는 어마어마합니다.
세상이 정말 빠르게 변하고 있습니다. 이 거대한 흐름을 먼저 받아들이고 올라타야 합니다. 개인이든 기업이든지요.