- AI Dev - 인공지능 개발자 모임
- 정보공유
- 챗봇 딥러닝
MCP를 간단하게 만들어보는 글을 소개해드립니다. 개발자가 MCP 서버를 만들어서 API 목록과 사용방법을 LLM에 설명해줍니다. 사용자는 Claude Desktop이나 Cursor같은 MCP 클라이언트에 MCP 서버를 등록합니다. 그러면 LLM이 해당 MCP를 통해 API를 조작할 수 있습니다.
사실 이런 방식은 이미 2023년 3월에 ChatGPT Plugins로 나왔습니다. 당시에도 상당히 큰 이슈가 되었습니다. 인스타카트 Plugins를 설치하면 ChatGPT에서 인스타카트에 바로 주문할 수 있었습니다. 하지만 아쉽게도 그리 활성화되지 못했는데요.
MCP는 ChatGPT Plugins와 거의 유사합니다. 다만 ChatGPT에 종속되지 않고 오픈소스로 다양한 LLM에서 사용할 수 있도록 공개했습니다. 또한 Plugins처럼 OpenAI에 검수를 받을 필요도 없습니다. 그냥 MCP 서버를 내 MCP 클라이언트에 추가만 하면 쓸 수 있습니다. 최근에는 OpenAI도 MCP를 지원한다고 발표할 정도로 업계 표준으로 자리잡고 있습니다.
작동 원리는 다음과 같습니다. MCP 클라이언트가 MCP 서버에게 API 목록을 요청합니다. 그러면 API 이름과 설명, 사용법이 담긴 정보를 전달합니다. LLM은 이것을 보고 어떻게 API를 호출할지 이해하고 API 호출을 위한 명세를 작성합니다. LLM이 작성한 API 명세로 MCP 서버에 API를 호출하고, 그 결과를 LLM에 넣어 최종 대답을 생성합니다.
최근 OpenAI Operator나 Claude Computer Use같은 에이전트는 직접 웹브라우저를 내장하고 있습니다. 예를 들어, 쿠팡에 주문을 하라고 하면 내장 웹브라우저에서 쿠팡 사이트에 접속합니다. 사이트 이미지를 인식하고 사람처럼 메뉴를 클릭하여 주문까지 완료합니다. 이런 방법이 에이전트에 있어서는 가장 효율적입니다. 쿠팡에서 따로 해야할게 없으니까요.
다만 아직까지 LLM이 이미지만 보고 모든 웹사이트를 완벽하게 이해하지 못합니다. 아직은 시간이 더 필요하죠. 그래서 당장은 MCP 같은 방식이 에이전트에게 필요합니다. 그래야 외부 세계에 접속하여 액션을 수행할 수 있습니다. 단점은 쿠팡 같은 사이트가 자사 서비스에 접근할 수 있는 API를 제공해야 하고, 이 API에 대한 설명을 MCP 서버로 개발해야 한다는 것입니다.
앞으로 1~2년 동안은 MCP가 에이전트를 위한 최적의 도구가 될 것 같습니다. 물론 장기적으로는 웹브라우저를 LLM이 직접 조작하는 방식으로 발전하겠지만요.
< 간단하게 만들면서 이해해보는 MCP >