MCP (1) Tools & Resource

김동하·2025년 12월 30일

MCP

목록 보기

1/5

본격적으로 MCP를 배워보기 위해 Kent 선생님의 Epic AI를 시청 후 학습한 것을 정리해봄

MCP

MCP(Model Context Protocol)란 쉽게 말해 AI 모델을 외부 데이터와 도구에 연결할 수 있도록 설계된 표준 인터페이스다.

MCP는 흔히 AI계의 USB 포트라는 비유를 사용하는데, 즉 LLM이 외부 세상과 연결되는 방식을 표준화한 것이라고 할 수 있다.

그렇다면 MCP가 왜 필요할까?

기존의 LLM을 사용했던 방식을 생각해보면 AI 모델이 외부 데이터에 접근할 수 없기에 프롬프트에 데이터를 매번 복붙하거나, 매 프로젝트마다 새로운 프롬프트가 필요했다.

결국, 이러한 문제점을 MCP라는 표준 인터페이스로 해결하려고 하는 것!

MCP 구성

MCP는 3가지로 구성된다. 호스트, 클라이언트, 서버

호스트는 LLM이 실행되는 환경이다. 보통 개발자가 쓰는 IDE라고 생각하면 된다.

그리고 호스트 내부에 MCP 서버와 통신하는 클라이언트가 존재한다.

여기서 USB 포트인 MCP 인터페이스를 이용하여 MCP 서버와 연결한다. 실제 기능을 제공하는 백엔드다. 이를통해 로컬 파일이나 데이터에 접근하게 된다.

또한, 외부의 데이터까지 접근이 가능하다!

실습을 통해서 MCP 서버를 만들 것이다. MCP 서버는 컨텍스트 상태를 계속 유지하기 위해 MCP 클라이언트와 세션 기반으로 JSON-RPC 양방향 통신으로 이루어진다.

클라와 서버는 어떻게 요청을 주고 받을까? 실습에서는 stdio를 사용한다.

동작 방식 대략 이러하다.

클라가 새로운 프로세스를 생성하여 서버를 실행한다
STDIN/STDOUT 스트림을 통해 JSON-RPC 메시지를 주고받음

실무에서는 HTTP 기반 MCP 서버를 만들지만, 실습에선 stdio를 사용한다. 하지만 내부 동작은 동일하다!

MCP Inspector

우리가 만들 건 MCP 서버다. 그렇다면 서버가 제대로 동작하는지 어떻게 확인할 것인가. 바로 MCP Inspector가 필요하다

MCP Inspector는 MCP 공식팀이 제공하는 디버깅 툴로 위 실습에서는 인스펙터를 통해 서버와 제대로 연결이 되었는지 확인할 것이다.

Tools

MCP에서 가장 큰 기능은 툴이다. MCP에서 툴은 서버가 정의한 함수로, LLM이나 클라 사이드에서 호출이 가능하다. JSON으로 입력을 받고 텍스트, 이미지, 오디오 등 다양한 형태로 반환한다.

툴의 특이한 점으로는 MCP가 어떤 도구를 호출할지 스스로 결정하고, 그 결정한 도구를 인자까지 포함해서 실제로 호출한다는 것이다.

Tools 동작방식

동작 방식은 대략 이러하다

사용자가 프롬프트를 입력하면, 앱이 그 프롬프트를 LLM에 보낸다. 그러면 루프가 돌면서, 그 프롬프트를 바탕으로 도구 호출이 생성된다.

즉 LLM은 프롬프트와 다른 컨텍스트를 바탕으로 사용자의 질문에 맞는 도구를 호출해야 한다고 결정한다.

도구를 호출 전 사용자에게 이 도구를 사용할까? 라고 되묻는다. 이 과정을 human-in-the-loop라고 부른다.

사용자가 확인하면 앱은 그 도구 호출을 클라이언트로 전달하는데, 앱은 LLM이 생성한 인자와 함께 도구 호출 요청을 클라이언트로 넘긴다.

앱은 여전히 그 클라이언트를 관리하고 있으니, 여기서 앱 <-> 클라이언트 사이의 통신은 그 앱이 정한 프로토콜이다.

이제 도구 호출을 받은 클라이언트는 서버로 RPC, 정확히는 JSON-RPC 호출을 보낸다.

서버가 응답하면, 그 결과가 앱으로 다시 전달되고

앱은 그 결과를 LLM에 다시 보내며

LLM은 추가 텍스트를 생성하고, 그 응답이 사용자에게 보여지게 된다.

Tools 생성

도구를 생성하는 방법은 간단하다.

이렇게 MCP 서버에 Tool을 등록하면

MCP Inspector에 정적 도구가 생성된다.

Tools 인자

여기서 인자를 추가해보자.

아까 만들었던 registerTool에 zod로 스키마로 주입한다. zod를 사용하는 이유는 타입 검증과 안정성인데, LLM용 스키마의 역할도 한다.

마지막으로 콜백에 인자를 받아서 return 부분을 수정하면

계산기 기능이 있는 툴이 완성된다. 여기서 중요한 점은 zod에 describe()은 LLM에게 이 도구를 언제 써야 하는지 가르치는 지침이라는 점이다.입력 프로퍼티마다 description을 달아주면 LLM이 훨씬 정확히 사용할 수 있다.

단, zod 스키마를 너무 복잡하게 만들수록, JSON Schema로 변환이 실패할 가능성이 커지기 때문에 입력 스키마는 최대한 단순하게 유지하고, 복잡한 검증은 콜백 함수 안에서 직접 처리하는 걸 권장한다.

Tools 에러 핸들링

이처럼 음수가 들어갔을 때는 에러를 뱉어보려고 한다.

아주 간단하다. 콜백 부분에 예외 처리를 해주면 된다. 이렇게 되면 실제 응답에서 isError: true을 포함하게 되고 MCP TypeScript SDK가 에러 응답 형태로 변환해준다.

호스트 애플리케이션은 이 에러를 LLM에게 전달하면서 방금 시도한 게 실패했고, 이유는 이것이다라는 식으로 알려준다.

사람이 읽을 수 있고, LLM이 파싱 가능한 JSON 구조의 에러는 LLM이 스스로 전략을 세울 수 있도록 한다!

Resources

사용자가 만약 아주 특정한 리소스 선택하려고 할 때를 상상해보자. 예를 들어 index.ts를 편집하려고 했을 때 프로젝트에 index.ts 파일이 수 천개 있을 수가 있다. 그래서 LLM에서 어느 index.ts를 말하는지 정확히 지정해줘야 한다.

즉, 사용자 <-> LLM 커뮤니케이션 레이어를 더 명확하게 해야한다. 이런 방식으로 사용자가 컨텍스트에 포함시키고 싶은 것을 더 구체적으로 지정할 수 있는데, 이것을 우리는 리소스 라고 부른다.

워크플로우

대략적인 워크플로우는 대략적으로 아래와 같다

사용자가 컨텍스트에 포함해달라는 요청을 한다
애플리케이션이 list resources라는 RPC 요청을 호출한다.
클라이언트가 그 요청을 서버로 전달한다.
서버가 사용 가능한 리소스 목록을 모두 돌려주고
클라이언트가 그걸 앱으로 전달한다
사용자는 그중 하나를 보거나 선택하게 된다.

리소스도 결국은 또 하나의 JSON-RPC 요청이다. 리소스를 읽을 때 params에는 해당 리소스의 URI가 들어갑니다.

{
	"jsonrpc": "2.0",
	"id": 2,
	"method": "resources/read",
	"params": {
		"uri": "taco://menu/items/carne-asada"
	}
}

예를 들어 taco://menu-items/carne-asada 같은 URI를 넣고,

{
	"jsonrpc": "2.0",
	"id": 2,
	"result": {
		"contents": [
			{
				"uri": "taco://menu/items/carne-asada",
				"mimeType": "application/json",
				"text": "{\"name\":\"Carne Asada Taco\",\"ingredients\":[\"steak\",\"tortilla\",\"onion\",\"cilantro\"],\"instructions\":\"Grill the steak, chop into small pieces, serve on warm tortillas\"}"
			}
		]
	}
}

응답에서는 요청과 응답을 매칭하기 위한 동일한 ID가 있고, result에는 contents 배열이 들어간다.

여기서 살펴볼 점은 result에 content 내부에"uri": "taco://menu/items/... taco라고 되어 있는 스킴이다. MCP에서 스킴은 중요한 건 일관성이다. 특정 스킴을 이해하는 클라이언트와 통합하는 상황이 아니라면, 스킴 자체가 무엇인지는 큰 문제가 아니다. 중요한 것은