시작하기
- Agentic AI 가 요즘 화제이다. 커서, n8n, manus 등 새로운 형태의 서비스들이 하나씩 등장하고, 여러 기업들이 Agent 를 개발했다는 기사를 내고 있다.
- Agent 는 llm 으로 사람의 업무를 자동화하는 건데, 개발자로서 내 업무를 자동화할 수 없을까?
- LangGraph 와 MCP 를 활용해서 개발자 업무를 자동화해 보자.
- 또, 이렇게 개발한 Agent 를 나를 비롯한 동료 개발자들과 같이 써 보자.
테스트 인프라 환경 구성
- 간단한 웹서비스와 모니터링 환경을 terraform 으로 배포하자.
MCP 도구 선택
- MCP 도구란 에이전트가 업무를 하기 위해 사용하는 도구를 뜻한다.
- 회사에서 내 업무를 생각해 보면, 소스코드를 개발하고 github + argocd 로 CI/CD 를 하고, k8s 에서 띄워서 모니터링 도구로 운영하는 것이다.
- 이 과정을 오픈소스로 할 수 있는데, 오픈소스 MCP 도구를 구성해서 에이전트에게 쥐어 주자.
가드레일
정말로 swagger.ts 파일의 모든 내용을 지우고, 모든 API 정의(기본 정보, 스키마 포함)를 각 라우트 파일의 @openapi 주석 또는 app.ts의 Swagger 초기화 옵션으로 옮기시겠습니까?
이 작업은 상당한 변경을 수반하며, 각 라우트 파일의 @openapi 주석이 매우 복잡해질 수 있다는 점을 다시 한번 말씀드립니다. 진행을 원하시면 알려주세요.
에이전트 테스트
- ML 모델은 테스트셋에 대해 정확도의 F1 스코어를 높임으로써 테스트할 수 있다.
- 정해진 답이 없는 에이전트는 어떻게 테스트해야 할까?
- 더 나아가, TDD 와 같은 개발 방법론이 에이전트 개발에는 어떻게 적용될까.
앞으로 어떻게 발전될까?
- 2025 현재의 에이전트 애플리케이션들은 주로 챗봇으로 상호작용한다.
- 그러나 현실에서 사람들은 음성과 시각정보로 상호작용한다.
- 따라서, 앞으로 에이전트는 사람과 음성과 시각정보 (+ 무언가 다른 메커니즘 등)로 상호작용할 것이다.
- 얼마전에 Google I/O 에서 Gemini Live API 가 개선되었다고 나왔는데, 이러한 기술들이 기반기술이 될 것이다.
- 기업들의 안내 전화, 인포데스크, 콜센터, 키오스크, 스마트폰 비서, XR 기기 등 다양한 시스템에 음성/영상 기반의 에이전트 애플리케이션이 도입될 거 같다.
- 관련된 개발자 직무도, FE (보이스/영상 인터랙션), BE (에이전트 로직) 으로 나뉘지 않을까?