Ai agent 라는 말을 올해 많이 들어봤다. 하지만, 구체적으로 Agent가 무엇인지 알지는 못햇다.
단순히 Cursor, Claude Code 같은 AI 코딩 도구에 Agent 모드가 있는 정도만 알았었다.
이번 오픈 미션을 진행하면서 AI agent가 무엇인지 명확히 이해해야 했고,
이번 기회에 LLM, AI agent의 차이점, 그리고 AI workflow는 무엇인지 정리해보려고 한다.
LLM은 Large Language Model의 약자로, 대형 언어 모델을 의미한다.
가장 유명한 것들:
2025년 현재 AI 붐, AI 생태계의 주 원동력이자 가장 밑바탕이 되는 모델이다.

LLM은 만능이 아니다. LLM은 대규모 데이터에서 패턴을 학습해 확률적으로 다음 내용을 예측한다. 최근 LLM은 데이터를 정말 많이 모아 학습시키기 때문에 유사 검색엔진 같은 역할을 수행하지만, 이것에도 한계가 존재한다.
LLM의 한계를 정리하면 다음과 같다.
LLM이 아무리 인터넷에 있는 텍스트를 다 읽어봤다고 해도, 다음과 같은 정보는 알 수 없다:
예시:
질문: "내일 내 구글 캘린더에 무슨 약속 잡혀 있지?”
답변: "죄송합니다. 사용자의 개인 정보에는 접근할 수 없습니다."
방대한 데이터를 학습했지만 개인적인 정보나 회사 내부 정보 같은 독점적인 정보는 모른다. 또는 모르지만 아는 척을 한다.
우리가 뭘 시키기 전까지는 아무것도 하지 않는다. 우리가 프롬프트를 입력 해야만 반응한다.
LLM의 특징:
이게 기본적인 LLM의 특징이다. 만약 쌩 LLM API를 사용한다면 이와 같은 특징을 자주 발견할 수 있을 것이다.
위에서 다룬 LLM의 한계를 좀 보완해보자 하고 나온 게 AI 워크플로우이다.
쉽게 말하면, LLM에게 일하는 순서 또는 작업 지침을 우리가 미리 정의해 주는 것이다.
그냥 LLM에게 "내일 내 캘린더 일정 알려줘" 하면 LLM은 원하는 답을 하지 못한다.
하지만 다음과 같은 워크플로우를 설정해둔다면?
워크플로우 설정
만약 사용자가 일정에 대해 물어보면:
1단계: 무조건 사용자의 구글 캘린더에 먼저 접속해서 데이터를 가져온다
2단계: 그 데이터를 바탕으로 답변을 생성한다

이렇게 인간이 미리 정의하는 경로(컨트롤 로직)를 LLM에게 따로 지시하는 것이다.
이렇게 해두면 다음번에 제가 "내일 일정 어때?"라고 물었을 때:
1. LLM은 우리가 설정해둔 경로대로
2. 구글 캘린더 정보를 가져와서
3. "내일은 오후 3시에 AI 스터디가 있으십니다"
하고 정확한 답변을 할 수 있다.
캘린더를 보도록 하는 작업 흐름(워크플로우)을 만들어 준 것이다.
이 워크플로우는 여러 단계로 구성될 수 있고 외부 도구를 붙여서 쓸 수도 있다.
예를 들어보자. 최근에 쓰레드를 보면, 가끔 AI가 주기적으로 정보를 수집해 글을 올려주는 계정이 존재한다. 그런 AI는 다음과 같은 워크플로우를 따른다. (예시)
1. 특정 주제에 대한 최신 뉴스 기사를 수집
2. 구글 시트에 자동으로 모아주기
3. Gemini AI로 요약
4. Claude AI를 이용해서 LinkedIn, Twitter, Instagram에 올릴 게시물 작성
5. 이 모든 과정을 매일 아침 8시에 자동으로 실행
(n8n 같은 툴을 이용해서 이런 걸 자동화하는 사람들이 많다.)
AI 워크플로우는 어디까지나 인간이 미리 설정한 경로(컨트롤 로직)에 따라서만 움직인다.
이게 바로 AI 워크플로우의 가장 근본적인 특징이다. 기술적으로는 이 경로를 컨트롤 로직이라고 부른다.
만약에 제가 아까 그 경로에 "날씨 정보 가져오기" 단계를 안 넣어놨다면, LLM은 절대로 스스로 날씨 정보를 가져와서 알려주지 않는다. 그냥 시키는 대로 정해진 길로만 간다. (툴로 워크플로우를 강제해둠)
아무리 이 워크플로에 단계를 수백, 수천 개 추가해서 엄청나게 복잡하게 만들어도, 이 모든 작업 단계를 정의하고 어떤 순서로 실행할지, 어떤 도구를 쓸지 최종적으로 의사결정을 하는 주체가 인간이라면 그건 100% 그냥 AI 워크플로우이다. AI 에이전트가 아니다.
LLM이 등장하고 떠오른 기술. 이제는 RAG는 무조건 깔고 가지 않을까 싶다.
RAG란?
RAG의 프로세스
1. AI 모델이 답변을 생성하기 전에
2. 우리가 미리 저장해둔 외부 데이터베이스나 문서 같은 곳에서
3. 관련 정보를 검색해서 가져온 다음
4. 그 정보를 참고해서 더 똑똑하고 정확한 답변을 생성
아까 LLM이 구글 캘린더 정보 가져오도록 설정하는 거랑 비슷하다.
말하고 싶은 것은, RAG도 결국엔 사람이 "이거 참고해라"고 정해준 워크플로우의 한 종류이다.
AI 워크플로우, 좋긴 한데 여전히 한계는 있다.
예시 상황:
아까 그 뉴스 기사 요약해서 소셜 미디어에 게시물을 만드는 워크플로우를 돌렸는데 결과물이 마음에 안들 수 있다.
ex. 문제점
해결 방법
인간이 직접 손을 본다.
과정
1. Claude AI에게 줬던 프롬프트를 수정
2. 다시 돌려보고
3. 만족스러운 결과를 얻기 위한 반복 작업
인간이 직접 반복작업을 수행해야 하는게 AI 워크플로우의 한계이다.
AI 워크플로우가 진짜 AI 에이전트로 진화하려면 딱 한 가지 엄청난 변화가 필요하다.
그건 바로 이전까지 모든 의사결정을 내렸던 인간의 역할을 LLM이 대신하게 하는 것이다.
이게 AI 에이전트와 워크플로우를 가르는 가장 결정적인 차이점이다.
AI 에이전트는
AI 에이전트는 목표를 달성하기 위한 최적의 접근 방식을 스스로 생각하고 계획한다.
**예시 시나리오:**
목표: "최신 AI 뉴스 기사들을 모아서 요약하고, 그걸 바탕으로 주간 뉴스레터를 작성해서 발송해줘"
**AI 에이전트의 사고 과정:**
- 뉴스 기사들을 모으는 가장 효과적인 방법이 뭘까?
- 그냥 구글 검색해서 하나하나 복사 붙여넣기를 할까?
- 아니야, 그건 너무 비효율적이다
- 차라리 뉴스 API를 활용하거나
- 특정 웹사이트들을 정기적으로 크롤링해서 링크만 수집하는 게 낫겠다
- 요약은 어떤 모델을 쓰는 게 좋을까?
- 뉴스레터 형식은 어떤 게 구독자들이 보기에 편할까?
이런 식으로 목표 달성을 위한 전략을 스스로 짠다. 가장 효율적이고 합리적인 방법을 스스로 찾아낸다.
생각만 하고 끝나면 안 되겠죠. AI 에이전트는 자기가 세운 계획을 실행시키기 위해서 실제로 여러 도구들을 사용해 작업을 수행한다.
**뉴스레터 예시:**
- 뉴스 수집: Google News API 사용
- 요약: 최근에 나온 고성능 LLM 모델 사용
- 뉴스레터 발송: SendGrid API를 연동해서 처리
이런 식으로 적절한 도구들을 선택하고, 그 도구들을 활용해서 실제 업무를 처리한다. 마치 사람이 컴퓨터를 사용하듯 말이다.
예를 들어서
AI 에이전트는:
1. 자기가 수행한 작업의 중간 결과를 스스로 관찰하고
2. 만약에 개선이 필요하다고 판단되면
3. 자율적으로 프로세스를 반복하고 수정한다.
AI 워크플로우와의 차이:
**예시:**
상황: 뉴스레터 초안을 작성했는데...
AI 에이전트의 판단:
"이 부분은 설명이 좀 부족한 것 같다"
"독자들이 이해하기 어렵겠다"
AI 에이전트의 행동:
1. 그 부분을 보충하기 위해 추가 정보를 검색
2. 다른 LLM을 활용해서 문장을 다듬기
3. 개선 작업을 자율적으로 수행
이 과정은 만족스러운 결과가 나올 때까지 계속될 수 있다. 스스로 피드백하고 개선한다.
AI 에이전트의 핵심은, 이런 동일한 작업을 사람의 개입 없이 자율적으로 수행할 수 있다는 것이다.

이런 에이전트를 만드는 가장 흔한 방식 중 하나가 ReAct 프레임워크이다.
ReAct?
이 두 가지 핵심 동작의 앞글자를 따서 ReAct라고 부른다.
ReAct 프레임워크에 대해서는 다음 게시글에서 구체적으로 다뤄보겠다.