LLM을 활용해 특정 분야에 특화된 응답을 원할 때 선택할 수 있는 대표적인 방식은 다음 두 가지다:
두 방식은 접근 방식, 목적, 유지보수 방법이 다르며, 상황에 따라 적절한 선택이 필요하다.
외부 지식(DB, 문서, 검색 결과 등)을 LLM에게 실시간으로 “읽혀주는” 방식
graph LR
A[사용자 질문] --> B[문서 검색 시스템]
B --> C[관련 문서]
C --> D[LLM + Prompt에 삽입]
D --> E[답변 생성]
특정 데이터를 모델의 내부 파라미터에 학습시켜, 지식을 내재화하는 방식
| 항목 | RAG | 파인튜닝 |
|---|---|---|
| 목적 | 실시간 최신 정보 반영 | 도메인 지식 내재화 |
| 응답 신뢰도 | 문서 품질에 따라 다름 | 데이터 품질에 따라 다름 |
| 학습 필요 여부 | ❌ 없음 | ✅ 필요함 |
| 응답 일관성 | 문서 기반이라 변화 가능 | 일관성 높음 |
| 개발 복잡도 | 검색 시스템 필요 | 학습 인프라 필요 |
| 유지보수 | 문서만 갱신하면 됨 | 재학습 필요 |
| 예시 | 고객센터, FAQ, 매뉴얼 응답 | 회의 요약, 코드 자동화, 업무 응답 |
📝 예시:
📝 예시:
💡 가능하다. 실제로 많은 시스템은 RAG + Fine-tuning을 병행한다.
graph TD
A[사용자 입력] --> B[RAG로 관련 문서 검색]
B --> C[Fine-tuned LLM에 삽입]
C --> D[도메인 특화 응답 생성]
| 목적 | 추천 방식 |
|---|---|
| 최신 정보 반영 | ✅ RAG |
| 도메인 전문성 확보 | ✅ 파인튜닝 |
| 문서만 자주 바꾸면 되는 경우 | ✅ RAG |
| 같은 스타일로 계속 응답해야 하는 경우 | ✅ 파인튜닝 |
| 빠른 개발 필요 | ✅ RAG |
| 고성능 정제된 응답 필요 | ✅ 파인튜닝 |