Instruction Tuning은 모델이 사용자의 지시(instruction) 를 잘 이해하고 따르도록 만드는 학습 방식입니다.
목적: 사람의 명령을 자연스럽게 수행할 수 있게 함
방법:
“질문(Instruction) → 답변(Response)” 형태의 대규모 데이터로 학습
예시:
결과:
👉 쉽게 말해, 대화형·일반적 사용성 강화에 초점이 맞춰져 있습니다.
Dense Fine-tuning은 상대적으로 작은 dense(밀집 구조) 모델의 특정 능력을 강화하는 방식입니다.
목적: 소형 모델을 특정 분야(예: 수학 추론, 과학 문제 해결)에 최적화
방법:
결과:
| 구분 | Instruction Tuning | Dense Models Fine-tuning |
|---|---|---|
| 학습 목적 | 지시를 잘 따르는 법 학습 | 특정 능력(추론·분야 전문성) 강화 |
| 데이터 형태 | Instruction → Response | Teacher 모델의 reasoning 데이터 |
| 대표 기법 | 대규모 instruction 데이터 학습 | Knowledge Distillation + Fine-tuning |
| 결과 | 사용자 친화적 모델 | 작지만 강력한 특화 성능 |
| 비유 | 네비게이션 설치 → 길 잘 알려줌 | 엔진 튜닝 → 작은 차도 고성능 주행 |
최근 발표된 DeepSeek-R1은 reasoning에 특화된 Teacher 모델로,
Dense Models Fine-tuning의 데이터 생성기 역할을 하면서 주목받고 있습니다.
앞으로는 Instruction Tuning + Dense Fine-tuning을 함께 활용하는 하이브리드 학습 전략이 중요해질 가능성이 큽니다.