💪XGBoost 기법

장채민·2025년 7월 30일

XGBoost

Gradient Boosting의 강화 버전
결정 트리를 약한 학습기로 사용하며, 여러 개의 약한 모델을 순차적으로 조합해 강력한 예측 모델을 만듦
기존 Gradient Boosting보다 정확도, 속도, 자원 효율성 면에서 크게 향상됨

"이전 모델의 오류를 다음 모델이 보완" 하는 방식으로 학습

🔁 순차 구조 (부스팅의 핵심 원리)
XGBoost는 Gradient Boosting 계열이기 때문에
➤ 트리들은 순차적으로(직렬) 학습해야 함
트리1 → 트리2 → 트리3 → ...

항목	XGBoost의 개선점
학습 속도	트리 내부 병렬 연산 도입으로 속도 향상
일반화 능력	정규화(term: lambda, alpha)와 학습 종료 조건을 도입해 과적합 감소
수학적 개선	손실 함수에 대해 2차 미분(헤시안)까지 활용
결측치 처리	자동으로 결측값 처리 경로를 선택함
조기 종료	일정 에폭 동안 성능 개선 없으면 학습 자동 종료(Early Stopping)
하이퍼파라미터 가이드	수동 조정 요소들에 대한 가이드 존재

파라미터	설명
n_estimators	트리 개수 (기본적으로 많을수록 성능 증가, 과적합 주의)
max_depth	트리 최대 깊이
learning_rate	각 트리의 기여 정도 (작을수록 학습 속도 느리지만 일반화 잘 됨)
subsample	각 트리마다 사용할 샘플 비율 (과적합 방지용)
colsample_bytree	각 트리마다 사용할 피처 비율
lambda, alpha	정규화 관련 (L2, L1)