통계적·수학적 규칙을 기반으로 예측하는 모델들.
예시
선형/로지스틱 회귀
결정트리 / 랜덤포레스트
Gradient Boosting (XGBoost, LightGBM, CatBoost)
SVM
KNN
Naive Bayes
클러스터링(K-Means, GMM)
이상탐지(Isolation Forest, One-Class SVM)
특징
구조 단순, 해석력 높음
tabular 데이터에서 강력
대규모 데이터에서는 성능 한계
feature engineering의 영향이 큼
신경망 기반으로 이미지, 텍스트, 시계열 등 비정형 데이터에서 성능이 높은 모델들.
예시
MLP
CNN (ResNet, VGG 등)
RNN/LSTM/GRU
Transformer (BERT, GPT, ViT 등)
Autoencoder
GAN
Neural CF
특징
복잡한 비선형 패턴 학습
GPU 사용
대규모 데이터에서 성능 상승
고차원 입력에 강함
시간 흐름의 패턴을 사용해 미래를 예측하는 모델들.
예시
AR / MA / ARMA
ARIMA
SARIMA / SARIMAX
Holt-Winters
Prophet
HMM
LSTM, Transformer 기반 시계열 모델
특징
시계열 전용 구조
통계 모델은 가볍고 해석력 높음
딥러닝은 장기 패턴 모델링에 강함
공통 특징
X 입력을 기반으로 고정 규칙(트리, 선형식 등) 계산
예측 구조 단순, 빠름
해석력 높음
특징값 기준으로 분기
리프 노드의 클래스/평균값 반환
여러 트리의 예측을 결합
분류: 다수결
회귀: 평균
트리들의 예측을 합산
분류: sigmoid/softmax
회귀: 합산값 그대로
모든 샘플과 거리 계산
가장 가까운 k개 선택해 출력
z = w·x + b
sigmoid(z)로 확률 계산
P(x|y) * P(y) 계산
가장 높은 확률의 클래스 선택
각 가우시안 컴포넌트 확률 계산
최대 확률 컴포넌트 선택
공통 특징
layer stack forward pass
weight * input + activation 반복
이미지, 텍스트, 시계열 모두 처리 가능
Dense layer 반복
마지막 layer
분류: softmax/sigmoid
회귀: linear
convolution → pooling 반복
마지막 FC로 분류
입력 시퀀스를 시간 순서대로 처리
hidden state 누적
마지막 hidden에서 출력
self-attention 기반
multi-head attention → feedforward
마지막 hidden을 softmax 또는 linear로 사용
이미지를 patch로 분리
patch embedding → transformer encoder
CLS 토큰 기반 분류
입력 복원
reconstruction error로 이상 탐지
noise → generator
예측 모델이 아니라 생성 모델
공통 특징
일반적인 X_test 구조 없이 과거 y를 기반으로 예측
다음 시점 예측을 반복해 multi-step 생성
yt = c + φ1 y{t-1} + ...
yt = c + θ1 ε{t-1} + ...
AR + MA 조합
1) 차분
2) ARMA 예측
3) 역차분
기본: LightGBM / XGBoost
범주형 많으면: CatBoost
설명력 필요: Logistic / Tree
기본: CNN
고성능: ViT
경량: EfficientNet-lite
기본: Transformer
데이터 적으면: Logistic + TF-IDF
안정성: ARIMA / Prophet
장기 패턴: LSTM / Transformer
실전 조합: LSTM + XGBoost
baseline: Logistic
고성능: XGBoost/LGBM
비정형: CNN/RNN/Transformer
baseline: Linear
고성능: XGBoost
시계열: LSTM / Transformer
Isolation Forest
Autoencoder
LSTM Autoencoder
ALS
Neural CF
Embedding + ANN 검색
LightGBM 한계 → CatBoost로 교체
CNN 성능 한계 → ViT로 교체
ARIMA 한계 → LSTM 추가한 hybrid
SVM 연산 과다 → Logistic/XGB로 교체
선형 회귀 성능 부족 → XGBoost로 교체