[ML] 지도학습 - 회귀(1): 단일 모델

YulLeaf·2026년 2월 24일

학습일지

목록 보기

5/8

: 출력값이 연속형 숫자(value)인 지도학습

입력 x로부터 예측값 ŷ를 만드는 과정
- 집의 특성 x(면적, 역세권, 층수) -> 예측 집값 ŷ=7.3억
- 내일 날씨 특징 x(기압, 습도) -> 예측 기온 ŷ=28.4°C
종류
- 입력 기준
  - 단변량 회귀: 입력 x가 1개
  - 다변량 회귀: 입력 x가 여러 개
- 출력 개수 기준
  - 단일 출력 회귀: 예측값 y가 하나
  - 다중 출력 회귀: 한 번에 여러 개의 숫자 예측
- 출력 분포 기준
  - 일반 연속값: y가 연속형 숫자(온도, 키, 점수)
  - 카운트 데이터(Poisson Regression): y가 0개 이상 정수
    - 음수가 나올 수 없고 평균이 커질수록 분산도 커짐
    - λ=exp(w⋅x)
    - 예) 주문 건수, 방문 수, 사고 발생 횟수
  - 금액형 데이터(Tweedie): 대부분이 0인 데이터
    - 발생하면 양수 연속값이고 분산이 매우 큼
    - Poisson + Gamma 성질을 섞은 분포
    - 예) 보험 청구 금액, 광고 클릭 후 결제 금액, 손해액

문제 상황: 0 ~ N억(집값), long-tail(매출), 양수만 존재, 분산 커짐
해결: log1p 변환(y’ = log(1 + y))
- 큰 값의 영향 줄이고, "비율 오차"에 가까운 최적화가 됨
- 예측 후에는 expm1로 되돌림
- log 변환은 0/음수 처리를 설계해야 함(0이면 log1p, 음수면 다른 변환/모델링 필요)

로지스틱 회귀랑 똑같이 점수 만드는 구조 (다만, 분류처럼 sigmoid 확률로 바꾸지 않고 그 점수가 곧 예측값)

회귀에서는 다중공선성(피처끼리 비슷함)이 자주 터지는데 Ridge가 안정적으로 잡아줌.

Ridge(L2): 가중치 전체를 조금씩 줄여 안정화
Lasso(L1): 일부 가중치를 0으로 -> 피처 선택
ElasticNet(L1+L2): 둘 섞어서 타협

피처 많고 상관 강하면 Ridge/ElasticNet이 편함
"설명 가능한 소수 피처"를 뽑고 싶으면 Lasso가 유용

: 예측선 주변에 '허용 오차 폭 ε’(엡실론)을 두고, 그 안의 오차는 "0으로 치고" 무시하면서 모델을 최대한 단순하게(너무 요동치지 않게) 만드는 회귀

ε 오차 - ε-insensitive loss
- 회귀에서 보통 오차가 0이 아니면 무조건 벌점인데 작은 오차까지 다 맞추려다 모델이 흔들릴 수 있으니, 엡실론 안쪽 오차는 벌점 0으로 함.
- 예시 (ε=2)
  - 정답 100, 예측 101 -> 오차 1 (ε 안) -> 벌점 0
  - 정답 100, 예측 98 -> 오차 2 (ε 안) -> 벌점 0
  - 정답 100, 예측 95 -> 오차 5 (ε 밖) -> 벌점 발생 (5-2=3만큼만)
ε-튜브: 예측함수 ŷ(x) 주위로 위아래 ε만큼 띠(튜브)를 만든다고 생각하면 됨.
- 튜브 안: "맞춘 걸로 치자"
- 튜브 밖: 벗어난 거리만큼만 벌점
핵심 파라미터
- ε: 허용 오차 폭
  - 커지면: 더 많이 무시(관대) -> 매끈하지만 디테일 놓침(편차 큼)
  - 작아지면: 더 엄격 -> 디테일 맞추려다 흔들릴 수 있음(분산 큼)
- C: 튜브 밖 점에 대한 벌점 세기
  - 커지면: "튀어나온 점 무조건 맞춰!" -> 과적합 위험 증가
  - 작아지면: "좀 틀려도 돼" -> 더 부드러워짐. 과소적합 위험 증가

항목	설명
스케일링	필수에 가깝다. SVR은 내적/거리 기반이므로 피처 스케일에 매우 민감. StandardScaler/MinMaxScaler 권장
이상치 확인	ε-튜브 밖 점에 벌점이 가므로 극단값이 많으면 C 조정 필요
커널 선택	Linear → 단순/빠름, RBF → 비선형/느림, gamma 조정 필수