Feature Scaling이 성능에 영향을 주는 경우와 그렇지 않은 경우
🔎CASE1: scaling 여부가 성능에 영향을 주는 경우
💎거리 기반 동작하는 경우
💎cost function이 feature의 범위에 크게 영향을 받는 경우
- logistic regression, lasso, ridge
- cost function에 규제항이 포함된 모델
- 규제항을 포함하면 계수 크기의 L1 혹은 L2합 전체를 규제하게 되므로 cost function이 큰 계수의 값에 영향을 받음
💎cost function이 복잡하고 global optimization(전역 최적값 탐색)이 어려운 모델
- 다층 퍼셉트론
- cost function에 규제항이 없어도 cost function자체를 잘 학습시키는 것이 어려움
- 스케일링하지 않을 시 학습이 오래걸리거나 학습 자체가 잘 이루어지지 않음
🔎CASE2: scaling 여부가 성능에 영향을 주지 않는 경우
💎OLS (최소자승법)
- feature의 범위가 좁아지면 해당되는 feature의 계수값만 비례해서 증가
- 목푯값에 대한 예측값은 동일하게 얻어짐
💎tree계열 모델
💎random forest model