Feature Scaling이 성능에 영향을 주는 경우와 그렇지 않은 경우

Oni·2023년 9월 3일
0
post-custom-banner

🔎CASE1: scaling 여부가 성능에 영향을 주는 경우

💎거리 기반 동작하는 경우

  • KNN
  • 군집 분석 모델

💎cost function이 feature의 범위에 크게 영향을 받는 경우

  • logistic regression, lasso, ridge
    • cost function에 규제항이 포함된 모델
  • 규제항을 포함하면 계수 크기의 L1 혹은 L2합 전체를 규제하게 되므로 cost function이 큰 계수의 값에 영향을 받음

💎cost function이 복잡하고 global optimization(전역 최적값 탐색)이 어려운 모델

  • 다층 퍼셉트론
    • cost function에 규제항이 없어도 cost function자체를 잘 학습시키는 것이 어려움
    • 스케일링하지 않을 시 학습이 오래걸리거나 학습 자체가 잘 이루어지지 않음

🔎CASE2: scaling 여부가 성능에 영향을 주지 않는 경우

💎OLS (최소자승법)

  • feature의 범위가 좁아지면 해당되는 feature의 계수값만 비례해서 증가
  • 목푯값에 대한 예측값은 동일하게 얻어짐

💎tree계열 모델

💎random forest model

profile
데이터 분석/엔지니어링/ML에 관한 기록
post-custom-banner

0개의 댓글