(ML)Scaler

지며리·2023년 2월 3일
0
post-custom-banner


각 feature들의 단위(cm, m, kg, ℃, ₩..)에 따른 크기 차이에 머신러닝이 영향을 받지 않도록 feature들을 일정 범주내 숫자로 변환하는 Scaling에 대해 알아 보자.

Min-Max Scaler

  • 기존 값을 0과 1사이의 값으로 매핑
from sklearn.preprocessing import MinMaxSclaer

mms = MinMaxSclaer()
mms.fit(df)
df_mms = mms.transform(df)
# fit_transform으로 한번에 수행 가능

Standard Scaler

  • 평균 값이 0, 분산이 1이 되는 값으로 매핑
from sklearn.preprocessing import StandardScaler
ss = StandardScaler()
ss.fit(df)
df_ss = ss.transform(df)
# fit_transform으로 한번에 수행 가능

Robust Scaler

  • outlier에 강한 Scaler. 분위수를 이용해서 범주화
from sklearn.preprocessing import RobustScaler

rs = RobustScaler()
df_scaler = rs.fit_transform(df)
# fit, transform으로 각각 수행 가능
profile
쉽고 유익하게 널리널리
post-custom-banner

0개의 댓글