ML | sklearn.preprocessing 스케일링 함수

소리·2023년 12월 5일
0

스케일링

  • Label Encoder : 문자를 숫자로 변경

from sklearn.preprocessing import LabelEncoder
#0 과 n_classes-1 사이 값으로 변환

출처 및 자세한 내용

.
.

  • MinMax Scaler : 0과 1사이에 위치하게 스케일링

-원리 :

X_std = (X - X.min(axis=0)) / (X.max(axis=0) - X.min(axis=0))
X_scaled = X_std * (max - min) + min

-문법
MinMaxScaler(feature_range=(0, 1), *, copy=True, clip=False)

-사용 :

from sklearn.preprocessing import MinMaxScaler
mms = MinMaxScaler()
mms.fit(df)
mms.data_max_, mms.data_min_ #데이터 최소값, 최댓값

자주쓰는 속성 : datamin, datamax, nfeatures_in
출처

.
.

  • StandardScaler : 평균과 분산을 사용한 스케일링

-문법
StandardScaler(*, copy=True, with_mean=True, with_std=True)

-사용

from sklearn.preprocessing import StandardScaler
ss = StandardScaler()
ss.mean_, ss_scale_ #평균과 표준편차

-속성

출처

.
.

  • RobustScaler : 중간값과 사분위수를 사용한 스케일링

-문법
RobustScaler(*, with_centering=True, with_scaling=True, quantile_range=(25.0, 75.0), copy=True, unit_variance=False)

-사용

from sklearn.preprocessing import RobustScaler

-속성

출처

profile
데이터로 경로를 탐색합니다.

0개의 댓글