머신러닝 (4)

Myeongsu Moon·2024년 11월 11일

머신러닝 제로베이스 학습

제로베이스

목록 보기

17/95

Chapter6 Label Encoder, Scaler

Label encoder

글자를 만나면 숫자로 바꿔준다

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()
le.fit(df['A'])

le.fit_transform(df["A"])

Min-Max Scaler

x' = \frac{x - \min(x)}{\max(x) - \min(x)}

from sklearn.preprocessing import MinMaxScaler

mms = MinMaxScaler()
mms.fit(df)

df_mms = mms.transform(df)
df_mms

mms.fit_transform(df_mms)

Standard Scaler

z = \frac{X - \mu}{\sigma}

from sklearn.preprocessing import StandardScaler

ss = StandardScaler()
ss.fit(df)

df_ss = ss.transform(df)
df_ss

ss.fit_transform(df)

Robust Scaler

\frac{x_i - Q_2}{Q_3 - Q_1}

from sklearn.preprocessing import RobustScaler

rs = RobustScaler()

df_rs = rs.fit_transform(df)

아웃라이어에 강하다는 특징이 있음

각 스케일러의 차이

df_scaler["MinMax"] = mm.fit_transform(df)
df_scaler["Standard"] = ss.fit_transform(df)
df_scaler["Robust"] = rs.fit_transform(df)

df_scaler

import seaborn as sns
import matplotlib.pyplot as plt

sns.set_theme(style = 'whitegrid')
plt.figure(figsize = (16, 6))
sns.boxplot(data = df_scaler, orient = "h")

어느 스케일러가 어디에 좋다고 정해져 있지는 않음

이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다

Myeongsu Moon

이전 포스트

머신러닝 (3)

다음 포스트

머신러닝 (4)

제로베이스

Chapter6 Label Encoder, Scaler

Label encoder

Min-Max Scaler

Standard Scaler

Robust Scaler

각 스케일러의 차이

머신러닝 (3)

머신러닝 (5)

0개의 댓글