지도학습 기법 2_2

안소희·2025년 4월 25일
0

Goorm AI

목록 보기
5/12

Feature Scaling

  • 특성 스케일링은 서로 다른 값의 수준을 일정한 범위로 맞추는 기법

스케일러의 종류

  1. StandardScaler

    • 평균을 0, 분산을 1
  2. MinMaxScaler

    • 값의 범위가 0~1 사이로 오게 한다
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(X_train)
X_train_scaled = scaler.transform(X_train)

범주형 데이터 처리

  • 문자열은 직접 독립 변수로 사용할 수 없다

가변수 생성

  • 원-핫 인코딩으로 0과1로 구분한 숫자로 그 내용을 변환
data_dummies = pd.get_dummies(data) # pandas 내장 함수

숫자로 포현된 범주형

  • 숫자라고 해서 반드시 범주형이 아닌것은 아니다
  • 그러나 get_dummies()함수는 숫자를 기본적으로 연속형으로 간주
import pandas as pd

demo_df = pd.DataFrame({'버튼': [1,3,4,6], '상품': ['쿠키','사탕','콜라','커피']})

# 숫자로 된 범주형은 가변수로 바뀌지 않는다
# 그러나 컬럼 지정을 하면 숫자도 가변수로 바꿀 수 있다
print(pd.get_dummies(demo_df, columns=['버튼','상품']))

profile
인공지능.관심 있습니다.

0개의 댓글