순서가 없는 데이터
에 사용**독립적**
임을 표현유사도
를 표현하지 못함pd.get_dummies(data['Embarked'], prefix = 'Embarked')
🌟 prefix
를 활용하여 컬럼을 좀 더 명시적으로 표현 가능
prefix 적용 전
prefix 적용 후
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
X = [['male', 'from US', 'uses Safari'],
['female', 'from Europe', 'uses Firefox']]
enc.fit(X)
enc_out = enc.transform([['female', 'from US', 'uses Safari'],
['male', 'from Europe', 'uses Safari']]).toarray()
=>[[1. 0. 0. 1. 0. 1.]
[0. 1. 1. 0. 0. 1.]]
------------------------------------------------------------------------------------
enc.get_feature_names_out()
=> ['x0_female' 'x0_male' 'x1_from Europe' 'x1_from US' 'x2_uses Firefox'
'x2_uses Safari']
------------------------------------------------------------------------------------
pd.DataFrame(enc_out, columns=enc.get_feature_names_out())
↓