pd.get_dummies와 sklearn.one_hot_encoder의 차이

jj·2021년 3월 5일
0

나도 몰랐던 pandas

목록 보기
2/3

sklearn.OneHotEncoder

  • string 값을 바로 처리할 수 없음
  • 만약 nomial features가 string이라면, 먼저 integer로 매핑하고 처리해야함
  • 최근 업데이트 되서, categorical feature을 위한 string 처리가 가능해졌다고 한다!!
  • ml engineer라면 이걸 쓰는게 좋다

pandas.get_dummies

  • sklearn과 반대로, string 을 바로 one hot representation을 해주는게 디폴트 설정이다
  • 그러나, 그것뿐임

output 비교


https://stackoverflow.com/questions/36631163/what-are-the-pros-and-cons-between-get-dummies-pandas-and-onehotencoder-sciki

profile
재밌는게 재밌는거다

0개의 댓글