pd.get_dummies 원-핫 인코딩

Yelim Kim·2021년 10월 25일
0

Kaggle

목록 보기
16/29

선형모델을 사용하는 경우 레이블 인코딩을 사용하게 되면 선형 모델이 각 클래스를 선형 관계로 이해해버리는 문제가 발생하게 된다.
따라서 원-핫 인코딩을 해줘야 한다.

예전 글에서도 한번 설명한 적이 있다.


모든 클래스에 대해 칼럼을 생성하여 해당하는 칼럼에 1을 넣어주는 형식으로 바꿔주는 코드이다.

all_data2 = pd.get_dummies(all_data) 
all_data2

칼럼 수가 늘어나게 된다.
이후에 반드시 이전 칼럼들을 drop해줄 것!

profile
뜬금없지만 세계여행이 꿈입니다.

0개의 댓글