선형모델을 사용하는 경우 레이블 인코딩을 사용하게 되면 선형 모델이 각 클래스를 선형 관계로 이해해버리는 문제가 발생하게 된다.
따라서 원-핫 인코딩을 해줘야 한다.
예전 글에서도 한번 설명한 적이 있다.
모든 클래스에 대해 칼럼을 생성하여 해당하는 칼럼에 1을 넣어주는 형식으로 바꿔주는 코드이다.
all_data2 = pd.get_dummies(all_data)
all_data2
칼럼 수가 늘어나게 된다.
이후에 반드시 이전 칼럼들을 drop해줄 것!