One-hot Encoding 왜 함?

waternet·2022년 9월 1일
0

One-hot Encoding

범주형 값(카테고리)=>Binary값으로 바꾸는 표현법**

ex) 개, 고양이, 말=> [0,0,1],[0,1,0],[1,0,0]
해당 레이블을 나태는 인덱스만 1의 값을 가지고 나머지는 0

Integer Encoding

범주형 값(카테고리)=>Integer(정수)값으로 바꾸는 표현법**

ex) 개, 고양이, 말=> 1, 2, 3

Q : 그렇다면 왜? Integer Encoding 을 사용하지않고 One-hot Encoding을 사용하는가?

가장 단순한 문제점은 ML 알고리즘이 정수 값으로부터 잘못된 경향성을 학습할 수 있음.

ex) Integer Encoding 사용 시
"개(=1)와 말(=3)의 평균(=2)이 고양이다" 라는 결론 도출
즉 잘못된 학습 편향 생김

profile
wanna be Crypto Warrior

0개의 댓글