머신러닝의 모델링에서 사용할 '변수'를 선택할 때 각각의 변수마다 종류를 짚고 넘어가는 것은 중요하다. 변수의 종류에 따라 원핫인코딩 등 전처리 유무 및 방식이 달라지기 때문.
이번 포스팅을 통해 변수의 종류와 척도의 종류를 정리해보자!
요일과 계절은 머신러닝에서 아주 흔하게 사용되는 변수인데
월>화>수..., 봄>여름>가을.. 이라는 점에서 순서가 있는 것 아닌가?하는 생각에 명목형인지 순서형인지 계속 헷갈렸으나
각 값에 해당하는 코드를 임의로 붙일 수 있고 값에 따른 유불리(우열)가 없다는 점에서 기본적으로 명목형으로 취급하는 것이 맞다.