(Ex) 성별(남 or 여), 성공여부, 혈액형)/ one-hot encoding사용
(Ex) 만족도조사(매우만족, 만족, 보통, 불만족, 매우불만족)/ LabelEncoding사용
(Ex) 주사위가 2가 나올 횟수 1번,2번/ 사람이 1명 2명)
(Ex) 측정해서 나온데이터 : 키, 몸무게 -> 180.1, 180.2, 180.3....)
179(cm) - 1명
179.1 - 3명
179.2 - 2명
179.3 - 1명
.
.
.
.
180.1 - 1명
위와 같은 데이터가 있을때 한 데이터 마다 따로 계산을 하는것이 아닌
그룹화 시킨다.
위와같은것은 표로 만들게 되면 빈도표/ 빈도분포표(Frequency Table)이라고 부른다.
서울을 1, 부산을 2, 대구를 3으로 했을때는
1, 2, 3은 카테고리컬 데이터로 볼 수 있다. 즉, 숫자라고 numerical data가 아니다.