수치형(Numeric Data)
- 연속형(Continuous): 연속적인 값(풍속, 시간, 키)
- 이산형(Discrete): 셀 수 있는 값(상품수, 방문자수)
범주형(Categorical Data)
- 순서형(Ordinal): 값들 사위에 분명한 순위가 있는 값(학점, 만족도)
- 명목형(Nominal): 순서에 의미가 없음 (혈액형, 성별)
주의사항
일부 범주형 DATA는 숫자로 변환하는 것이 실제로 숫자적인 의미는 없음
- ex) 학점, 만족도, 성별(1/0)
- 만족도 4점과 2점이 2배의 만족도 차이를 의미하지 않음
- 반면, 수치형 DATA인 키 1m와 2m는 2배의 차이를 숫자적으로 의미함
Python Tip
Python Pandas의 describe() 함수 사용 시,
당연히 수치형DATA만 값이 출력되고, 범주형DATA는 출력되지 않음.
그런데 값이 표시된다고 해서 수치형DATA라고 단정할 수는 없음(만족도 등)