자료의 형태를 파악하는 것은 머신러닝 사용을 위한 필수 과정
자료형태구분
1. 수치형자료
1. 연속형자료
2. 이산형자료
수치형 자료 = 양적자료
수치로 측정이 가능한 자료
키, 몸무게, 시험점수, 나이 등
범주형 자료 = 질적자료
성별, 지역, 혈액형 등
범주형 자료 -> 순위형 자료, 명목형 자료
순위형 자료 - 범주 사이의 순서에 의미가 있음 예) 학점 A+, A
명목형 자료 - 범주 사이의 순서에 의미가 없음 예) 혈액형 A, B, O, AB
수치형 자료 -> 연속형 자료, 이산형 자료
연속형 자료 - 연속적인 관측값을 가짐 예) 원주율, 시간 등
이산형 자료 - 셀 수 있는 관측값을 가짐 예) 뉴스 글자수, 주문상품 개수