데이터는 크게 두 가지 유형으로 나뉩니다:
1. Categorical과 2. Numerical.
Categorical Data
Categorical data는 카테고리나 그룹을 설명합니다. 예를 들어, 차 브랜드에서는 BMW, Audi, Mercedes와 같은 것들이 있습니다. 이는 각기 다른 그룹이나 범주를 나타냅니다. 또 다른 예로는 'yes' 또는 'no'와 같은 대답이 있습니다. 이러한 응답들은 특정한 범주에 속하며, 이것이 바로 Categorical data의 특징입니다.
Numerical Data
Numerical data는 숫자를 다룰 때 사용되는 유형입니다. 이는 다시 두 가지 카테고리로 나뉩니다: a. Discrete와 b. Continuous.
a. Discrete Data
Discrete data는 유한한 방식으로 셀 수 있는 데이터입니다. 예를 들어, '아이를 원하는 수'라는 데이터가 있을 때, 이는 1, 2, 3, 4와 같이 정수로 표현됩니다. 이것은 정수(integer)로 셀 수 있는 데이터의 예입니다. 또 다른 예로는 수능 점수가 있습니다. 수능 점수는 정수로 구성됩니다.
b. Continuous Data
Continuous data는 Discrete data의 반대입니다. 이는 무한하고 셀 수 없는 데이터입니다. 예를 들어, 무게를 측정할 때 몸무게는 68.0389Kg과 같이 정확하게 정수로만 구성되어 있지 않습니다. Continuous data는 특정한 부분으로 나누어지지 않고, 수가 무한하게 표현될 수 있습니다. 키(height), 면적(area), 거리(distance), 시간(time)은 이러한 속성을 가진 데이터의 예입니다.