Data Analysis - Data Type 정리

KSH·2022년 1월 7일
0
post-thumbnail

요즘 캐글 필사를 진행중인데 Data Type이 나올 때마다 까먹고 구글링을 하는
내 모습을 보고 Data Type을 내 블로그에 정리해야겠다고 마음을 먹었다!


Data Analysis - Data Type

1. Nominal (명목형 데이터)

: 순서가 없는 범주형 데이터를 의미한다.
성별(남/여) / 좋아하는 색상 (빨강/초록/파랑) 등을 예로 들 수 있다.
남자를 1, 여자를 0으로 표현하면 1과 0이라는 값은 순서가 생기지만
실제 데이터와는 아무런 관계가 없다.

2. Ordinal Data (순서형 데이터)

: 순서가 있는 범주형 데이터를 의미한다.
예를 들면, 설문조사 결과를 들 수 있다.
설문조사에서 매우 좋음 5, 보통 3, 매우 나쁨이 1이라면 5->3->1이라는 순서가 생긴다.
이러한 순서는 실제 데이터와 관계가 있다. (숫자가 높으면 긍정적인 결과)
하지만 이때 문자열(매우 좋음, 보통, 매우 나쁨 등)을 수치로 변환하는 과정을 잘 처리해야 한다.

3. Discrete Data (불연속적 데이터/이산형 데이터)

: 연속되지 않는 수치형 데이터를 의미한다.
예를 들면, 주사위 결과를 들 수 있다.
주사위 결과는 1, 2, 3, 4, 5, 6이 있지만 1과 2사이의 1.5 같은 값은 나오지 않기 때문에 불연속적이라고 할 수 있다.

4. Continous Data (연속적 데이터)

: 연속되는 수치형 데이터를 의미한다.
예를 들면, 키나 몸무게를 들 수 있다.
하지만 키를 잴 때 소수점 자릿수에서 반올림하기 때문에 Discrete Data라고 생각이 들기도 한다.
하지만 표현만 이렇게 할 뿐, 실제 관측 가능한 Data는 Continous Data이므로 Continous Data라고 할 수 있다.


출처 : 생각정리님 블로그

profile
성실히 살아가는 비전공자

0개의 댓글