데이터의 종류

생각하는 마리오네트·2021년 6월 4일
0

통계

목록 보기
1/41

데이터의 종류

1. 범주형(Categorical)

- 명목형(Nominal) : 순서가 없고, 셀 수 있다.

     (Ex) 성별(남 or 여), 성공여부, 혈액형)/ one-hot encoding사용

- 순서형(Oridinal) : 카테고리들이 순서가 있다.

     (Ex) 만족도조사(매우만족, 만족, 보통, 불만족, 매우불만족)/ LabelEncoding사용

2. 수치형(Numerical)

- 이산형(Discrete data) : 수치적 의미를 가지지만 소수점X(counted)

     (Ex) 주사위가 2가 나올 횟수 1번,2번/ 사람이 1명 2명)

- 연속형(Continuous data) : 셀수없고 측정가능한 데이터(소수점 가능,measured)

     (Ex) 측정해서 나온데이터 : 키, 몸무게 -> 180.1, 180.2, 180.3....)
    

연속성 데이터 설명

  • 이산데이터와 달리 Group을 지어서 Table을 만들어야한다.

179(cm) - 1명
179.1 - 3명
179.2 - 2명
179.3 - 1명
.
.
.
.
180.1 - 1명

위와 같은 데이터가 있을때 한 데이터 마다 따로 계산을 하는것이 아닌
그룹화 시킨다.

  • 179 ~ 180 : 1명
  • 180 ~ 181 : 3명

위와같은것은 표로 만들게 되면 빈도표/ 빈도분포표(Frequency Table)이라고 부른다.

주의해야 할 것

서울을 1, 부산을 2, 대구를 3으로 했을때는
1, 2, 3은 카테고리컬 데이터로 볼 수 있다. 즉, 숫자라고 numerical data가 아니다.

profile
문제를해결하는도구로서의"데이터"

0개의 댓글