통계 101 X 데이터분석 - 3.1 데이터 유형

jwKim·2023년 4월 6일
0

1. 변수란?

통계학에서 '변수'라는 용어는 자주 사용된다. 변수란 공통의 측정 방법으로 얻은 같은 성질의 값을 의미한다.

[ 변수의 예 ]
키 : [160cm, 167cm, 170cm, 175cm]
속도 : [3km/h, 5km/h, 7km/h]

[ 변수가 아닌 예 ]
사람 : ['김지우', 180cm, 70kg]
⇒ 세 값은 속성이 모두 다르기 때문에 '사람'은 변수가 될 수 없다.

2. 변수 데이터 타입

변수는 아래와 같이 수치형 변수, 볌주형 변수로 나뉘고, 수치형 변수는 다시 연속변수와 이산변수로 나뉜다.

2-1. 수치형 변수(=양적 변수)

수치형 변수는 숫자로 나타낼 수 있는 변수이며, 양적 변수라고도 한다. 대소 관계가 있으며 연산이 가능하다.(예를 들어 길이 20cm + 10cm = 30cm, 횟수 3회 + 2회 = 5회) 수치형 변수는 연속형 변수, 이산형 변수로 나뉜다.

  1. 연속형 변수 : 얻을 수 있는 값이 간격 없이 연속적으로 있는 변수를 의미한다. 소숫점 아래 자리까지 측정이 가능하다는 점에서 이산변수와 차이가 있다.

  2. 이산형 변수 : 측정값이 서로 떨어져있는 변수를 의미한다.

2-2. 범주형 변수(=질적 변수)

범주형 변수는 숫자로 나타낼 수 없는 변수이며 질적 변수라고도 한다. 예를 들면 Yes/No, 동전 앞면/뒷면, 날씨가 흐림/맑음/비/눈 등이 있다. 수치형 변수와 달리 범주형 변수는 대소관계를 파악할 수 없고 연산이 불가능하다.

0개의 댓글