Variable & Observation
변수(Variable)란 말 그대로 변할 수 있는 수를 말하며, Observation(관측값)이란 내가 관측한 값을 말한다.
나의 age는 23일 때, 이는 변수인 age에 대한 관측값이라고 말할 수 있는 것이다.
측정(measuremeent)의 척도(scale)
질적 척도 : 수들의 계산이 무의미 하다
- 명목 척도 (nominal scale)
분류 목적의 척도로, 어느 집단인 지를 수로 표현 가능하다.
예) 1: 남자, 2: 여자
- 순서 척도 (ordinal scale)
관측값에 대해 순위로 나타낼 수 있고, 대상끼리의 평가는 가능하나 어느정도의 차이인 지는 알 수 없다. 서열 관계를 나타내는 척도로, 분류 목적이기도 하지만 순서가 필요하다.
예) 1: 매우 좋음 2: 좋음 3: 보통 4: 좋지 않음 5: 매우 좋지 않음
-> Likert Scale(리커트 스케일) : 순서를 간격으로 나눴지만 평균을 낼 수 있고, 유의미하다.
양적 척도 : 수들의 계산이 유의미 하다
- 구간 척도 (interval scale)
측정 대상이 가지는 속성의 양을 측정한다. 이에 대해 절대적 원점은 존재하지 않는다. 비율의 의미가 없다.
예) 섭씨 온도, 주가지수, 성적
- 비율 척도 (ratio scale)
절대적 원점이 존재하며, 비율의 의미가 있다. 사칙 연산이 가능하고, 비교가 가능하므로, 나머지 3가지 척도의 특성을 모두 가지고 있다.
변수(Variable)의 종류
양적 변수(Quantitative variables)
: 숫자로 측정될 수 있는 변수를 말한다.
- 이산형(discrete) 변수 : 이산적인 값을 갖는 변수를 말한다.
예) 1, 2, 3, 4, ...
- 연속형(continuous) 변수 : 연속적인 값을 갖는 변수를 말한다.
예) 시간, 몸무게
질적 변수(Qualitative variables)
: 숫자로 측정할 수는 없지만 분류는 가능한 변수
ex) 색상, 성별, 종교
R에서는 어떻게?
R에서는 변수에 관측값 혹은 상수를 할당시키는 과정을 할당 연산자(<-, <<-, =, 등)를 통해 가능하게 한다.
변수를 a 라고 할 때, 우리는 a <- 5 라는 식을 통해 변수 a에 5를 할당시켜줄 수 있다.
코딩 세계관에서는 = 이라는 기호가 같다라는 의미가 아닌 할당의 의미로 사용된다.
이 또한 b=7 의 식을 해석하면, b라는 변수에 7이라는 관측값을 할당하는 과정으로 볼 수 있다.
위에서 배운 다양한 포맷의 수들을 R에서 다뤄볼 것이 기대된다.