명목, 순서 - 질적자료 (숫자가 들어가도 차이 계산x)
구간, 비율 - 양적자료 (숫자들의 크기 차이를 계산 가능)
모수적 방법 : 모집단의 분포에 대한 가정을 하여 검정통계량 유도해 검정
비모수적 방법: 가정된 분포가 없으므로 분포의 형태가 동일하다, 동일하지 않다와 같이 분포 형태 가설 설정
비모수 검정 예: 부호검정, 윌콕슨 순위합, 윌콕슨 부호 순위 검정, 맨- 휘트니 U검정, 크루스칼-왈리스 H 검정, 런 검정, 스피어만 상관계수
일표본 t검정
- 단일모집단에서 연속형 변수의 평균값을 특정 기준값과 비교
- 모집단이 정규분포를 이룬다는 가정
- 과수원에서 생산되는 사과 평균 무게 200g, 실제 200 인지
- 가설설정 → 유의수준 설정 → 검정통계량 값 및 유의확률 계산 → 기각여부 판단
대응표본 t검정 (paired Sample t-test)
- 단일모집단에 두번 처리를 했을 때, 두 처리에 따른 평균차이 비교
- 모집단의 관측값이 정규분포를 이룬다는 가정
- 10명의 환자 대상으로 영양제 복용 전과 후의 평균 수면시간 차이 있는지
- 가설설정 → 유의수준 설정 → 검정통계량 값 및 유의확률 계산 → 기각여부 판단
독립표본 t검정
- 두 개의 독립된 모집단의 평균을 비교
- 정규성 만족, 두 집단 독립, 등분산성, 모분산 동일
- A,B 지역에 대한 10일 동안 겨울 낮 최고기온
- 가설설정 → 유의수준 설정 → 등분산 검정 → 검정통계량 값 및 유의확률 계산 → 기각여부 판단
반응값에 대해 하나의 범주형 변수의 영향
각 집단의 측정치는 서로 독립이고 정규분포를 따른다.
각 집단 측정치의 분산은 같다
- 귀무가설 : k개의 집단 간 모평균에는 차이가 없다 (M1=M2=M3...)
- 대립가설 : k개의 집단 간 모평균이 모두 같다고 할 수 없다.
- 사후분석 귀무가설 : 집단들 사이 평균은 같다
- 사후분석 대립가설 : 집단들 사이의 평균은 같지않다.
- 위 처럼 두 집단씩 짝을 지어 다중 비교
반응값에 대해 A,B 두개의 범주형 변수의 영향을 알아보자
A,B 사이의 상관관계 교호작용 검증 필요
각집단 측정치는 정규분포이고 분산은 같다.
- 귀무가설 : 변수에 따른 종속변수의 값에는 차이가 없다.
- 귀무가설 : 알파와 베타 변수의 교호작용 효과가 없다.
랜덤화의 원리 : 실험 순서 무작위
반복의 원리 : 최소 두 번이상 실험
블록화의 원리 : 시간적 공간적 분할
직교화의 원리 : 요인간 직교성
교락의 원리 : 주효과와 교호효과를 구별할 수 없도록 조합 (주 효과 높게 추정 됨)
서로 상관성이 높은 변수들의 선형결합으로 이루어진 주성분이라는 새로운 변수를 만드는 것.
소수의 주성분으로 차원을 축소
변수들끼리 상관관계 고려하여 유사한 변수를 묶어 새로운 잠재 요인 추출
주성분 분석, 공통요인 분석
고유값(eigenvalue)을 기반으로 할 때 교유값이 1이상에 해당되는 요인들을 추출
스크리 도표 : 설명력 하락하다가 완만한 추락으로 바뀌기 직전 요인의 수
주성분 기여율은 주성분의 설명력, 누적 기여율이 85%가 되면 지정되면 수로 결정