분산분석 ANOVA

고은서·2023년 12월 17일
0

Statistics

목록 보기
1/4

01. 분산분석

세 개의 집단에 대한 평균의 차이가 통계적으로 유의미한가?

1.1 분산분석의 개념

3개 이상의 집단에 대한 평균 차이를 검증하는 분석 방법

1.2 분산분석에서의 편차

편차는 집단 간의 편차(between)와 (위쪽 화살표)
집단 내의 편차(within)로 구분할 수 있음 (아래쪽 화살표)

1.3 분산분석의 구분

분산 분석은 분석의 기준의 수를 기준으로 구분함
일원분산 분석: 한 가지 요인을 기준으로 집단 간 차이 조사
이원분산 분석: 두 가지 요인을 기준으로 집단 간 차이 조사
다원분산 분석: 세 가지 이상의 요인을 기준으로 집단 간 차이 조사

1.4 분산분석의 가정

각 모집단은 정규분포여야 하며, 집단 간 분산은 동일하다.
각 표본들은 독립적으로 추출되었다.
각 표본의 크기는 적절해야 한다.

02. 일원분산분석 One-way ANOVA

하나의 독립변수를 3개 이상의 집단으로 나눠 각 집단의 분산을 고려한 평균 차이가 통계적으로 유의한지 검정하는 방법

2.1 일원분산분석의 과정

하나의 독립변수를 3개 이상의 집단으로 나누어 각 집단의 분산을 고려한 평균의 차이가 통계적으로 유의한지 검정하는 방법

귀무가설: ~ 에 차이가 없다.
대립가설: ~ 에 차이가 있다.

2.2 일원분산분석의 편차

총 편차, 집단 간 편차, 집단 내 편차

집단 간 편차: 해당 집단에서 측정된 평균에 대한 전체 평균 차이의 제곱합 (전체 평균과의 차이)

집단 내 편차: 집단 내에서 측정된 자료에 대한 집단 평균 차이의 제곱합 (집단 내 평균과의 차이)

2.3 일원분산분석의 결과해석

평균: 어떤 값을 비교할 때 가장 기본이 되는 값
편차의 평균: 평균을 자유도로 나눔

03. 이원분산분석

3.1 분산분석 구분

분산분석: 3개 이상 집단에 대한 평균 차이를 알아보는 검정
이원분산분석: 독립변수의 개수가 2개
*상호작용: 종속변수에 영향을 미치는 두 독립변수 간의 시너지 효과

3.2 이원분산분석

2가지 요인을 기준으로 집단 간 차이를 조사한다.
① 2개의 종속변수에 따른 종속변수의 평균 차이를 검증
② 2개 독립변수 간 상호작용 효과를 검증
*상호작용: 종속변수에 영향을 미치는 두 독립변수 간의 시너지 효과

3.3 효과(effect)

분산분석의 주요 작업: 셋 이상의 집단 간의 차이를 검정
① 주효과(main effect) 단일 요인과 관련된 결과
② 상호작용 효과: 두 요인의 영향을 같이 다루는 것,
-> 두 개의 독립변수가 동시에 작용하여 종속변수에 미치는 영향

3.4 이원분산분석의 과정

1) 가설설정
2) 검정통계량 계산
3) 의사결정 - 가설 기각 및 채택

3.6 가정사항

분산분석은 모든 모집단이 정규성을 가지고
모든 집단의 분산이 같다고 가정한다.

3.7 이원분산분석 예제

성별, 치료방법 차이 비교
 운동 강도의 수준 간 체중 감량 정도에 차이가 존재하는가?
 남성과 여성의 성별 간에 체중 감량 정도에 차이가 존재하는가?
 남성 또는 여성에 대한 운동 강도 수준의 효과는 무엇인가?

profile
cities and data

0개의 댓글