논문 읽으면서 이게 뭐지 싶을 때 마다 통계 내용을 찾아봤었는데, 이 참에 한번 싹 정리해본다.
☠️ P-value(유의 확률)
통계적 가설 검정에서 유의 확률(significance probability, asymptotic significance) 또는
p-값(영어: p-value, probability value)은 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률이다.
- 귀무가설 : 내가 주장하는 바와 반대되는 가설
- 대립가설 : 내가 입증하고자 하는 가설
p-value를 사용하는 논리흐름은 다음과 같다
- 내 가정이 아니라고 해보자 :
귀무가설 설정
- 그런데 이런 결과가 나왔다면, 그것이 단지 우연에 의한 결과일 확률을 구해보자
p-value 계산
- 그 확률이 기준치 보다 높다/낮다 계산
유의수준과 비교
- 따라서 내 가정이 옳다/옳지 않다 판단
귀무가설 기각 대립가설 채택
귀무가설은 영어로 null hypothesis 대립가설은 alternative hypothesis 이다
즉, 내 가설이 옳다는 것은 null hypothesis를 기각하고 alternative hypothesis를 채택한다는 것이고 가설이 틀리다면 null hypothesis를 채택하고 alternative hypothesis를 기각하게 되는 것이다.
🚧 T-test: 두 집단 평균이 동일한지 비교
- 두 분포가 정규분포를 따르고 등분산성을 가질 때 (두 집단이 같은 분산을 가짐)
- 독립표본(independent) t test: 서로 다른 요인에 대한 비교
- 대응표본(paired sample) t test: 동일 집단 전/후 비교
- 두 집단의 평균 차이에 대한 통계적 유의성을 보는것
평균을 같은 집단으로 볼 것인가 다른 집단으로 볼 것인가에 대한 판단
🚠 ANOVA: 여러 집단 분산 비교
-
One-way ANOVA: 하나의 독립변수(비료 유형)에 대한 비교
- ex) 세 가지 다른 비료 유형(그룹: A, B, C)이 식물의 성장에 미치는 영향을 알아보기 위해 실험을 진행합니다. 각각의 비료 유형에 대해 10개의 식물을 사용하고, 성장에 대한 결과를 측정합니다. 이때, Oneway ANOVA를 사용하여 각 비료 유형의 평균 성장률이 통계적으로 유의미하게 차이가 있는지 확인할 수 있습니다.
-
Two-way ANOVA: 두 개의 독립변수(비료 유형, 물 양)에 대한 비교
- ex) 여러 가지 비료 유형(그룹: A, B, C)과 물 주입량(그룹: 많음, 보통, 적음)이 식물의 성장에 미치는 영향을 알아보기 위해 실험을 진행합니다. 각각의 조합에 대해 10개의 식물을 사용하고, 성장에 대한 결과를 측정합니다. 이때, Twoway ANOVA를 사용하여 각 비료 유형과 물 주입량의 효과 및 상호 작용 효과를 분석할 수 있습니다.
-
Multiple ANOVA: 여러 개의 독립변수에 대한 비교
- 예시: 비료 유형(그룹: A, B, C), 물 양(그룹: 많음, 보통, 적음) 및 토양 종류(그룹: 토양1, 토양2)이 식물의 성장에 미치는 영향을 알아보기 위해 실험을 진행합니다. 각 조건에 대해 10개의 식물을 사용하고, 성장에 대한 결과를 측정합니다. 이때, Multiple ANOVA를 사용하여 각 독립변수의 효과 및 상호 작용 효과를 동시에 분석할 수 있습니다
🚛Manova: 종속변수 여러개
- 예시
- 분석: MANOVA를 사용하여 시험, 과제, 프로젝트 점수의 평균 차이가 학과 간에 통계적으로 유의미한지를 검정할 수 있습니다. 이때, MANOVA는 각 평가 방법(시험, 과제, 프로젝트)을 종속 변수로 사용하고, 학과를 독립 변수로 사용하여 각 그룹 간의 평균 차이와 분산 차이를 분석합니다.
- 결과 해석: MANOVA 결과를 통해 평가 방법과 학과 간의 평균 차이가 통계적으로 유의미한지를 확인할 수 있습니다. 상호 작용을 확인하여 어떤 평가 방법이 어떤 학과에서 특히 유의미한 차이를 보이는지를 파악할 수 있습니다.
🚃 사후분석:
사후분석(Post-hoc analysis)은 통계 분석에서 주로 사용되는 용어로, 실험 또는 조사에서 얻은 결과에 대한 추가적인 비교 및 해석을 위해 수행되는 분석을 말합니다. 주로 실험 또는 조사에서 여러 그룹 간의 차이를 확인한 후, 그룹 간의 특정 차이를 확인하기 위해 사용됩니다.
- Tukey's Honestly Significant Difference (HSD):
가장 보편적으로 사용되는 사후분석 방법 중 하나로, 모든 가능한 집단 쌍에 대해 비교합니다.
집단 간 평균 차이의 크기와 표준 오차를 고려하여 실제로 유의한 차이가 있는지를 판별합니다.
- Bonferroni Correction:
가장 보수적인 사후분석 방법 중 하나로, 유의수준을 보정하여 오류율을 낮춥니다.
각 비교에서 사용되는 유의수준을 전체적으로 낮추어 유의한 결과를 얻을 수 있도록 합니다.
- Scheffe's Method:
비교적 보수적인 방법으로, 그룹 간의 모든 가능한 조합을 고려하여 비교합니다.
적은 수의 관찰치를 다루는 경우에 유용하며, 그룹 간 차이를 파악하는 데에 더욱 정확합니다.
- Dunnett's Test:
실험 집단을 하나의 통제 집단과 비교하는 방법으로, 즉, 각 집단을 통제 집단과 비교합니다.
단일 통제 집단을 사용하는 실험에서 유용하게 사용됩니다.
Fisher's LSD (Least Significant Difference):
가장 간단한 사후분석 방법 중 하나로, 그룹 간의 모든 가능한 조합을 비교합니다.
다른 방법들에 비해 유의한 결과를 찾기 쉽지만, 유의수준을 관리하기 위해 보수적으로 사용해야 합니다.