의학 통계에서 필요한 전체적 연구 통계 분석 flow를 저번 포스트에 이어 추가적으로 정리해보겠습니다.이번 편 역시 저번과 마찬가지로, 통계 분석에 활용할 수 있는 R코드도 조금이나마 간단하게 설명했습니다.
짝을 이룬 자료의 비교 (paired data,repeated,dependent)
동일한 사람에 대해 투약 전후 또는 수술 전후의 차이처럼 두 번 검사하는 경우
Paired data는 상대적으로 교란 변수의 영향을 덜 받고, 연구 대상의 숫자가 줄어들고, 작은 차이라도 통계적으로 정밀하게 찾을 수 있다는 장점이 존재한다.
-Paired t-test
EX) 한 사람에 대해 2번 검사하는 것의 경우 샘플의 수가 반으로 줌 (짝을 이룬 연구는 결과 변수가 연결되있는 것이 중요)
결과 값이 되는 종속변수는 반드시 연속 변수
관심있는 것이 "post-pre" 하나의 분포 이므로 등분산성 검정은 대응 표본에서 따로 필요없음!!!
EX) R 코드에서 대응 표본 t-test 코드: shapiro.test(post-pre) ## 정규성 검정 후 t.test(post-pre)
-Wilcoxon signed-rank test
대응 표본의 경우 결과 변수가 서열변수거나 연속형 변수여도 정규성 가정을 충족하지 않는 경우에 활용하는 비모수 검정
대표 값은 mean 대신에 median으로 연구에 제시 필요성
EX) R 코드에서 wilcoxon rank sum test 코드: wilcox.test(post-pre,exact=FALSE)
-McNemar test
EX) 예방법에 따라 질병 발생이 달라지는 지 확인
결과 변수가 서열변수나 연속형 변수가 아닌 명목형 변수일 때 사용
한 쪽 다리엔 미니 절개법, 다른 한쪽에는 절개 법으로 수술 한 후 만족 여부를 물어봤을 때 차이가 많이 나는 것에 관심을 가지는 경우
EX) R 코드에서 McNemar 코드:
tab = table(data) ##빈도표
mcnemar.test(tab, correct = F)
-Cochran-Armitage trend test
명목형 변수의 경향성 분석 방법
Repeated measures ANOVA
3군이상에 대한 검정이라는 점에서 t-test와는 다름
EX) 한 사람에 대해 a약, b약, c약 투약 후 혈압 차이가 있는지 확인
t-test와 마찬가지로 결과 값이 되는 종속변수는 반드시 연속 변수
EX) R 코드에서 Repeated measures one way anova 코드:
model <- aov(response~factor(drug)+Error(factor(patient)), data = df)
summary(model)
-Friedman test (Repeated Measures Anova가 비모수 일때)
3군이상에 대한 검정+ Man Whitney U test와 마찬가지로 결과 변수가 서열변수거나 연속형 변수여도 정규성 가정을 충족하지 않는 경우에 활용하는 비모수 검정
EX) R 코드에서 Friedman test 코드:
friedman.test(y=data $ response, groups=data $ drug,blocks=data $ patient)
Repeated measures 2-way ANOVA
추가로 추후 보충 할 것
References
한눈에 쏙쏙 의학통계 배우기 3판 by 김용은 , 김지형
그림으로 이해하는 닥터배의 술술 보건의학통계 by 배정민
https://bioinformaticsandme.tistory.com/175