1 Counterfactual model
1.1 Background
인과추론의 공식적인 모델로 counterfactual model을 채택한 이유는 인과추론의 기본적인 정의가 다양하고 정립된 것이 없기 때문에 그 중 confounding분석에서 conterfactual과 potential outcomes 접근법이 유용한 것으로 입증되었기 때문입니다[1]. 인과추론을 위한 통계적 방법을 도출하는 데 필요한 정의는 Neyman(1923)의 통계 문헌에 처음으로 나타났습니다. 인과 효과 개념은 다음과 같습니다.
N명의 개인 (예: 개인, 집단, 객체)이 실험에서 관찰되며, 각 개인은 K+1개의 처치 (x0,x1,...,xK) 중 하나를 받습니다. 단위 i에 대한 관심 결과는 반응 변수 Yi의 값입니다. 단위 i가 처치 xk를 받으면 Yi=yik {yi0,yi1,…,yin}와 같습니다. (개별) 인과 효과는 어떤 한 개인이 만약 다른 치료를 받았을 경우에 치료 효과와 실제 받은 치료 효과를 비교하는 것이다[1].
yik−yij
Neyman의 정의는 potential outcomes model로도 불리며, 각 개인은 하나의 치료만 받기 때문에 잠재 결과 yik 중 하나만 관찰할 수 있습니다. 따라서 개인별 인과효과 yik−yi0는 관찰할 수 없습니다. 실제로 발생하지 않아 관찰할 수 없는 잠재결과의 분포를 가정한다는 이유로 counterfactual 접근법은 때때로 비판받습니다[1].
잠재결과 분포의 일부 중요한 특징은 실증적으로 검증할 수 없으며, 따라서 counterfactual approach에 기반한 일부 인과추론은 전적으로 검증 불가능한 가정 (1. confounding이 없다는 가정, 2. 개별 개체의 감수성 (susceptibilities) 이나 반응변수의 독립성에 대한 가정)에 의존하게 됩니다 (Dawid, 1998). 하지만 greenland(1999)는 이러한 점을 counterfactual approach의 약점이 아니라 오히려 강점이라고 주장합니다[1].
개별 인과효과를 추정하는 것은 어렵기 때문에 모집단을 대상으로 인과효과를 추정합니다. 모집단 효과는 서로 다른 치료 하에서 평균 모집단 효과 차이로 정의되거나 더 일반적으로 각 치료의 주변부 분포의 차이로 정의합니다[1].
E(yk)−E(yj)orF(yk)−F(yj)
따라서 일반적인 인과효과 추정은 예측모델 등 공변량을 조정한 조건부 모델이 아닌 주변부 모델을 이용한다. 예를 들어, x1이 모집단 A에 적용될 경우 μ=μA1이 되고, x0이 적용될 경우 μA0이 된다면, x1과 x0의 (평균) 인과효과는 다음과 같이 측정할 수 있습니다.
μA1−μA0
만약 모집단 A가 치료 x1 하에서 관찰되면, μ는 μA1이 되어 이는 관찰 가능하거나 추정 가능하지만, μA0는 관찰되지 않습니다. 위에서도 언급한 이 한계로 인해 데이터로부터 인과효과 추정을 직접 할 수 없습니다. 대안 방법은 μA0=μB0를 가지는 참조 모집단 B를 얻는 것입니다. 이러한 집단을 모집단 A와 교환 가능 (exchangeable)하다고 말합니다. 특히 무작위 연구에서는 unconditional exchangeable를 만족하므로 μA0과 μB0사이의 무작위 차이로 인해 μA0을 μB0로 대체 가능하여 μA1−μA0 추론을 유도할 수 있게 해줍니다.
F(μA0,μB0)=F(μB0,μA0)
이 때 모집단 A에서 모집단 개인 전체가 치료 x1을 받았을 때와 받지 않았을 때 효과를 측정하는 μA1−μA0는 (평균) 인과효과이며 두 모집단을 통틀어 치료를 받은 개인과 치료를 받지 않은 개인별 결과의 효과를 측정하는 μA1−μB0는 (개별) 연관 효과입니다.
μA0 대신 μB0를 대입하여 얻은 naive (crude) association 모수가 causal 모수와 같지 않을때, 이 association 모수는 confounding되었다고 할 수 있습니다. 예를 들어, μB0=μA0일 경우, μA1−μB0는 모집단 A에서 치료 x1의 효과인 μA1−μA0와는 다릅니다. 따라서 μA1−μB0와 같은 association 모수가 μA1−μA0라는 causal 모수에 confounding을 일으킨다고 말하는 것은 두 모수가 같지 않다는 것과 동의어입니다. 참고로 confounding을 없다고 가정하는 것은 현실적이지 않습니다. 따라서 위에서 언급한 교환가능성 (exchangeable)이 성립하는 모집단을 구축하는 것이 목표입니다.
무작위 대조 실험 (RCT; randomized controlled trial)에서는 μA0=μB0이 성립하므로 통계적 방법을 사용하지 않고 직접 인과효과 추정이 가능합니다. 하지만 비무작위 연구에서는 치료군 간 공변량이 체계적 (치료 외의 다른 요인)으로 다르기 때문에 (μA0=μB0) confounding문제가 발생한다. 이 경우 μA0 대신 μB0를 대입하여 얻은 naive (crude) 연관효과는 인과효과와 같지 않습니다.
- RCT에서도 치료 할당, 투여 및 준수에서의 체계적인 요소들, 그리고 비교군 간의 무작위 차이들 때문에 confounding이 발생할 수 있습니다.
따라서 인과 효과를 추정하는 비무작위 연구에서 confounding을 고려하여 편향없는 인과효과를 추정하도록 노력해야합니다. 무작위 연구처럼 비무작위 연구에서 교환가능성 (exchangeable)이 성립하기 위해서는 강한 무시 가능성 (strongly ignorable)을 만족하여야 합니다. 강한 무시가능성을 만족하기 위한 두가지 가정은 다음과 같습니다.
-
Z⊥{y0,y1…,yk}∣X
-
0<Pr(Z=1∣X)<1
Apendix
이 때 두 모집단을 통틀어 치료를 받은 개인과 치료를 받지 않은 개인별 결과의 효과를 측정하는 μA1−μB0는 (개별) 연관 효과이며 확률로 Pr(Y=1∣X=x)와 같이 표현합니다. 모집단 A에서 모집단 개인 전체가 치료 x1을 받았을 때와 받지 않았을 때 효과를 측정하는 μA1−μA0는 (평균) 인과효과이며 확률로 Pr(Yx=1)와 같이 표현합니다. 일반적으로 연관 측도와 인과 측도는 동일하지 않습니다[2]. associational risk difference를 예로 들어보겠습니다.
ϕ=Pr(Y=1∣T=t): Y와 T 사이의 연관성 척도
ϕ=P(Y=1∣T=Rx)−P(Y=1∣T=C)=x∑[{P(Y=1∣T=Rx,X=x)P(X=x∣T=Rx)}−{P(Y=1∣T=C,X=x)P(X=x∣T=C)}](1)
μ=Pr(Yx=1): 모집단의 인과성 척도
μ=P(Y(Rx)=1)−P(Y(C)=1)=x∑[P(Y(Rx)=1∣X=x)−P(Y(C)=1∣X=x)]P(X=x)(2)
식 (1),(2)를 비교해 보면, 왜 연관 척도 (associational measures)와 인과적 효과 척도 (causal effect measures)를 구분해야 하는지 분명해집니다. 치료를 Rx 또는 C로 고정하는 개입 (intervention)은 치료와 기초 공변량 간의 의존성을 "제거"하기 때문입니다.
-
Greenland, S., Robins, J. M., & Pearl, J. (1999). Confounding and collapsibility in causal inference. Statistical Science, 14,29–46. 번역본
-
Didelez, V.; Stensrud, M.J. On the logic of collapsibility for causal effect measures. Biom. J. 2021. 번역본