Causal inference

choyunjeong·2025년 1월 25일

1 Counterfactual model

1.1 Background

인과추론의 공식적인 모델로 counterfactual model\text{counterfactual model}을 채택한 이유는 인과추론의 기본적인 정의가 다양하고 정립된 것이 없기 때문에 그 중 confounding\text{confounding}분석에서 conterfactual\text{conterfactual}potential outcomes\text{potential outcomes} 접근법이 유용한 것으로 입증되었기 때문입니다[1]. 인과추론을 위한 통계적 방법을 도출하는 데 필요한 정의는 Neyman(1923)의 통계 문헌에 처음으로 나타났습니다. 인과 효과 개념은 다음과 같습니다.

NN명의 개인 (예: 개인, 집단, 객체)이 실험에서 관찰되며, 각 개인은 K+1K+1개의 처치 (x0,x1,...,xK)(x_0, x_1, ..., x_K) 중 하나를 받습니다. 단위 ii에 대한 관심 결과는 반응 변수 YiY_i의 값입니다. 단위 ii가 처치 xkx_k를 받으면 Yi=yik {yi0,yi1,,yin}Y_i=y_{ik}\ \{y_{i0},y_{i1},\ldots,y_{in}\}와 같습니다. (개별) 인과 효과는 어떤 한 개인이 만약 다른 치료를 받았을 경우에 치료 효과와 실제 받은 치료 효과를 비교하는 것이다[1].

yikyijy_{ik} - y_{ij}

Neyman의 정의는 potential outcomes model\text{potential outcomes model}로도 불리며, 각 개인은 하나의 치료만 받기 때문에 잠재 결과 yiky_{ik} 중 하나만 관찰할 수 있습니다. 따라서 개인별 인과효과 yikyi0y_{ik} - y_{i0}는 관찰할 수 없습니다. 실제로 발생하지 않아 관찰할 수 없는 잠재결과의 분포를 가정한다는 이유로 counterfactual\text{counterfactual} 접근법은 때때로 비판받습니다[1].

잠재결과 분포의 일부 중요한 특징은 실증적으로 검증할 수 없으며, 따라서 counterfactual approach\text{counterfactual approach}에 기반한 일부 인과추론은 전적으로 검증 불가능한 가정 (1. confounding\text{confounding}이 없다는 가정, 2. 개별 개체의 감수성 (susceptibilities)\text{(susceptibilities)} 이나 반응변수의 독립성에 대한 가정)에 의존하게 됩니다 (Dawid, 1998). 하지만 greenland(1999)는 이러한 점을 counterfactual approach\text{counterfactual approach}의 약점이 아니라 오히려 강점이라고 주장합니다[1].

\\[30pt]

1.2 Formalization

개별 인과효과를 추정하는 것은 어렵기 때문에 모집단을 대상으로 인과효과를 추정합니다. 모집단 효과는 서로 다른 치료 하에서 평균 모집단 효과 차이로 정의되거나 더 일반적으로 각 치료의 주변부 분포의 차이로 정의합니다[1].

E(yk)E(yj)orF(yk)F(yj)E(y_k) - E(y_j)\quad \text{or}\quad F(y_k) - F(y_j)

따라서 일반적인 인과효과 추정은 예측모델 등 공변량을 조정한 조건부 모델이 아닌 주변부 모델을 이용한다. 예를 들어, x1x_1이 모집단 AA에 적용될 경우 μ=μA1\mu=\mu_{A1}이 되고, x0x_0이 적용될 경우 μA0\mu_{A0}이 된다면, x1x_1x0x_0의 (평균) 인과효과는 다음과 같이 측정할 수 있습니다.

μA1μA0\mu_{A1}-\mu_{A0}

만약 모집단 AA가 치료 x1x_1 하에서 관찰되면, μ\muμA1\mu_{A1}이 되어 이는 관찰 가능하거나 추정 가능하지만, μA0\mu_{A0}는 관찰되지 않습니다. 위에서도 언급한 이 한계로 인해 데이터로부터 인과효과 추정을 직접 할 수 없습니다. 대안 방법은 μA0=μB0\mu_{A0}=\mu_{B0}를 가지는 참조 모집단 BB를 얻는 것입니다. 이러한 집단을 모집단 AA와 교환 가능 (exchangeable)(\text{exchangeable})하다고 말합니다. 특히 무작위 연구에서는 unconditional exchangeable\text{unconditional exchangeable}를 만족하므로 μA0\mu_{A0}μB0\mu_{B0}사이의 무작위 차이로 인해 μA0\mu_{A0}μB0\mu_{B0}로 대체 가능하여 μA1μA0\mu_{A1} - \mu_{A0} 추론을 유도할 수 있게 해줍니다.

F(μA0,μB0)=F(μB0,μA0)F(\mu_{A0}, \mu_{B0}) = F(\mu_{B0}, \mu_{A0})

이 때 모집단 AA에서 모집단 개인 전체가 치료 x1x_1을 받았을 때와 받지 않았을 때 효과를 측정하는 μA1μA0\mu_{A1}-\mu_{A0}는 (평균) 인과효과이며 두 모집단을 통틀어 치료를 받은 개인과 치료를 받지 않은 개인별 결과의 효과를 측정하는 μA1μB0\mu_{A1}-\mu_{B0}는 (개별) 연관 효과입니다.

μA0\mu_{A0} 대신 μB0\mu_{B0}를 대입하여 얻은 naive (crude) association\text{naive (crude) association} 모수가 causal\text{causal} 모수와 같지 않을때, 이 association\text{association} 모수는 confounding\text{confounding}되었다고 할 수 있습니다. 예를 들어, μB0μA0\mu_{B0}\neq\mu_{A0}일 경우, μA1μB0\mu_{A1}-\mu_{B0}는 모집단 AA에서 치료 x1x_1의 효과인 μA1μA0\mu_{A1}-\mu_{A0}와는 다릅니다. 따라서 μA1μB0\mu_{A1}-\mu_{B0}와 같은 association\text{association} 모수가 μA1μA0\mu_{A1}-\mu_{A0}라는 causal\text{causal} 모수에 confounding\text{confounding}을 일으킨다고 말하는 것은 두 모수가 같지 않다는 것과 동의어입니다. 참고로 confounding\text{confounding}을 없다고 가정하는 것은 현실적이지 않습니다. 따라서 위에서 언급한 교환가능성 (exchangeable)(\text{exchangeable})이 성립하는 모집단을 구축하는 것이 목표입니다.

무작위 대조 실험 (RCT;\text{(RCT;} randomized controlled trial)\text{randomized controlled trial)}에서는 μA0=μB0\mu_{A0}=\mu_{B0}이 성립하므로 통계적 방법을 사용하지 않고 직접 인과효과 추정이 가능합니다. 하지만 비무작위 연구에서는 치료군 간 공변량이 체계적 (치료 외의 다른 요인)으로 다르기 때문에 (μA0μB0\mu_{A0}\neq\mu_{B0}) confounding\text{confounding}문제가 발생한다. 이 경우 μA0\mu_{A0} 대신 μB0\mu_{B0}를 대입하여 얻은 naive (crude)\text{naive (crude)} 연관효과는 인과효과와 같지 않습니다.

  • RCT\text{RCT}에서도 치료 할당, 투여 및 준수에서의 체계적인 요소들, 그리고 비교군 간의 무작위 차이들 때문에 confounding\text{confounding}이 발생할 수 있습니다.

따라서 인과 효과를 추정하는 비무작위 연구에서 confounding\text{confounding}을 고려하여 편향없는 인과효과를 추정하도록 노력해야합니다. 무작위 연구처럼 비무작위 연구에서 교환가능성 (exchangeable)(\text{exchangeable})이 성립하기 위해서는 강한 무시 가능성 (strongly ignorable)(\text{strongly ignorable})을 만족하여야 합니다. 강한 무시가능성을 만족하기 위한 두가지 가정은 다음과 같습니다.

  1. Z{y0,y1,yk}XZ\perp \{y_0,y_1\ldots,y_k\}|X

  2. 0<Pr(Z=1X)<10<\Pr(Z=1|X)<1


Apendix

이 때 두 모집단을 통틀어 치료를 받은 개인과 치료를 받지 않은 개인별 결과의 효과를 측정하는 μA1μB0\mu_{A1}-\mu_{B0}는 (개별) 연관 효과이며 확률로 Pr(Y=1X=x)\Pr(Y=1|X=x)와 같이 표현합니다. 모집단 AA에서 모집단 개인 전체가 치료 x1x_1을 받았을 때와 받지 않았을 때 효과를 측정하는 μA1μA0\mu_{A1}-\mu_{A0}는 (평균) 인과효과이며 확률로 Pr(Yx=1)\Pr(Y_x=1)와 같이 표현합니다. 일반적으로 연관 측도와 인과 측도는 동일하지 않습니다[2]. associational\text{associational} risk difference\text{risk difference}를 예로 들어보겠습니다.

ϕ=Pr(Y=1T=t)\phi = \Pr(Y=1|T=t): YYTT 사이의 연관성 척도

ϕ=P(Y=1T=Rx)P(Y=1T=C)=x[{P(Y=1T=Rx,X=x)P(X=xT=Rx)}{P(Y=1T=C,X=x)P(X=xT=C)}](1)\begin{aligned} \phi &= P(Y=1|T=Rx) - P(Y=1|T=C) \\[15pt] &= \sum_x \left[\left\{P(Y=1|T=Rx, X=x)P(X=x|T=Rx)\right\}\right. \\[15pt] &\quad\quad\quad \left.- \left\{P(Y=1|T=C, X=x)P(X=x|T=C)\right\}\right] \tag{1} \end{aligned}

μ=Pr(Yx=1)\mu=\Pr(Y_x=1): 모집단의 인과성 척도

μ=P(Y(Rx)=1)P(Y(C)=1)=x[P(Y(Rx)=1X=x)P(Y(C)=1X=x)]P(X=x)(2)\begin{aligned} \mu &= P(Y(Rx) = 1) - P(Y(C) = 1) \\[15pt] &= \sum_{x} [P(Y(Rx) = 1|X = x) - P(Y(C) = 1|X = x)] P(X = x) \tag{2} \end{aligned}

(1),(2)(1),(2)를 비교해 보면, 왜 연관 척도 (associational measures)\text{(associational measures)}와 인과적 효과 척도 (causal effect measures)\text{(causal effect measures)}를 구분해야 하는지 분명해집니다. 치료를 RxRx 또는 CC로 고정하는 개입 (intervention)\text{(intervention)}은 치료와 기초 공변량 간의 의존성을 "제거"하기 때문입니다.

\\[30pt]


  • References
  1. Greenland, S., Robins, J. M., & Pearl, J. (1999). Confounding and collapsibility in causal inference. Statistical Science, 14,29–46. 번역본

  2. Didelez, V.; Stensrud, M.J. On the logic of collapsibility for causal effect measures. Biom. J. 2021. 번역본

0개의 댓글