Causal inference

choyunjeong·2025년 1월 25일

석사학위논문 이론내용

목록 보기

1/7

1 Counterfactual model

1.1 Background

인과추론의 공식적인 모델로 $\text{counterfactual model}$ 을 채택한 이유는 인과추론의 기본적인 정의가 다양하고 정립된 것이 없기 때문에 그 중 $\text{confounding}$ 분석에서 $\text{conterfactual}$ 과 $\text{potential outcomes}$ 접근법이 유용한 것으로 입증되었기 때문입니다[1]. 인과추론을 위한 통계적 방법을 도출하는 데 필요한 정의는 Neyman(1923)의 통계 문헌에 처음으로 나타났습니다. 인과 효과 개념은 다음과 같습니다.

$N$ 명의 개인 (예: 개인, 집단, 객체)이 실험에서 관찰되며, 각 개인은 $K+1$ 개의 처치 $(x_0, x_1, ..., x_K)$ 중 하나를 받습니다. 단위 $i$ 에 대한 관심 결과는 반응 변수 $Y_i$ 의 값입니다. 단위 $i$ 가 처치 $x_k$ 를 받으면 $Y_i=y_{ik}\ \{y_{i0},y_{i1},\ldots,y_{in}\}$ 와 같습니다. (개별) 인과 효과는 어떤 한 개인이 만약 다른 치료를 받았을 경우에 치료 효과와 실제 받은 치료 효과를 비교하는 것이다[1].
$y_{ik} - y_{ij}$

Neyman의 정의는 $\text{potential outcomes model}$ 로도 불리며, 각 개인은 하나의 치료만 받기 때문에 잠재 결과 $y_{ik}$ 중 하나만 관찰할 수 있습니다. 따라서 개인별 인과효과 $y_{ik} - y_{i0}$ 는 관찰할 수 없습니다. 실제로 발생하지 않아 관찰할 수 없는 잠재결과의 분포를 가정한다는 이유로 $\text{counterfactual}$ 접근법은 때때로 비판받습니다[1].

잠재결과 분포의 일부 중요한 특징은 실증적으로 검증할 수 없으며, 따라서 $\text{counterfactual approach}$ 에 기반한 일부 인과추론은 전적으로 검증 불가능한 가정 (1. $\text{confounding}$ 이 없다는 가정, 2. 개별 개체의 감수성 $\text{(susceptibilities)}$ 이나 반응변수의 독립성에 대한 가정)에 의존하게 됩니다 (Dawid, 1998). 하지만 greenland(1999)는 이러한 점을 $\text{counterfactual approach}$ 의 약점이 아니라 오히려 강점이라고 주장합니다[1].

$\\[30pt]$

1.2 Formalization

개별 인과효과를 추정하는 것은 어렵기 때문에 모집단을 대상으로 인과효과를 추정합니다. 모집단 효과는 서로 다른 치료 하에서 평균 모집단 효과 차이로 정의되거나 더 일반적으로 각 치료의 주변부 분포의 차이로 정의합니다[1].

E(y_k) - E(y_j)\quad \text{or}\quad F(y_k) - F(y_j)

따라서 일반적인 인과효과 추정은 예측모델 등 공변량을 조정한 조건부 모델이 아닌 주변부 모델을 이용한다. 예를 들어, $x_1$ 이 모집단 $A$ 에 적용될 경우 $\mu=\mu_{A1}$ 이 되고, $x_0$ 이 적용될 경우 $\mu_{A0}$ 이 된다면, $x_1$ 과 $x_0$ 의 (평균) 인과효과는 다음과 같이 측정할 수 있습니다.

\mu_{A1}-\mu_{A0}

만약 모집단 $A$ 가 치료 $x_1$ 하에서 관찰되면, $\mu$ 는 $\mu_{A1}$ 이 되어 이는 관찰 가능하거나 추정 가능하지만, $\mu_{A0}$ 는 관찰되지 않습니다. 위에서도 언급한 이 한계로 인해 데이터로부터 인과효과 추정을 직접 할 수 없습니다. 대안 방법은 $\mu_{A0}=\mu_{B0}$ 를 가지는 참조 모집단 $B$ 를 얻는 것입니다. 이러한 집단을 모집단 $A$ 와 교환 가능 $(\text{exchangeable})$ 하다고 말합니다. 특히 무작위 연구에서는 $\text{unconditional exchangeable}$ 를 만족하므로 $\mu_{A0}$ 과 $\mu_{B0}$ 사이의 무작위 차이로 인해 $\mu_{A0}$ 을 $\mu_{B0}$ 로 대체 가능하여 $\mu_{A1} - \mu_{A0}$ 추론을 유도할 수 있게 해줍니다.

F(\mu_{A0}, \mu_{B0}) = F(\mu_{B0}, \mu_{A0})

이 때 모집단 $A$ 에서 모집단 개인 전체가 치료 $x_1$ 을 받았을 때와 받지 않았을 때 효과를 측정하는 $\mu_{A1}-\mu_{A0}$ 는 (평균) 인과효과이며 두 모집단을 통틀어 치료를 받은 개인과 치료를 받지 않은 개인별 결과의 효과를 측정하는 $\mu_{A1}-\mu_{B0}$ 는 (개별) 연관 효과입니다.

$\mu_{A0}$ 대신 $\mu_{B0}$ 를 대입하여 얻은 $\text{naive (crude) association}$ 모수가 $\text{causal}$ 모수와 같지 않을때, 이 $\text{association}$ 모수는 $\text{confounding}$ 되었다고 할 수 있습니다. 예를 들어, $\mu_{B0}\neq\mu_{A0}$ 일 경우, $\mu_{A1}-\mu_{B0}$ 는 모집단 $A$ 에서 치료 $x_1$ 의 효과인 $\mu_{A1}-\mu_{A0}$ 와는 다릅니다. 따라서 $\mu_{A1}-\mu_{B0}$ 와 같은 $\text{association}$ 모수가 $\mu_{A1}-\mu_{A0}$ 라는 $\text{causal}$ 모수에 $\text{confounding}$ 을 일으킨다고 말하는 것은 두 모수가 같지 않다는 것과 동의어입니다. 참고로 $\text{confounding}$ 을 없다고 가정하는 것은 현실적이지 않습니다. 따라서 위에서 언급한 교환가능성 $(\text{exchangeable})$ 이 성립하는 모집단을 구축하는 것이 목표입니다.

무작위 대조 실험 $\text{(RCT;}$ $\text{randomized controlled trial)}$ 에서는 $\mu_{A0}=\mu_{B0}$ 이 성립하므로 통계적 방법을 사용하지 않고 직접 인과효과 추정이 가능합니다. 하지만 비무작위 연구에서는 치료군 간 공변량이 체계적 (치료 외의 다른 요인)으로 다르기 때문에 ( $\mu_{A0}\neq\mu_{B0}$ ) $\text{confounding}$ 문제가 발생한다. 이 경우 $\mu_{A0}$ 대신 $\mu_{B0}$ 를 대입하여 얻은 $\text{naive (crude)}$ 연관효과는 인과효과와 같지 않습니다.

$\text{RCT}$ 에서도 치료 할당, 투여 및 준수에서의 체계적인 요소들, 그리고 비교군 간의 무작위 차이들 때문에 $\text{confounding}$ 이 발생할 수 있습니다.

따라서 인과 효과를 추정하는 비무작위 연구에서 $\text{confounding}$ 을 고려하여 편향없는 인과효과를 추정하도록 노력해야합니다. 무작위 연구처럼 비무작위 연구에서 교환가능성 $(\text{exchangeable})$ 이 성립하기 위해서는 강한 무시 가능성 $(\text{strongly ignorable})$ 을 만족하여야 합니다. 강한 무시가능성을 만족하기 위한 두가지 가정은 다음과 같습니다.

$Z\perp \{y_0,y_1\ldots,y_k\}|X$
$0<\Pr(Z=1|X)<1$

Apendix

이 때 두 모집단을 통틀어 치료를 받은 개인과 치료를 받지 않은 개인별 결과의 효과를 측정하는 $\mu_{A1}-\mu_{B0}$ 는 (개별) 연관 효과이며 확률로 $\Pr(Y=1|X=x)$ 와 같이 표현합니다. 모집단 $A$ 에서 모집단 개인 전체가 치료 $x_1$ 을 받았을 때와 받지 않았을 때 효과를 측정하는 $\mu_{A1}-\mu_{A0}$ 는 (평균) 인과효과이며 확률로 $\Pr(Y_x=1)$ 와 같이 표현합니다. 일반적으로 연관 측도와 인과 측도는 동일하지 않습니다[2]. $\text{associational}$ $\text{risk difference}$ 를 예로 들어보겠습니다.

$\phi = \Pr(Y=1|T=t)$ : $Y$ 와 $T$ 사이의 연관성 척도

\begin{aligned} \phi &= P(Y=1|T=Rx) - P(Y=1|T=C) \\[15pt] &= \sum_x \left[\left\{P(Y=1|T=Rx, X=x)P(X=x|T=Rx)\right\}\right. \\[15pt] &\quad\quad\quad \left.- \left\{P(Y=1|T=C, X=x)P(X=x|T=C)\right\}\right] \tag{1} \end{aligned}

$\mu=\Pr(Y_x=1)$ : 모집단의 인과성 척도

\begin{aligned} \mu &= P(Y(Rx) = 1) - P(Y(C) = 1) \\[15pt] &= \sum_{x} [P(Y(Rx) = 1|X = x) - P(Y(C) = 1|X = x)] P(X = x) \tag{2} \end{aligned}

식 $(1),(2)$ 를 비교해 보면, 왜 연관 척도 $\text{(associational measures)}$ 와 인과적 효과 척도 $\text{(causal effect measures)}$ 를 구분해야 하는지 분명해집니다. 치료를 $Rx$ 또는 $C$ 로 고정하는 개입 $\text{(intervention)}$ 은 치료와 기초 공변량 간의 의존성을 "제거"하기 때문입니다.

$\\[30pt]$

References

choyunjeong

다음 포스트