2. Confounding in observational study
비무작위 연구는 무작위 연구와 달리 인과효과를 추정할 때 confounding 문제가 발생할 가능성이 많습니다. A 모집단의 평균 인과효과 추정을 위해 구성한 참조 모집단 B가 μA=μB인 경우 confounding이 존재한다고 말하는데 이는 치료군 간 공변량이 체계적 (치료 외의 다른 요인)으로 다르기 때문에 발생합니다. (엄밀히 말하면 두 군간 공변량이 달라도 confounding이 발생하지 않을 수도 있습니다.) 이 때 confounding을 일으키는 변수를 confounder로 간주 합니다. 즉, confounder는 비교 집단 간 공변량의 분포가 달라 모수 μ에 인과적으로 영향을 미칠 수 있어야 합니다.
관찰연구(비무작위 연구)에서 confounding의 정도는 "단순 연관 측도 추정값 ϕ (simple associational measure)"와 "적절한 조정 (예: 표준화 또는 IPTW)을 통해 얻어진 인과적 주변부 효과 추정값 μ (causal marginal effect)"를 비교하여 측정됩니다[1]. 확률로 표현한다면 다음과 같습니다. (이 과정에서 다른 구조적 편향의 원인은 배제해야 합니다.)
P(Y=y∣T=t) vs P(Y(t)=y)
즉, 양변이 동일한 값을 가져야 confounding이 없는 인과효과를 추론할 수 있습니다. 앞 장에서 관찰연구에서 치료할당이 강한 무시가능성 (strongly ignorable)을 가질 때 모집단간 교환가능하다고 배웠습니다. 이 장에서는 실제 검증 불가능한 가정 두개를 추가로 설명하고 관측된 데이터가 세가지 가정을 만족한다면 confounding이 없는 인과 효과 추론이 가능한 이유를 설명합니다[2]. 이러한 가정은 잠재결과와 관측 가능한 변수 간의 관계를 의미합니다. 여러 논문에서 다양한 용어로 불리는데 우리는 Rubin의 잠재결과 프레임워크를 참고하였습니다[3].
2. Rubin의 잠재결과 프레임워크
- stable unit treatment value assumption (SUTVA) 가정
: 잠재 결과를 Yi(Z)라고 할 때 모든 피험자는 두개의 잠재 결과 Yi(1), Yi(0)를 가진다고 할 때 각 피험자의 잠재결과는 다른 피험자의 처치 배정에 영향을 받지 않아야 하며 하나의 값만 관측되어야 합니다. 이때 관측되지 않은 결과를 counterfactual 결과라고 합니다.
Yi=ZiYi(1)−(1−Zi)Yi(0)
- conditional exchangeability
: 공변량 X가 주어졌을 때 처치와 잠재결과 집합이 조건부 독립을 만족한다 즉, Z가 Y에 미치는 효과에서 X 외에는 confounding이 없음을 의미합니다[2].
Y(t)⊥Z∣X
- positivity 가정
교란변수가 주어졌을 때 처치를 배정받을 확률이 0과 1 사이라는 것이다.
가정 2,3을 만족한다면 치료할당이 강한 무시가능성을 따른다고 합니다. 교란변수가 주어졌을 때 치료할당이 강한 무시가능성을 만족한다면, 성향점수를 사용하여도 강한 무시가능성을 만족하여 편향 없는 인과 효과 추정이 가능합니다. (무작위 연구는 대부분 위 가정을 만족)
증명 치료할당이 강한 무시가능성을 만족하면 편향없는 인과 효과 추정이 가능한 이유[3].
Rubin은 인과효과를 다음과 같이 정의하였습니다.
ATE=E(r1)−E(r0)
치료 z=1에 무작위 선택된 개인과 치료 z=0에 무작위 선택된 개인을 비교할 때, 반응 변수의 기댓값 차이는 다음과 같습니다.
E(r1∣z=1)−E(r0∣z=0)
이는 일반적으로 인과효과 E(r1)−E(r0)와 같지 않은데, 이는 전체 모집단 rt의 주변 분포가 아니라 z=t인 경우의 조건부 분포에서 나왔기 때문입니다.
- X가 주어졌을 때
치료군과 대조군의 모든 개체들을 포함한 전체 모집단에서 공변량 벡터 x의 특정 값이 무작위 추출된 후, 치료군과 대조군 각각에서 해당 공변량 벡터 값을 가진 개체가 발견된다고 가정합니다. 이 두 단계 샘플링 과정에서 반응변수의 기댓값 차이는 다음과 같습니다.
Ex{E(r1∣x,z=1)−E(r0∣x′,z=0)}
여기서 Ex는 전체 모집단에서 x 분포에 관한 기대값을 의미합니다. 만약 치료 할당이 강하게 무시 가능하다면, 즉
(r1,r0)⊥z∣x,0<Pr(z=1∣x)<1
이라면
Ex{E(r1∣x,z=1)−E(r0∣x′,z=0)}=Ex{E(r1∣x)−E(r0∣x)}=E(r1)−E(r0)
- e(x)가 주어졌을 때
치료군과 대조군의 모든 개체들을 포함한 전체 모집단에서 성향 점수 e(x)의 특정 값이 무작위 추출된 후, 치료군과 대조군 각각에서 해당 e(x) 값을 가진 개체가 발견된다고 가정합니다. 단, 이들 개체들은 x의 값이 다를 수 있습니다. 강하게 무시 가능한 치료 할당이 주어진다면,
E{r1∣e(x),z=1}−E{r0∣e(x),z=0}=E{r1∣e(x)}−E{r0∣e(x)}
에서
Ee(x)[E{r1∣e(x),z=1}−E{r0∣e(x),z=0}]=Ee(x)[E{r1∣e(x)}−E{r0∣e(x)}]=E(r1−r0)
이 증명에서 중요한 과정은
E(rt∣x,z=1)=E(rt∣x,z=0)=E(rt∣x)
인데 strongly ignorable 중 conditional exchangeability 가정을 만족하기 때문에 양 변이 성립한다.
Y(t)⊥Z∣X
- conditional exchangeability 또는 randomization 하에서 다음이 성립합니다[2].
Pr(Y(z)=y∣X=x)=Pr(Y=y∣Z=z,X=x)
이는 RCT로부터 z=1,0일 때, P(Y(z)=y∣X=x)는 데이터로 계산 가능한 P(Y=y∣Z=z,X=x)로 추정 가능하기 때문입니다. 따라서 치료할당이 강하게 무시 가능하다면 서로 다른 치료를 받더라도 서로의 대조군으로 적용 가능하다고 해석할 수 있습니다[3].
3. Imbens의 일반화성향점수
Rubin의 성향점수방법은 치료가 이항처치일 경우에만 성립한다는 한계점이 존재합니다. 이를 해결하기 위해 Imbens는 일반화 성향점수를 제안하였습니다. 주요 포인트는 Rubin의 방법처럼 인과 비교가 유효한 하위 집단으로 인구를 나누는 것
E(r1−r0∣e(x))
대신 다음과 같이 평균 잠재 결과를 추정할 수 있는 하위집단으로 나누는 것 으로 충분합니다.
E(r(t)∣e(x))
우선 치료를 받았는지 여부를 나타내는 지표를 정의합니다.
Di(t)=⎩⎪⎨⎪⎧1 if Ti=t0 otherwise
Imbens는 X를 조정하여 Y(t)의 기댓값을 추정하는데 Rubin의 조건부 교환가능성 가정의 강력한 가정이 필요하지 않다는 점을 강조합니다.
D(t)⊥Y(t)∣X
이를 weak unconfoundedness라고 가정합니다. 즉, 각각의 치료와 잠재 결과와의 쌍별 독립성만을 필요로 합니다.
E(Y(t)∣X)=E(Y(t)∣D(t)=1,X)=E(Y∣D(t)=1,X)=E(Y∣T=t,X)
그 후 이중기댓값 공식을 사용하여 조건부 평균을 평균하여 주변부 평균값을 추정합니다.
E(Y(t))=E[E(Y(t)∣X)]
X가 weak unconfoundedness가정을 만족한다면 imbens의 일반화 성향점수도 weak unconfoundedness가정을 만족합니다.
D(t)⊥Y(t)∣r(t,X)
이항 치료일 때 성향점수는 설명변수가 주어졌을 때 치료를 받을 조건부 확률로 정의했으며, 로지스틱 모형으로 대부분 추정합니다.
e(x)=Pr(Z=1∣X)
일반화 성향점수도 기존 성향점수 정의를 다항 치료로 확장합니다.
r(t,x)=Pr(Z=z∣X=x)=E{D(t)∣X=x}
일반화 성향점수 방법은 다음과 같다.
-
r(t,x)를 추정합니다. 보통 다항 로지스틱 모형을 사용합니다.
-
조건부 기댓값
β(t,r)=E{Y∣T=t,r(t,X)=r}
-
치료 수준 t에서의 평균 반응을 구하기 위해 설명 변수의 분포를 평균화한다.
E{β(t,r)}=E[E{Y∣T=t,r(t,X)=r}]=E{Y(t)}
-
Greenland, S., Robins, J. M., & Pearl, J. (1999). Confounding and collapsibility in causal inference. Statistical Science, 14,29–46. 번역본
-
Didelez, V.; Stensrud, M.J. On the logic of collapsibility for causal effect measures. Biom. J. 2021. 번역본
-
Rosenbaum PR, Rubin DB. The central role of the propensity score in observational studies for causal effects. Biometrika 1983; 70:41–55.번역본
-
Imbens, G. W. (2000). The role of the propensity score in estimating dose-response functions. Biometrika, 87, 3, 706 - 710.번역본