Confounding

choyunjeong·2025년 1월 29일

석사학위논문 이론내용

목록 보기

2/7

2. Confounding in observational study

비무작위 연구는 무작위 연구와 달리 인과효과를 추정할 때 $\text{confounding}$ 문제가 발생할 가능성이 많습니다. $A$ 모집단의 평균 인과효과 추정을 위해 구성한 참조 모집단 $B$ 가 $\mu_A\neq \mu_B$ 인 경우 $\text{confounding}$ 이 존재한다고 말하는데 이는 치료군 간 공변량이 체계적 (치료 외의 다른 요인)으로 다르기 때문에 발생합니다. (엄밀히 말하면 두 군간 공변량이 달라도 $\text{confounding}$ 이 발생하지 않을 수도 있습니다.) 이 때 $\text{confounding}$ 을 일으키는 변수를 $\text{confounder}$ 로 간주 합니다. 즉, $\text{confounder}$ 는 비교 집단 간 공변량의 분포가 달라 모수 $\mu$ 에 인과적으로 영향을 미칠 수 있어야 합니다.

관찰연구(비무작위 연구)에서 $\text{confounding}$ 의 정도는 "단순 연관 측도 추정값 $\phi \text{ (simple associational measure)}$ "와 "적절한 조정 (예: 표준화 또는 $\text{IPTW}$ )을 통해 얻어진 인과적 주변부 효과 추정값 $\mu \text{ (causal marginal effect)}$ "를 비교하여 측정됩니다[1]. 확률로 표현한다면 다음과 같습니다. (이 과정에서 다른 구조적 편향의 원인은 배제해야 합니다.)

P(Y = y | T = t) \text{ vs } P(Y(t) = y)

즉, 양변이 동일한 값을 가져야 $\text{confounding}$ 이 없는 인과효과를 추론할 수 있습니다. 앞 장에서 관찰연구에서 치료할당이 강한 무시가능성 $\text{(strongly ignorable)}$ 을 가질 때 모집단간 교환가능하다고 배웠습니다. 이 장에서는 실제 검증 불가능한 가정 두개를 추가로 설명하고 관측된 데이터가 세가지 가정을 만족한다면 $\text{confounding}$ 이 없는 인과 효과 추론이 가능한 이유를 설명합니다[2]. 이러한 가정은 잠재결과와 관측 가능한 변수 간의 관계를 의미합니다. 여러 논문에서 다양한 용어로 불리는데 우리는 $\text{Rubin}$ 의 잠재결과 프레임워크를 참고하였습니다[3].

2. Rubin의 잠재결과 프레임워크

- $\text{stable unit treatment value assumption (SUTVA)}$ 가정

: 잠재 결과를 $Y_i(Z)$ 라고 할 때 모든 피험자는 두개의 잠재 결과 $Y_i(1),\ Y_i(0)$ 를 가진다고 할 때 각 피험자의 잠재결과는 다른 피험자의 처치 배정에 영향을 받지 않아야 하며 하나의 값만 관측되어야 합니다. 이때 관측되지 않은 결과를 $\text{counterfactual}$ 결과라고 합니다.

Y_i=Z_iY_i(1)-(1-Z_i)Y_i(0)

- $\text{conditional exchangeability}$
: 공변량 $X$ 가 주어졌을 때 처치와 잠재결과 집합이 조건부 독립을 만족한다 즉, $Z$ 가 $Y$ 에 미치는 효과에서 $X$ 외에는 $\text{confounding}$ 이 없음을 의미합니다[2].

Y(t)\perp Z|X

- $\text{positivity}$ 가정

교란변수가 주어졌을 때 처치를 배정받을 확률이 $0$ 과 $1$ 사이라는 것이다.

0<e(x)<1

가정 $2,3$ 을 만족한다면 치료할당이 강한 무시가능성을 따른다고 합니다. 교란변수가 주어졌을 때 치료할당이 강한 무시가능성을 만족한다면, 성향점수를 사용하여도 강한 무시가능성을 만족하여 편향 없는 인과 효과 추정이 가능합니다. (무작위 연구는 대부분 위 가정을 만족)

증명 치료할당이 강한 무시가능성을 만족하면 편향없는 인과 효과 추정이 가능한 이유[3].

$\text{Rubin}$ 은 인과효과를 다음과 같이 정의하였습니다.

\text{ATE}=E(r_1) - E(r_0)

치료 $z=1$ 에 무작위 선택된 개인과 치료 $z=0$ 에 무작위 선택된 개인을 비교할 때, 반응 변수의 기댓값 차이는 다음과 같습니다.

E(r_1|z=1)-E(r_0|z=0)

이는 일반적으로 인과효과 $E(r_1)-E(r_0)$ 와 같지 않은데, 이는 전체 모집단 $r_t$ 의 주변 분포가 아니라 $z=t$ 인 경우의 조건부 분포에서 나왔기 때문입니다.

- $X$ 가 주어졌을 때

치료군과 대조군의 모든 개체들을 포함한 전체 모집단에서 공변량 벡터 $x$ 의 특정 값이 무작위 추출된 후, 치료군과 대조군 각각에서 해당 공변량 벡터 값을 가진 개체가 발견된다고 가정합니다. 이 두 단계 샘플링 과정에서 반응변수의 기댓값 차이는 다음과 같습니다.

E_x\left\{E(r_1|x,z=1)-E(r_0|x',z=0)\right\}

여기서 $E_x$ 는 전체 모집단에서 $x$ 분포에 관한 기대값을 의미합니다. 만약 치료 할당이 강하게 무시 가능하다면, 즉

(r_1, r_0)\perp z|x,\quad 0< \Pr(z=1|x)<1

이라면

E_x\left\{E(r_1|x,z=1)-E(r_0|x',z=0)\right\} = E_x\left\{E(r_1|x)-E(r_0|x)\right\}=E(r_1)-E(r_0)

$\\[25pt]$

- $e(x)$ 가 주어졌을 때

치료군과 대조군의 모든 개체들을 포함한 전체 모집단에서 성향 점수 $e(x)$ 의 특정 값이 무작위 추출된 후, 치료군과 대조군 각각에서 해당 $e(x)$ 값을 가진 개체가 발견된다고 가정합니다. 단, 이들 개체들은 $x$ 의 값이 다를 수 있습니다. 강하게 무시 가능한 치료 할당이 주어진다면,

E\left\{r_1|e(x),z=1\right\}-E\left\{r_0|e(x),z=0\right\}=E\left\{r_1|e(x)\right\}-E\left\{r_0|e(x)\right\}

에서

\begin{aligned} E_{e(x)}[E\left\{r_1|e(x),z=1\right\}-E\left\{r_0|e(x),z=0\right\}] &=E_{e(x)}[E\left\{r_1|e(x)\right\}-E\left\{r_0|e(x)\right\}] \\[10pt] &=E(r_1-r_0) \end{aligned}

이 증명에서 중요한 과정은

E(r_t|x,z=1) = E(r_t|x,z=0) = E(r_t|x)

인데 $\text{strongly ignorable}$ 중 $\text{conditional exchangeability}$ 가정을 만족하기 때문에 양 변이 성립한다.

Y(t)\perp Z|X

- $\text{conditional exchangeability}$ 또는 $\text{randomization}$ 하에서 다음이 성립합니다[2].

\Pr(Y(z)=y|X=x) = \Pr(Y=y|Z=z, X=x)

이는 $\text{RCT}$ 로부터 $z = 1, 0$ 일 때, $P(Y(z) = y | X = x)$ 는 데이터로 계산 가능한 $P(Y = y | Z = z, X = x)$ 로 추정 가능하기 때문입니다. 따라서 치료할당이 강하게 무시 가능하다면 서로 다른 치료를 받더라도 서로의 대조군으로 적용 가능하다고 해석할 수 있습니다[3].

3. Imbens의 일반화성향점수

$\text{Rubin}$ 의 성향점수방법은 치료가 이항처치일 경우에만 성립한다는 한계점이 존재합니다. 이를 해결하기 위해 $\text{Imbens}$ 는 일반화 성향점수를 제안하였습니다. 주요 포인트는 $\text{Rubin}$ 의 방법처럼 인과 비교가 유효한 하위 집단으로 인구를 나누는 것

E(r_1-r_0|e(x))

대신 다음과 같이 평균 잠재 결과를 추정할 수 있는 하위집단으로 나누는 것 으로 충분합니다.

E(r_{(t)}|e(x))

우선 치료를 받았는지 여부를 나타내는 지표를 정의합니다.

D_i(t) = \begin{cases} 1 \quad \text{ if }\ T_i=t \\[10pt] 0 \quad \text{ otherwise} \end{cases}

$\text{Imbens}$ 는 $X$ 를 조정하여 $Y(t)$ 의 기댓값을 추정하는데 $\text{Rubin}$ 의 조건부 교환가능성 가정의 강력한 가정이 필요하지 않다는 점을 강조합니다.

D(t)\perp Y(t) | X

이를 $\text{weak unconfoundedness}$ 라고 가정합니다. 즉, 각각의 치료와 잠재 결과와의 쌍별 독립성만을 필요로 합니다.

E(Y(t)|X)=E(Y(t)|D(t)=1,X)=E(Y|D(t)=1,X)=E(Y|T=t,X)

그 후 이중기댓값 공식을 사용하여 조건부 평균을 평균하여 주변부 평균값을 추정합니다.

E(Y(t))=E[E(Y(t)|X)]

$X$ 가 $\text{weak unconfoundedness}$ 가정을 만족한다면 $\text{imbens}$ 의 일반화 성향점수도 $\text{weak unconfoundedness}$ 가정을 만족합니다.

D(t)\perp Y(t) |r(t,X)

이항 치료일 때 성향점수는 설명변수가 주어졌을 때 치료를 받을 조건부 확률로 정의했으며, 로지스틱 모형으로 대부분 추정합니다.

e(x)=\Pr(Z=1|X)

일반화 성향점수도 기존 성향점수 정의를 다항 치료로 확장합니다.

r(t,x)=\Pr(Z=z|X=x)=E\{D(t)|X=x\}

일반화 성향점수 방법은 다음과 같다.

$r(t,x)$ 를 추정합니다. 보통 다항 로지스틱 모형을 사용합니다.
조건부 기댓값
$\beta(t,r) = E\{Y|T=t,r(t,X)=r\}$
치료 수준 $t$ 에서의 평균 반응을 구하기 위해 설명 변수의 분포를 평균화한다.
$E\{\beta(t,r)\} = E[E\{Y|T=t,r(t,X)=r\}] = E\{Y(t)\}$

References

choyunjeong

이전 포스트

Causal inference

다음 포스트