Confounding and noncollapsibility

choyunjeong·2025년 1월 26일

1. CONFOUNDING AND NONCOLLAPSIBILITY

1) The Divergence

"효과 추정에서 편향의 의미인 confounding\text{confounding} 개념"과 "non-collapsibility\text{non-collapsibility} 개념"을 많은 통계학 문헌에서 구분하고 있지 않습니다. 예를 들어, YY에 대해 세 가지 회귀 벡터 WW, XX, ZZ를 포함한 일반화 선형 모형을 고려해 봅시다:

g[E(YW=w,X=x,Z=z)]=α+wβ+Xγ+zδ(13)g\left[E(Y | W = w, X = x, Z = z)\right] = \alpha + w\beta + X\gamma + z\delta \tag{13}

회귀 분석에서 β\betaZZ에 대해 collapsible\text{collapsible}하다는 것은 ZZ를 생략하더라고 β=β\beta = \beta^*가 성립하는 경우를 의미합니다.

g[E(YW=w,X=x)]=α+wβ+Xγ(14)g\left[E(Y | W = w, X = x)\right] = \alpha^* + w\beta^* + X\gamma^* \tag{14}

(13)(13)(14)(14)에서 ββ\beta \neq \beta^*일 때 ZZ의 요소를 confounders\text{confounders}로 정의합니다. 그러므로, β=β\beta = \beta^*인 경우에는 ZZnon-confounders\text{non-confounders}입니다.

그럼에도 불구하고, confounding\text{confounding} 개념"과 "non-collapsibility\text{non-collapsibility}개념"은 동일하지 않습니다: confounding\text{confounding}non-collapsibility\text{non-collapsibility} 여부와 상관없이 발생할 수 있으며, non-collapsibility\text{non-collapsibility} 역시 confounding\text{confounding} 여부와 상관없이 발생할 수 있습니다. 수학적으로 동일한 결론에 다른 용어를 사용한 저자들은 non-collapsibility\text{non-collapsibility}bias\text{bias}라 부르고, confounding\text{confounding}covariate imbalance\text{covariate imbalance}라고 불렀습니다.

(A) non-collapsibility without confounding\text{non-collapsibility without confounding}

Table 2\text{Table 2}는 "가상의 목표 모집단 AA에서 x1x_1 이거나 x0x_0 처치 하의 반응변수 분포"와 "가상의 참조 모집단 BB에서 x0x_0 처치 하의 반응변수 분포"를 보여준다. AAx1x_1 처치를, BBx0x_0 처치를 받았다고 가정하고, "x0x_0 대신 x1x_1을 받았을 때 AA에 미친 효과를 추정"하고자 한다. 만약 반응변수의 오즈를 결과 모수 μ\mu로 사용하면,

μA1=0.6(10.6)=1.50,μA0=μB0=0.4(10.4)=0.67\mu_{A1} = \dfrac{0.6}{(1 − 0.6)} = 1.50,\quad \mu_{A0} = \mu_{B0} = \dfrac{0.4}{(1 − 0.4)} = 0.67

이 된다. 따라서 오즈비에 대한 confounding\text{confounding}은 존재하지 않는다.

μA1μA0=μA1μB0=1.500.67=2.25\dfrac{\mu_{A1}}{\mu_{A0}} = \dfrac{\mu_{A1}}{\mu_{B0}} = \dfrac{1.50}{0.67} = 2.25

이다. 그럼에도 불구하고, 공변량 ZZAABB에서 반응변수와 association\text{association} 되어 있습니다. 게다가, 오즈비는 collapsible\text{collapsible}하지 않습니다: ZZ의 수준별로 보면, x1x_1 처치 하의 모집단 AAx0x_0 처치 하의 모집단 AA 또는 BB와 비교한 오즈비는

(0.8/0.2)(0.6/0.4)=(0.4/0.6)(0.2/0.8)=2.67\dfrac{(0.8/0.2)}{(0.6/0.4)} = \dfrac{(0.4/0.6)}{(0.2/0.8)} = 2.67

unconditional (crude)\text{unconditional (crude)} 오즈비 2.25보다 높습니다.

이 결과는 효과 척도로서 오즈비의 독특한 성질을 보여줍니다. 처치 x1x_1 (참조 처치 x0x_0 대비)은 모집단 AA에서 반응변수의 오즈를 125% 증가시키지만, ZZ의 각 계층 내에서는 반응변수의 오즈를 167% 증가시킵니다. 만약 ZZ가 처치와 conditional\text{conditional}로 반응변수와 association\text{association}되어 있지만, unconditional\text{unconditional}으로 반응변수와 association\text{association}되지 않는 경우, 계층별 오즈비는 unconditional\text{unconditional} 오즈비가 1이 아닌 경우 더 1에서 멀어지게 됩니다. 이러한 현상은 종종 unconditional\text{unconditional} 오즈비의 bias\text{bias}로 해석되지만, 사실 unconditional\text{unconditional} 효과를 계층별 또는 개별 효과의 추정치로 잘못 해석하지 않는다면 bias\text{bias}는 존재하지 않습니다.

(B) confounding without non-collapsibility\text{confounding without non-collapsibility}

전체 효과에 대한 오즈비가 collapsible\text{collapsible}하면서도 confounded\text{confounded}한 수치적 예를 생성하려면, Table 2\text{Table 2}를 약간만 수정하면 된다. 즉, 모집단 BB에서 Z=0Z = 0인 층의 크기를 1,5001,500으로 변경한다. 이 변경으로 인해 모집단 BB에서 Z=1Z = 1의 비율이 0.5에서 0.4로 감소하며, 처치 x0x_0 하의 모집단 BB에서의 unconditional\text{unconditional} 반응변수의 확률은

0.4(0.6)+0.6(0.2)=0.360.4(0.6) + 0.6(0.2) = 0.36

이 되고, 처치 x0x_0 하의 모집단 BB에서의 unconditional\text{unconditional} 반응변수의 오즈 μB0\mu_{B0}

0.36/(10.36)=0.56250.36/(1 − 0.36) = 0.5625

가 된다. 따라서

μB0(=0.5625)<μA0(=0.67)\mu_{B0} (= 0.5625) < \mu_{A0} (= 0.67)

이며, 결과적으로 오즈비의 confounding\text{confounding}이 발생합니다. 모집단 AA에서 x1x_1이 오즈에 미친 참 효과 μA1/μA0\mu_{A1}/\mu_{A0}는 이전과 같이 2.25이지만, 이는 unconditional\text{unconditional} 오즈비 μA1/μB0=1.50/0.5625=2.67\mu_{A1}/\mu_{B0} = 1.50/0.5625 = 2.67보다 작습니다. 그럼에도 불구하고, 이 unconditional\text{unconditional} 오즈비는 계층별 오즈비와 동일하다.

\\[30pt]

2) Conditions for Equivalence

Table 2\text{Table 2}의 예시에서 μ\mu가 결과의 오즈를 나타낼 때, μA0=μB0\mu_{A0}=\mu_{B0}임을 보여줍니다 (no confounding)(\text{no confounding}). 심지어 오즈비가 confounders\text{confounders}에 대해 non-collapsibility\text{non-collapsibility}인 경우에도 해당됩니다. 반대로 수정된 예에서는, 오즈비가 collapsible\text{collapsible}한 경우에도 μA0μB0\mu_{A0} \neq \mu_{B0}가 될 수 있음을 보여줍니다.

non-confounding\text{non-confounding}collapsibility\text{collapsibility}사이의 차이에 대한 확률적 설명은 ZZ가 치료와 unconditional\text{unconditional}unassociated\text{unassociated}하고 충분히 제어되는 경우 μA0=μB0\mu_{A0} = \mu_{B0}가 된다는 것입니다 (Table 2\text{Table 2}). 반면, 수정된 예에서처럼 오즈비의 collapsibility\text{collapsibility}은 반응변수 YYconditional\text{conditional}ZZ가 치료와 unassociated\text{unassociated}일 때 발생합니다. 따라서 이 차이는 비조건부 연관성 (unconditional associations)(\text{unconditional associations})과 조건부 연관성(conditional associations)(\text{conditional associations})의 비동등성 (non-equivalence)\text{(non-equivalence)}에서 비롯된 결과일 뿐입니다.

효과 측도가 difference or ratio of response proportions\text{difference or ratio of response proportions} 로 정의될 경우, ZZAABB에서 동일한 분포를 가진다면 (즉, ZZ와 치료가 unconditionally unassociated\text{unconditionally unassociated}) 해당 측도가 ZZ에 대해 collapsibility\text{collapsibility}을 시사합니다. 그러나 non-collapsibility without confounding\text{non-collapsibility without confounding}confounding without non-collapsibility\text{confounding without non-collapsibility}ZZ가 충분히 통제된 경우에는 발생하지 않습니다. 더 일반적으로, 효과 측도가 모집단 구성원에 대한 평균 효과로 표현될 수 있는 경우 (예: linear causal model (4)\text{linear causal model (4)} 하에서), non-collapsibility\text{non-collapsibility}confounding\text{confounding}의 조건은 동일해질 수 있습니다. 이러한 경우, non-collapsibility\text{non-collapsibility}confounding\text{confounding}은 동일한 개념이 되며, 이는 두 개념이 종종 구분되지 않는 이유를 설명할 수 있습니다. 오즈비에서 두 개념이 동등하지 않는 이유는 처치가 오즈에 미치는 unconditionally\text{unconditionally} 효과가 모집단 구성원에 대한 평균 처치 효과와 동일하지 않기 때문입니다.

\\[30pt]

3) Regression Formulations

설명 변수들이 YY에 미치는 causal effects\text{causal effects}를 나타내기 위해 전체 회귀 모델 (13)(13)을 고려한다고 할 때 ZZ에 대한 non-collapsibility\text{non-collapsibility}gg가 항등 (identity)\text{(identity)}이거나 log-link\text{log-link}가 아니라면 confounding\text{confounding}와 동일한 개념이 아닙니다. 즉, β\betaβ\beta^*는 각각 XXZZ 수준 내에서 WW를 조작 (manipulate)\text{(manipulate)}한 효과를 편향 없이 (unbiased)\text{(unbiased)} 나타낼 수 있지만 ββ\beta^* \neq \beta일 수 있습니다. Table 2\text{Table 2}는 로지스틱 모델에서 이 점을 보여주며, 로지스틱 모델에서의 non-collapsibility\text{non-collapsibility}이 항상 편향을 나타내는 것은 아님을 보여준다. β\betaβ\beta^* 간의 차이는 cluster-specific\text{cluster-specific} 효과와 모집단 평균 효과 간의 구분에 해당 합니다.

  • cluster-specific\text{cluster-specific} 모델: ZZWWXX에 독립적이며 관찰되지 않은 단변량 cluster-specific\text{cluster-specific} 랜덤 변수로 고려하는 전체 모델. 예: (13)(13). 이 경우 ZZ는 평균이 00이고 분산이 11인 랜덤 변수이다. δ2\delta^2는 랜덤 효과(random effects) 분산들의 벡터에 해당한다.

0개의 댓글