인과추론에서 exchangeability (교환가능성)
Settings
- treatment A와 outcome Y 사이의 관계에 관심이 있는 경우
- A와 Y는 모두 binary라고 가정
- A=0이면 treatment를 받지 않은 경우(unexposed), A=1이면 treatment를 받은 경우(exposed)
- Y=0이면 no disease, Y=1이면 disease
Preliminaries
- Ya: (potential outcome) A=a라는 treatemnt를 받은 subject의 outcome
- 일반적으로 하나의 subject에 대해 Y1과 Y0값 중 하나의 값만을 얻을 수 있음. (아래 표 참고 - consistent assumption)
ID | A | Y1 | Y0 |
---|
1 | 1 | 1 | ? |
2 | 0 | ? | 0 |
- 여기서 Y=0∣A=1과 Y=1∣A=0는 실제로는 관찰할 수 없는 결과로 counterfactual이라고 함
- outcome Y=Y11(A=1)+Y01(A=0)로 나타낼 수 있음
Exchangeability
- A가 randomization된 경우 (e.g. 동전을 던져 treatment의 할당 여부를 결정) association이 causation이 될 수 있음
- 아래는 이어지는 내용은 모두 A가 randomized trail인 경우를 가정
- exposed(A=1) and unexposed(A=0) are guaranteed to be exchangeable:
(Y0,Y1)⊥A
treatment를 받은 경우와 받지 않은 경우 모두 상태는 이미 정해져 있다고 생각하면 potential outcome과 treatment는 independent함.
treatment여부에 따라 관찰할 수 있는 데이터가 있을 것이고 A=0일 때 관측한 값이 Y0과 같을 것이라는 가정이 consistent assumption임.
- exposed and unexposed are exchangable if Y1 and Y0 are (jointly) independent of A implying that
P(Y=1∣A=1)=P(Y1=1∣A=1)⋯by Y=Y11(A=1)+Y01(A=0)=P(Y1=1) ⋯by randomized=P(Y1=1∣A=0)⋯by A⊥Y1⇒P(Y1=1∣A=1)=P(Y1=1∣A=0)=P(Y1=1) andP(Y0=1∣A=1)=P(Y0=1∣A=0)=P(Y0=1).
- 하지만 비용 및 윤리적 등 여러 이유때문에 랜덤화 실험을 통한 관찰 데이터를 얻을 수 없으며, 관찰데이터만으로는 exposed와 unexposed가 exchangeable한지 여부를 판단할 수 없음
- 때문에 conditional randomization, adjustments 등의 방법을 이용할 수 있음