SNU Causal Inference : Connecting Unobserved and Observed Worlds

김대원·2026년 1월 8일

SNU : Causal Inference

목록 보기
3/8

1. Causal Inference - Connecting Different Worlds

1.1 Markovian Factorization

U1,...,UnUU_1,...,U_n\subset U are jointly independent \equiv No bidirected Edge in the G\mathcal{G}

이러한 형태가 된다면 앞서 다룬 것보다 더 쉽게 다음과 같이 P(v)를 나타낼 수 있다.

P(v)=ViVP(vipai)P(v)=\underset{V_i \in\bold{V}}{\prod}P(v_i|\bold{pa_i})

Unobserved Confounder 가 존재하게 된다면, 즉 Semi-Markovian 이라고 한다면?
그 경우엔 Markovian Factorization 성립하지 않음.

1.2 Causal Chains


Q : 주어진 Causal Graph G\mathcal{G} 상의 두 변수 X와 Y는 독립인가?
A : No, 종속 관계이다

직관적으로 이해해보자.
Z (수능점수) 를 모를 때, 당연히 좋은 공부 습관을 가진 사람이 원하는 대학교에 입학할 확률높다고 생각해볼 수 있다.

하지만 만약 Z를 알고 있다면? 그때에도 X와 Y는 종속 관계인가?
이에 대한 대답도 No이다. Z가 주어졌을 때의 X와 Y는 서로 독립으로, 아래와 같이 증명된다.

XYZX\perp Y | Z\\
( Proof )
P(X,YZ)=P(YZ,X)P(XZ)=P(YZ)P(XZ)P(X,Y|Z)=P(Y|Z,X)P(X|Z)=P(Y|Z)P(X|Z)\,

1.3 Common Cause (Fork)

마찬가지로 Z가 주어지지 않았을 때는 X와 Y가 common cause에 의해 상관 관계를 가지게 된다.

이에 따라, X와 Y 중 하나를 알게 되면 다른 하나에 대한 정보도 알게 되므로 둘은 종속 관계라고 볼 수 있다.

그렇다면 여기서도 Z가 주어지면 (given) 이면 어떻게 될까? 두 변수는 종속부 독립이 된다.

XYZX\perp Y|Z\\
( Proof )
P(X,YZ)=P(X,Y,Z)P(Z)=P(YZ,X)P(XZ)P(Z)P(Z)=P(YZ,X)P(XZ)=P(YZ)P(XZ)(LocalMarkovian)P(X,Y|Z)={P(X,Y,Z)\over P(Z)}={P(Y|Z,X)P(X|Z)P(Z)\over P(Z)}=P(Y|Z,X)P(X|Z)=P(Y|Z)P(X|Z)(\because Local\,Markovian)

1.4 Common Effect (Collider)


Collider 구조는 앞서 다룬 모델들과 달리, Z가 주어졌을 때 X와 Y 두 변수가 종속 관계이고, Z가 주어지지 않아야 독립 관계이다.
(이에 따라 나중에 배울 Adjustment Criterion 만족하는 변수를 사람이 직접 찾기는 힘들 수 있다.)

XYX\perp Y\\
( Proof )
P(X,Y)=zP(X,Y,z)=zP(zX,Y)P(X)P(Y)=P(X)P(Y)zP(zX,Y)=P(X)P(Y)P(X,Y)=\underset{z}{\sum}P(X,Y,z)=\underset{z}{\sum}P(z|X,Y)P(X)P(Y)=P(X)P(Y)\underset{z}{\sum}P(z|X,Y)= P(X)P(Y)

XYZX\cancel{\perp} Y|Z\\
( Proof )
P(X,YZ)=P(X,Y,Z)P(Z)=P(ZX,Y)P(X)P(Y)P(Z)P(X,Y|Z)={P(X,Y,Z)\over P(Z)}={P(Z|X,Y)P(X)P(Y)\over P(Z)}

Collider 구조만의 독특한 특성이라면, Z 변수의 자손 중 하나라도 주어져 있다면 X, Y는 종속 변수가 된다.

이를 기준으로 우리는 다음과 같이 Active, in-active 로 나눌 수 있다.
(Collider 구조에서 자손 노드가 있는 경우도 Triplet 으로 취급하는데, 이는 사실상 후손이 주어지면 조상 노드에 대한 정보를 간접적으로 알 수 있어서 그런 듯 하다.)

실제 Causal Graph G\mathcal{G}는 3개 이상으로 이루어진 굉장히 복잡한 형태일 수 있는데, 위의 Triplet을 활용하여 Graph 상의 두 변수가 현재 주어진 조건 하에 종속인지 아닌지 알 수 있다.

주어진 두 변수가 조건부 종속이기 위해선, 인과 경로가 아닌 경로가 적어도 하나 존재해야 하며, 이러한 경로 상의 모든 triplet은 active triplet이어야 한다.

이러한 그래프 구조만으로 독립-종속 관계를 파악하는 규칙을 d-seperation 이라고 하며, 만약 두 변수가 어떠한 변수가 주어졌을 때 독립이 된다면 이를 d-separated 라 말한다.

[ Examples ]

1:CausalRelation1:\,Causal\,Relation\rightarrowDependent
2:SeasonRainWet2:\,Season\rightarrow Rain\rightarrow Wet (Active Path)
3:Wet3:\,Wet 이 주어져 있으므로, RainWetSlipperyRain\rightarrow Wet\rightarrow Slippery 는 in-active
4:SeasonSprinklerWet,SeasonRainWet4:\,Season\rightarrow Sprinkler\rightarrow Wet,\,Season\rightarrow Rain\rightarrow Wet
두 경로 모두 Sprinkler와 Rain이 주어져 있으므로 in-active, 고로 d-separated
5:SprinklerWetRain5:\,Sprinkler\rightarrow Wet\leftarrow Rain 에서 Wet이 주어져 있으므로 active

profile
Tech Bunny

0개의 댓글