1. Causal Inference - Connecting Different Worlds
1.1 Markovian Factorization
U 1 , . . . , U n ⊂ U U_1,...,U_n\subset U U 1 , . . . , U n ⊂ U are jointly independent ≡ \equiv ≡ No bidirected Edge in the G \mathcal{G} G
이러한 형태가 된다면 앞서 다룬 것보다 더 쉽게 다음과 같이 P(v) 를 나타낼 수 있다.
P ( v ) = ∏ V i ∈ V P ( v i ∣ p a i ) P(v)=\underset{V_i \in\bold{V}}{\prod}P(v_i|\bold{pa_i}) P ( v ) = V i ∈ V ∏ P ( v i ∣ p a i )
Unobserved Confounder 가 존재하게 된다면, 즉 Semi-Markovian 이라고 한다면?
그 경우엔 Markovian Factorization 성립하지 않음.
1.2 Causal Chains
Q : 주어진 Causal Graph G \mathcal{G} G 상의 두 변수 X와 Y는 독립인가?
A : No , 종속 관계이다
직관적으로 이해해보자.
Z (수능점수) 를 모를 때, 당연히 좋은 공부 습관 을 가진 사람이 원하는 대학교에 입학할 확률 이 높다 고 생각해볼 수 있다.
하지만 만약 Z 를 알고 있다면? 그때에도 X와 Y는 종속 관계인가?
이에 대한 대답도 No 이다. Z 가 주어졌을 때의 X와 Y는 서로 독립으로, 아래와 같이 증명된다.
X ⊥ Y ∣ Z X\perp Y | Z\\ X ⊥ Y ∣ Z
( Proof )
P ( X , Y ∣ Z ) = P ( Y ∣ Z , X ) P ( X ∣ Z ) = P ( Y ∣ Z ) P ( X ∣ Z ) P(X,Y|Z)=P(Y|Z,X)P(X|Z)=P(Y|Z)P(X|Z)\, P ( X , Y ∣ Z ) = P ( Y ∣ Z , X ) P ( X ∣ Z ) = P ( Y ∣ Z ) P ( X ∣ Z )
1.3 Common Cause (Fork)
마찬가지로 Z 가 주어지지 않았을 때는 X와 Y가 common cause 에 의해 상관 관계 를 가지게 된다.
이에 따라, X와 Y 중 하나를 알게 되면 다른 하나에 대한 정보도 알게 되므로 둘은 종속 관계 라고 볼 수 있다.
그렇다면 여기서도 Z 가 주어지면 (given) 이면 어떻게 될까? 두 변수는 종속부 독립 이 된다.
X ⊥ Y ∣ Z X\perp Y|Z\\ X ⊥ Y ∣ Z
( Proof )
P ( X , Y ∣ Z ) = P ( X , Y , Z ) P ( Z ) = P ( Y ∣ Z , X ) P ( X ∣ Z ) P ( Z ) P ( Z ) = P ( Y ∣ Z , X ) P ( X ∣ Z ) = P ( Y ∣ Z ) P ( X ∣ Z ) ( ∵ L o c a l M a r k o v i a n ) P(X,Y|Z)={P(X,Y,Z)\over P(Z)}={P(Y|Z,X)P(X|Z)P(Z)\over P(Z)}=P(Y|Z,X)P(X|Z)=P(Y|Z)P(X|Z)(\because Local\,Markovian) P ( X , Y ∣ Z ) = P ( Z ) P ( X , Y , Z ) = P ( Z ) P ( Y ∣ Z , X ) P ( X ∣ Z ) P ( Z ) = P ( Y ∣ Z , X ) P ( X ∣ Z ) = P ( Y ∣ Z ) P ( X ∣ Z ) ( ∵ L o c a l M a r k o v i a n )
1.4 Common Effect (Collider)
Collider 구조는 앞서 다룬 모델들과 달리, Z 가 주어졌을 때 X와 Y 두 변수가 종속 관계이고, Z 가 주어지지 않아야 독립 관계이다.
(이에 따라 나중에 배울 Adjustment Criterion 만족하는 변수를 사람이 직접 찾기는 힘들 수 있다.)
X ⊥ Y X\perp Y\\ X ⊥ Y
( Proof )
P ( X , Y ) = ∑ z P ( X , Y , z ) = ∑ z P ( z ∣ X , Y ) P ( X ) P ( Y ) = P ( X ) P ( Y ) ∑ z P ( z ∣ X , Y ) = P ( X ) P ( Y ) P(X,Y)=\underset{z}{\sum}P(X,Y,z)=\underset{z}{\sum}P(z|X,Y)P(X)P(Y)=P(X)P(Y)\underset{z}{\sum}P(z|X,Y)= P(X)P(Y) P ( X , Y ) = z ∑ P ( X , Y , z ) = z ∑ P ( z ∣ X , Y ) P ( X ) P ( Y ) = P ( X ) P ( Y ) z ∑ P ( z ∣ X , Y ) = P ( X ) P ( Y )
X ⊥ Y ∣ Z X\cancel{\perp} Y|Z\\ X ⊥ Y ∣ Z
( Proof )
P ( X , Y ∣ Z ) = P ( X , Y , Z ) P ( Z ) = P ( Z ∣ X , Y ) P ( X ) P ( Y ) P ( Z ) P(X,Y|Z)={P(X,Y,Z)\over P(Z)}={P(Z|X,Y)P(X)P(Y)\over P(Z)} P ( X , Y ∣ Z ) = P ( Z ) P ( X , Y , Z ) = P ( Z ) P ( Z ∣ X , Y ) P ( X ) P ( Y )
Collider 구조만의 독특한 특성이라면, Z 변수의 자손 중 하나라도 주어져 있다면 X , Y 는 종속 변수가 된다.
이를 기준으로 우리는 다음과 같이 Active , in-active 로 나눌 수 있다.
(Collider 구조에서 자손 노드가 있는 경우도 Triplet 으로 취급하는데, 이는 사실상 후손 이 주어지면 조상 노드에 대한 정보를 간접적으로 알 수 있어서 그런 듯 하다.)
실제 Causal Graph G \mathcal{G} G 는 3개 이상으로 이루어진 굉장히 복잡한 형태일 수 있는데, 위의 Triplet 을 활용하여 Graph 상의 두 변수가 현재 주어진 조건 하에 종속인지 아닌지 알 수 있다.
주어진 두 변수가 조건부 종속 이기 위해선, 인과 경로가 아닌 경로 가 적어도 하나 존재해야 하며, 이러한 경로 상의 모든 triplet은 active triplet 이어야 한다.
이러한 그래프 구조만으로 독립-종속 관계를 파악하는 규칙을 d-seperation 이라고 하며, 만약 두 변수가 어떠한 변수가 주어졌을 때 독립이 된다면 이를 d-separated 라 말한다.
[ Examples ]
1 : C a u s a l R e l a t i o n → 1:\,Causal\,Relation\rightarrow 1 : C a u s a l R e l a t i o n → Dependent
2 : S e a s o n → R a i n → W e t 2:\,Season\rightarrow Rain\rightarrow Wet 2 : S e a s o n → R a i n → W e t (Active Path)
3 : W e t 3:\,Wet 3 : W e t 이 주어져 있으므로, R a i n → W e t → S l i p p e r y Rain\rightarrow Wet\rightarrow Slippery R a i n → W e t → S l i p p e r y 는 in-active
4 : S e a s o n → S p r i n k l e r → W e t , S e a s o n → R a i n → W e t 4:\,Season\rightarrow Sprinkler\rightarrow Wet,\,Season\rightarrow Rain\rightarrow Wet 4 : S e a s o n → S p r i n k l e r → W e t , S e a s o n → R a i n → W e t
두 경로 모두 Sprinkler와 Rain이 주어져 있으므로 in-active, 고로 d-separated
5 : S p r i n k l e r → W e t ← R a i n 5:\,Sprinkler\rightarrow Wet\leftarrow Rain 5 : S p r i n k l e r → W e t ← R a i n 에서 Wet이 주어져 있으므로 active