
해당 게시글은 서울대학교 데이터 사이언스 대학원 이상학 교수님의 강의를 기반으로 작성되었습니다.
Explore CSR 워크샵을 통해 2달 간 서울대학교 인과 추론 연구실 인턴으로 활동하며 진행한 스터디의 일환으로 이 글을 작성하게 되었으며, 다시 한 번 좋은 기회를 주신 이상학 교수님과 서울대학교 데이터 사이언스 대학원에게 감사의 말씀 드립니다.
인과추론이란, 관찰된 데이터를 통해서 인과 효과를 추정하는 방법론으로, Judea Pearl 교수님을 필두로 하는 학파와, Potential Outcome 을 필두로 하는 두 학파가 존재한다.
(거시 경제학의 고전학파와 케인지언을 생각하면 이해하기 쉽다.)
기계학습의 본질적 목적은 지능형 시스템을 개발하는 것으로, 우리가 알아내기 어려운 패턴들을 스스로 데이터를 통해 학습 하는 알고리즘을 개발하는 것이라 말할 수 있다.
곧, 데이터를 통해 이면에 숨겨진 현실을 학습하는 것이라 말할 수 있다.
We learn to initate aspects of the underlying reality.
인과 추론이라 하는 것은 Reality를 조작했을 때 어떻게 변화하는지를 알고자 하는 것이란 점에서, 기존의 머신러닝과는 큰 차이가 발생한다.
초기 인공지능의 목적은 인식, 조작(action) 등을 수행하는 기계적 에이전트를 만드는 것을 목표로 했었기에, 강화학습은 인과추론과 연결된다.
Sensors (Layer 1) : Association
Agency (Layer 2) : Intervention
Retrospection (Layer 3) : Counterfactual
1) Association 은 쉽게 생각하자면, 우리가 기존에 학습했던 ML에 가깝다고 말할 수 있다. 결국 우리가 배우는 건 로, Supervised Learning 과 완벽하게 대응된다.
자연스러운 데이터 수집, 관찰로 이해할 수 있음
2) Intervention 은 실험과 대응되고, conditional intervention 으로 모델링 할 경우 우리가 흔히 아는 강화학습에 대응된다.
어떠한 변수를 강제하여 인과 효과를 실험적으로 얻음
3) Counterfactual 은 우리가 흔히들 매체에서 말하는 What if 세계관을 생각하면 이해하기가 쉬운데, 누구나 후회 되는 순간이 있다.
당신이 누군가와 사랑에 빠지고, 그 사람에 대한 마음이 너무 빨리 커지는 경우를 생각해보자. 그러나 지나치게 성급하게 다가가서 관계를 망칠 수도 있을 것이다. 그 경우, "만약 내가 조급하게 다가가지 않았더라면 어땠을까?" 하는 상상을 해볼 수 있을 것이다.
이를 우린 Counterfactual(반사실) 이라 말한다.
관찰 데이터에 존재하지 않는, 우리가 알고 싶은 인과 효과를 추정하는 것, 그것이 Counterfactual 이다.
Judea Pearl 교수님의 PCH에 따라, 우린 인과추론을 cross-layer inferences 라 말할 수 있다.
e.g) Observational Study (Layer 1) 으로부터 Layer 2 의 효과를 추정
Adjustment Formula
인과성을 활용하여 왜 이렇게 되는가 라는 질문에 답하는 학문이며, 정책적인 효과를 측정하는 하나의 수단으로서 활용되는 학문이라 말할 수 있다.
우리는 종종 인과관계와 상관관계를 헷갈려 하기에, 이를 타개하고자 발생한 학문이라고도 볼 수 있다.

[ Figure 1. Spurious Regression : Diverce - Margarine ]
계량 경제학에서의 Spurious Regression 의 대표적 사례라 말할 수 있다. 고로, 기존 머신러닝에서의 분석만으로는 알 수 없는 것들을 분석하는 것이 인과추론이라 할 수 있다.