SNU Causal Inference : Introduction

김대원·2026년 1월 6일

SNU : Causal Inference

목록 보기

1/8

0. 시작하기에 앞서

해당 게시글은 서울대학교 데이터 사이언스 대학원 이상학 교수님의 강의를 기반으로 작성되었습니다.

Explore CSR 워크샵을 통해 2달 간 서울대학교 인과 추론 연구실 인턴으로 활동하며 진행한 스터디의 일환으로 이 글을 작성하게 되었으며, 다시 한 번 좋은 기회를 주신 이상학 교수님과 서울대학교 데이터 사이언스 대학원에게 감사의 말씀 드립니다.

1. 인과추론이란 무엇인가?

인과추론이란, 관찰된 데이터를 통해서 인과 효과를 추정하는 방법론으로, Judea Pearl 교수님을 필두로 하는 학파와, Potential Outcome 을 필두로 하는 두 학파가 존재한다.
(거시 경제학의 고전학파와 케인지언을 생각하면 이해하기 쉽다.)

1.1 기계학습과는 어떻게 다른가?

기계학습의 본질적 목적은 지능형 시스템을 개발하는 것으로, 우리가 알아내기 어려운 패턴들을 스스로 데이터를 통해 학습 하는 알고리즘을 개발하는 것이라 말할 수 있다.

곧, 데이터를 통해 이면에 숨겨진 현실을 학습하는 것이라 말할 수 있다.

We learn to initate aspects of the underlying reality.

인과 추론이라 하는 것은 Reality를 조작했을 때 어떻게 변화하는지를 알고자 하는 것이란 점에서, 기존의 머신러닝과는 큰 차이가 발생한다.

초기 인공지능의 목적은 인식, 조작(action) 등을 수행하는 기계적 에이전트를 만드는 것을 목표로 했었기에, 강화학습은 인과추론과 연결된다.

1.2 Pearl's Causal Hierarchy

Sensors (Layer 1) : Association
Agency (Layer 2) : Intervention
Retrospection (Layer 3) : Counterfactual

1) Association 은 쉽게 생각하자면, 우리가 기존에 학습했던 ML에 가깝다고 말할 수 있다. 결국 우리가 배우는 건 $P(y|x)$ 로, Supervised Learning 과 완벽하게 대응된다.
$\rightarrow$ 자연스러운 데이터 수집, 관찰로 이해할 수 있음

2) Intervention 은 실험과 대응되고, conditional intervention 으로 모델링 할 경우 우리가 흔히 아는 강화학습에 대응된다.
$\rightarrow$ 어떠한 변수를 강제하여 인과 효과를 실험적으로 얻음

3) Counterfactual 은 우리가 흔히들 매체에서 말하는 What if 세계관을 생각하면 이해하기가 쉬운데, 누구나 후회 되는 순간이 있다.

당신이 누군가와 사랑에 빠지고, 그 사람에 대한 마음이 너무 빨리 커지는 경우를 생각해보자. 그러나 지나치게 성급하게 다가가서 관계를 망칠 수도 있을 것이다. 그 경우, "만약 내가 조급하게 다가가지 않았더라면 어땠을까?" 하는 상상을 해볼 수 있을 것이다.

이를 우린 Counterfactual(반사실) 이라 말한다.
관찰 데이터에 존재하지 않는, 우리가 알고 싶은 인과 효과를 추정하는 것, 그것이 Counterfactual 이다.

Judea Pearl 교수님의 PCH에 따라, 우린 인과추론을 cross-layer inferences 라 말할 수 있다.

e.g) Observational Study (Layer 1) 으로부터 Layer 2 의 효과를 추정
$\rightarrow$ Adjustment Formula

1.3 왜 인과추론을 연구하는가?

인과성을 활용하여 왜 이렇게 되는가 라는 질문에 답하는 학문이며, 정책적인 효과를 측정하는 하나의 수단으로서 활용되는 학문이라 말할 수 있다.

우리는 종종 인과관계와 상관관계를 헷갈려 하기에, 이를 타개하고자 발생한 학문이라고도 볼 수 있다.

[ Figure 1. Spurious Regression : Diverce - Margarine ]

계량 경제학에서의 Spurious Regression 의 대표적 사례라 말할 수 있다. 고로, 기존 머신러닝에서의 분석만으로는 알 수 없는 것들을 분석하는 것이 인과추론이라 할 수 있다.

김대원

Tech Bunny

다음 포스트

SNU Causal Inference : Introduction