인과추론 - Causality

문영제·2022년 7월 18일
0

LG AImers

목록 보기
19/24
post-thumbnail

담당연구원: 서울대학교 데이터사이언스학과 졸업자 이상학 씨

Definition of Causality

Casuality: 인과성, 인과율

  • 하나의 어떤 무엇인가가 다른 무엇을 생성함에 있어 영향을 미치는 것
  • 예시로 '버스를 놓쳐서 지각을 했다'는 인과적 관계임

Q. 그렇다면 인과 추론이 왜 필요할까?
A. 과학이란 일반적 사실이나 법칙을 포함하는 지식 체계인데 여기서 법칙은 현상의 본질적인 구조를 명확하게 한 것이다. 이는 원인과 결과의 메커니즘을 기술한 것으로 생각할 수 있다.

Q. 인과성이 인공지능, 기계학습, 데이터 사이언스와 어떻게 관련 있을까?
A. 인공지능은 어떤 에이전트(소프트웨어 혹은 로봇)가 목표를 성취하기 위해 주어진 환경에서 합리적인 액션을 취하는 것이다. 이때 환경에 변화를 주어 원하는 상태로 변화시키는 인과 관계로 해석이 가능하다. 기계학습은 데이터의 상관성을 학습하는 것인데 이때도 인과 관계를 통해 해석이 가능하다. 데이터 사이언스는 데이터를 통해 풀고자 하는 질문에 따라 다르겠지만, 어떤 데이터를 수집하고 그것을 처리, 분석하고 이 결과를 어떻게 인간과 상호작용할 것인가 하는 많은 부분에서 상관성과 인과성 모두 복합적으로 고려한다.

Pearl's Causal Hierarchy

Level 1: Associational or Observational

첫번째 계층: 관측 계층

  • 관측을 통해 시스템을 구성하고 있는 변수들의 상관성을 알 수 있음
  • 예를 들어, 아스피린을 먹은 사람과 그렇지 않은 사람들의 두통의 심한 정도를 눈으로 관찰할 수 있다.

Level 2: Interventional or Experimental

두번째 계층: 실험 계층

  • 주어져 있는 연구를 하고자 하는 시스템을 중재(intervention)이라고 하는데, 중재(혹은 실험)를 통해서 나오는 결과에 관심이 있음
  • 예를 들어, 아스피린을 두 그룹에 무작위로 먹게 함으로써 그 사람들의 두통이 어떤 식으로 바뀌었는가를 실험할 수 있다.

Level 3: Counterfactual

세번째 계층: 반사실적 계층

  • 관측 값과 실험에 의한 값을 동시에 고려하는 계층
  • 예를 들어, 아스피린을 먹고 두통이 사라졌을 때 만약 아스피린을 먹지 않았다면 두통이 어떻게 변했을까와 같은 질문에 답을 할 수 있다.

Simpson's Paradox

  • 일반적인 1형, 2형 오류에 대한 문제로, 약국의 사례임(Ensemble 파트의 model 성능평가 방식을 참고).
  • 각 부분에 대한 평균이 크다고 해서 전체에 대한 평균까지 크지는 않다는 의미이다. 영국의 통계학자 에드워드 심슨이 정리한 역설로(심프슨의 역설이라고도 한다) 각각의 변수에 신경 쓰지 않고 전체 통계 결과를 유추하다 일어나는 오류이다.

Q. 심슨의 역설을 통해 알 수 있는 것은 무엇일까?
A. 인과적인 분석을 하기 위해서는 주어진 데이터 뿐만 아니라 각 변수들이 가지는 인과적 관계에 대한 자세한 이해가 필요하다.

Q. 그렇다면 데이터를 분석하고자 할 때 어떤 것을 고려해야 할까?
A. 첫번째로 주어진 데이터가 상관성을 지니고 있는지 아니면 인과성을 지니고 있는지 고려해야 한다. 두번째로 알고자 하는 질문이 단순히 조건부 확률 같은 상관성에 관한 것인지 아니면 인과성에 관한 것인지 고려해야 한다.

How to get a layer-free Conclusion

Formalizing Causality

인과 추론은 우리가 알 수 없는 실험 결과를 관측 데이터와 연결하는 것이다. 실험 결과와 관측 데이터를 연결하기 위해서 블랙박스에 대한 형식적이고 수학적인 이해가 필요하다.

  • Example: Unknown Black Box System
    -> First Observational Study ==> Method: Observation
    -> Drug Efficacy ==> Method: Getting clinical Trials
    -> Unknown BA.2 R0 ==> Method: Hypothetical Public policy

This leads to a Structural Causal Model; A formal framework to study causality.

Defintion of Formalized Causality

Intervention - Do operator

▶ Given a model M the action of fixing any observable variable X ∈ V to a constant value x is denoted using the do(·) operator as do(X = x).
▶ This operation gives birth to a submodel Mx that looks exactly like M but with functions where fx has been replaced with a constant x.
▶ These two graphs represent the world before and after an intervention do(X = x).

Casual Effects

Casual diagram은 전문가들의 전문적인 지식이나 상식 또는 가정에 의해서 만들어진다. Structural Causal Model (SCM, Pearl [2000])은 인과성을 알기 위한 프레임워크다.

By definitive model, it says "Given two disjoint sets of variables, X and Y, the causal effect of X on Y, denoted as P(y|do(x)) or Px(y), is a function from X to the space of probability distributions of Y.

Researchers are interested in Expectation, Difference(Mostly with Average Treatment Effect; known as ATE), and Conditional occurences(with Conditional ATE).

The Conditional Independence from Casual Diagram is proven and summerized as by definition below - Two vertices X,Y are said to be d-separated by a set Z in a directed acyclic graph G, denoted by (X ㅛ G Y | Z), if every path p from X to Y are blocked where blockage occurs when one of the following holds:
1. p contains at least one arrow-emitting node that is in Z, or
2. p contains at least one collider that is outside Z and has no descendant in Z.

Examples are also shown as below.

profile
부산사는 아저씨

0개의 댓글