[Causality] Salesforce CausalAI - 1. Overview

ํ™˜๊ณต์ง€๋Šฅยท2023๋…„ 2์›” 15์ผ
0

[CausalAI]

๋ชฉ๋ก ๋ณด๊ธฐ
1/1
post-thumbnail

CausalAI

๐Ÿ“Œ TLDR; ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ(Time Series Data) ๋˜๋Š” ํ‘œ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ(Tabular Data)์— ๋Œ€ํ•œ ์ธ๊ณผ ๋ถ„์„์„ ์œ„ํ•œ ์˜คํ”ˆ ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ธ Salesforce CausalAI ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์†Œ๊ฐœํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค. Salesforce CausalAI๋Š” ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ ์œ ํ˜• ์ฒ˜๋ฆฌ, ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ๊ฐ€์ง€๋Š” ๋ฐ์ดํ„ฐ์˜ ์ƒ์„ฑ, ์†๋„ ํ–ฅ์ƒ์„ ์œ„ํ•œ ๋‹ค์ค‘ ์ฒ˜๋ฆฌ, ๋„๋ฉ”์ธ ์ง€์‹ ํ™œ์šฉ ๋ฐ ์‚ฌ์šฉ์ž ์นœํ™”์ ์ธ ์ธํ„ฐํŽ˜์ด์Šค ์ œ๊ณต์„ ํฌํ•จํ•˜์—ฌ, ์ธ๊ณผ ๋ถ„์„์˜ ๋‹ค์–‘ํ•œ ์š”๊ตฌ์— ๋Œ€ํ•œ ์›์Šคํ†ฑ ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

CausalAI๋Š” ์ง€์†์ ์œผ๋กœ ๊ฐœ์„ ๋˜๊ณ  ์žˆ์œผ๋ฉฐ ํ–ฅํ›„์—๋Š” ์ด๊ธฐ์ข… ๋ฐ์ดํ„ฐ ์œ ํ˜•(์—ฐ์† ๋ฐ ๋ถˆ์—ฐ์† ๋ฐ์ดํ„ฐ ์œ ํ˜• ํ˜ผํ•ฉ ํ˜•ํƒœ)์— ๋Œ€ํ•œ ์ธ๊ณผ ๋ถ„์„ ์ง€์›, GPU ๊ธฐ๋ฐ˜ ์ปดํ“จํŒ… ์ง€์›, ์ธ๊ณผ ๊ด€๊ณ„ ๋ฐœ๊ฒฌ ๋ฐ ์ถ”๋ก ์„ ์œ„ํ•œ ๋” ๋งŽ์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํƒ‘์žฌ, ์ž ์žฌ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๋ถ„์„์„ ์ง€์›ํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค.

Salesforce CausalAI๋Š” ๋ฌด์—‡์ธ๊ฐ€?

๋‹ค์ค‘ ๋ณ€์ˆ˜ ์‹œ์Šคํ…œ(Multivariate System)์—์„œ ํ•˜๋‚˜์˜ ๋ณ€์ˆ˜/์—”ํ‹ฐํ‹ฐ/ํŠน์„ฑ์ด ๋‹ค๋ฅธ ๋ณ€์ˆ˜/์—”ํ‹ฐํ‹ฐ/๊ธฐ๋Šฅ์„ ์œ ๋ฐœํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ํ™•์ธํ•˜๋Š” ๊ฒƒ์€ ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ํก์—ฐ์ด ์•”์„ ์œ ๋ฐœํ•˜๋Š”์ง€ ์—ฌ๋ถ€๋ฅผ ํ™•์ธํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•ด๋ด…์‹œ๋‹ค. ํก์—ฐ๐Ÿšญ๊ณผ ์•”๐Ÿ’Š์ด๋ผ๋Š” ๋‘๊ฐ€์ง€ ๋ณ€์ˆ˜๊ฐ€ ์žˆ์œผ๋ฉฐ, ์‚ฌ๋žŒ๋“ค์€ ๋‹จ์ˆœํžˆ ์›์ธ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ์ฐพ๋Š” ๊ฒƒ ์ด์ƒ์œผ๋กœ ๋‹ค๋ฅธ ์ธ๊ณผ์  ๋ณ€์ˆ˜๊ฐ€ ๊ฐœ์ž…๋œ ๊ฒฝ์šฐ ํ˜•์ƒ์˜ ๊ฐ’ ๋ณ€ํ™”์— ๋Œ€ํ•œ ์ˆ˜์น˜ ์ถ”์ •์น˜๋ฅผ ์ฐพ๋Š”๋ฐ์— ๊ด€์‹ฌ์ด ์žˆ์„ ์ˆ˜์žˆ์Šต๋‹ˆ๋‹ค.

Salesforce์˜ CausalAI๋Š” ๊ด€์ธก ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์œ„์™€ ๊ฐ™์€ ์ธ๊ณผ๊ด€๊ณ„ ๊ด€๋ จ ์งˆ๋ฌธ์— ๋‹ตํ•˜๊ณ ์ž ํ•˜๋Š” ์˜คํ”ˆ์†Œ์Šค ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. ์ด์‚ฐํ˜•๊ณผ ์—ฐ์†ํ˜• ๋ณ€์ˆ˜์œผ๋กœ ์ด๋ฃจ์–ด์ง„ ํƒœ๋ทธ๋Ÿฌ ๋ฐ์ดํ„ฐ์™€ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ์ง€์›ํ•˜๋ฉฐ, ๋ณ€์ˆ˜ ๊ฐ„์˜ ์„ ํ˜• ๋ฐ ๋น„์„ ํ˜• ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํฌํ•จํ•˜๋ฉฐ, ์†๋„ ํ–ฅ์ƒ์„ ์œ„ํ•œ ๋‹ค์ค‘ ์ฒ˜๋ฆฌ ๊ธฐ๋ฐ˜ ๋ณ‘๋ ฌํ™”๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

๋˜ํ•œ ์ง€์ •๋œ ๊ตฌ์กฐ ๋ฐฉ์ •์‹ ๋ชจ๋ธ(Structural Equation Model; SEM)๋กœ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ(Synthetic Data)๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐ์ดํ„ฐ ์ƒ์„ฑ๊ธฐ๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์–ด ์‚ฌ์šฉ์ž๋กœ ํ•˜์—ฌ๊ธˆ ๋‹ค์–‘ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์กฐ์‚ฌํ•˜๋ฉด์„œ ์‹ค์ธก ์ธ๊ณผ ๊ณผ์ •์„ ์ œ์–ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ตฌํ˜„๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ ์ฝ”๋”ฉ ์—†์ด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ธ๊ณผ ๋ถ„์„์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ์‚ฌ์šฉ์ž ์ธํ„ฐํŽ˜์ด์Šค(UI)๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

CausalAI์˜ ๋ชฉํ‘œ๋Š” ์ธ๊ณผ ๊ด€๊ณ„ ์˜์—ญ์˜ ๋‹ค์–‘ํ•œ ๋ฌธ์ œ์— ๋Œ€ํ•œ ๋น ๋ฅด๊ณ  ์œ ์—ฐํ•œ ์†”๋ฃจ์…˜์„ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.


CausalAI๋Š” ์–ด๋–ค ์ข…๋ฅ˜์˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€?

์ธ๊ณผ๊ด€๊ณ„ ๋ฐœ๊ฒฌ(Causal Discovery)

๊ฐ„๋‹จํžˆ ๋งํ•ด์„œ ์ธ๊ณผ์  ๋ฐœ๊ฒฌ์€ ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค๋ณ€๋Ÿ‰ ์‹œ์Šคํ…œ์—์„œ ์–ด๋–ค ๋ณ€์ˆ˜๊ฐ€ ์–ด๋–ค ๋ณ€์ˆ˜๋ฅผ ์œ ๋ฐœํ•˜๋Š”์ง€์— ๋Œ€ํ•œ ์งˆ๋ฌธ์— ๋Œ€๋‹ตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ณด๋‹ค ๊ตฌ์ฒด์ ์œผ๋กœ, ์ธ๊ณผ์  ๋ฐœ๊ฒฌ์€ ๋ณ€์ˆ˜๊ฐ€ ๊ทธ๋ž˜ํ”„์—์„œ ๋…ธ๋“œ๋กœ ์ทจ๊ธ‰๋˜๊ณ  ๊ทธ ์—ฃ์ง€๋ฅผ ์•Œ ์ˆ˜ ์—†๋Š” ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ์—์„œ ๊ทผ๋ณธ์ ์ธ ๋ฐฉํ–ฅ์„ฑ ๊ธฐ๋ฐ˜์˜ ์ธ๊ณผ๊ด€๊ณ„ ๊ทธ๋ž˜ํ”„๋ฅผ ์ฐพ๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ๋‘ ๋ณ€์ˆ˜ ์‚ฌ์ด์˜ ๊ฐ„์„ (A->B)์€ A๊ฐ€ B๋ฅผ ์œ ๋ฐœํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ๋Š” ๊ฐœ์ž…(Intervene) ์—†์ด ๊ณผ๊ฑฐ์— ๊ธฐ๋ก๋œ ์ผ๋ จ์˜ ๊ด€์ฐฐ์ผ ๋ฟ์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๋ณ€์ˆ˜ ๊ฐ„์˜ ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์ฐพ์œผ๋ ค๋ฉด ๊ฐœ์ž…์„ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ํŠน์ • ๊ฐ€์ • ํ•˜์—์„œ ๊ด€์ฐฐ ๋ฐ์ดํ„ฐ์—์„œ ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ธฐ๋ณธ ์ธ๊ณผ ๊ด€๊ณ„๋ฅผ ์ถ”์ถœํ•˜๋Š” ๊ฒƒ๋„ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

์ธ๊ณผ์ถ”๋ก (Causal Inference)

์ธ๊ณผ์ถ”๋ก ์€ ํ•œ ๋ณ€์ˆ˜ ์ง‘ํ•ฉ์ด ๋‹ค๋ฅธ ๋ณ€์ˆ˜์— ๊ฐœ์ž…ํ•˜๋Š” ์ˆ˜์น˜์  ์ถ”์ •์น˜(Numerical Estimate)๋ฅผ ์ฐพ๋Š” ๊ฒƒ๊ณผ ๊ด€๋ จ๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ์œ ํ˜•์˜ ์ถ”๋ก ์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ๋ฐœ๊ฒฌ๋œ ๋‘ ๋ณ€์ˆ˜ ์‚ฌ์ด์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ž…๋ ฅ์„ ๋ฐ”ํƒ•์œผ๋กœ ์ฃผ์–ด์ง„ ๋‹ค๋ฅธ ๋ณ€์ˆ˜๋ฅผ ์˜ˆ์ธกํ•  ๋•Œ ๊ธฐ๊ณ„ ํ•™์Šต ๋ชจ๋ธ์ด ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

์ธ๊ณผ์ถ”๋ก ์€ ๊ฐœ์ž…๋œ ๋ณ€์ˆ˜์—์„œ ๋ชฉํ‘œ ๋ณ€์ˆ˜๋กœ ๋ฐฉํ–ฅ์ด ์žˆ๋Š” ์—ฃ์ง€๋ฅผ ๋”ฐ๋ผ ์ธ๊ณผ ๊ด€๊ณ„ ๊ทธ๋ž˜ํ”„๋ฅผ ์ˆœํšŒํ•˜๋Š” ๋™์•ˆ ํ•œ ๋ณ€์ˆ˜์˜ ๋ณ€ํ™”๊ฐ€ ๋ชฉํ‘œ ๋ณ€์ˆ˜๋กœ ์ „ํŒŒ๋˜๋Š” ์ •๋„๋ฅผ ์ถ”์ •ํ•˜๋Š”๋ฐ ์ฃผ ๋ชฉ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋‘ ๊ฐœ ์ด์ƒ์˜ ๋ณ€์ˆ˜๊ฐ€ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•˜๋”๋ผ๋„ ๊ทธ๋“ค ์‚ฌ์ด์— ์ธ๊ณผ ๊ฒฝ๋กœ๊ฐ€ ์—†์œผ๋ฉด ๊ฐœ์ž…ํ•˜๋Š” ๋ณ€์ˆ˜๊ฐ€ ๋‹ค๋ฅธ ๋ณ€์ˆ˜์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

์›์ธ ๋ถ„์„ ๋ฐ ๊ฐœ์ž…์˜ ์ค‘์š”์„ฑ

๊ฐœ์ž…(Intervene)์€ ์ƒ๊ด€๊ด€๊ณ„์™€ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

์˜ˆ๋ฅผ ๋“ค์–ด ์ƒ๊ฐํ•ด๋ด…์‹œ๋‹ค.

์—ฌ๋ฆ„์—๋Š” ์‚ฌ๋žŒ๋“ค์ด ์ˆ˜์˜์„ ํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ๋žŒ๋“ค์ด ์ต์‚ฌํ•  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์•„์ด์Šคํฌ๋ฆผ์„ ๋จน๋Š” ๊ฒƒ ์—ญ์‹œ ์‚ฌ๋žŒ๋“ค์ด ์—ฌ๋ฆ„์— ์ฆ๊ฒจํ•˜๋Š” ํ™œ๋™ ์ค‘์— ํ•˜๋‚˜์ด๋ฉฐ, ์ˆ˜์˜์„ ํ•˜๋Š” ๊ฒƒ๊ณผ ์•„์ด์Šคํฌ๋ฆผ์„ ๋จน๋Š” ๊ฒƒ ๋ชจ๋‘ ๊ฒจ์šธ์ฒ ์— ํ•  ๊ฐ€๋Šฅ์„ฑ์€ ์ ์Šต๋‹ˆ๋‹ค.
๋”ฐ๋ผ์„œ ์ต์‚ฌํ•˜๋Š” ์‚ฌ๋žŒ์˜ ์ˆ˜์™€ ์•„์ด์Šคํฌ๋ฆผ์„ ์†Œ๋น„ํ•˜๋Š” ์‚ฌ๋žŒ์˜ ์ˆ˜๋Š” ์•ฝ๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๊ฐ€์งˆ ์ˆ˜๋Š” ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์šฐ๋ฆฌ๋Š” ์•„์ด์Šคํฌ๋ฆผ์„ ๋จน๋Š”๋‹ค๊ณ  ์‚ฌ๋žŒ์ด ์ต์‚ฌํ•œ๋‹ค๊ฑฐ๋‚˜, ๊ทธ ๋ฐ˜๋Œ€์˜ ๊ฒฝ์šฐ๋„ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฐ˜๋ฉด, ์šด๋™์„ ์ฝœ๋ ˆ์Šคํ…Œ๋กค ์ˆ˜์น˜๋ฅผ ๋‚ฎ์ถ”๋Š” ๊ฒƒ์œผ๋กœ ๋ฐํ˜€์กŒ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์‚ฌ๋žŒ์˜ ์ฝœ๋ ˆ์Šคํ…Œ๋กค ์ˆ˜์น˜๊ฐ€ ๋†’์œผ๋ฉด ๊ทธ ์ˆ˜์น˜๋ฅผ ๋‚ฎ์ถ”๊ธฐ ์œ„ํ•ด ๊ฐœ์ž…ํ•˜์—ฌ ์šด๋™์„ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋”ฐ๋ผ์„œ ๊ฐœ์ž…(Intervene)์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์ž๋™ํ™”์— ์‚ฌ์šฉ๋˜๋Š” ์ƒ๊ด€๊ด€๊ณ„ ๊ธฐ๋ฐ˜ ๊ธฐ๊ณ„ ํ•™์Šต ๋ชจ๋ธ๊ณผ ๋‹ฌ๋ฆฌ ๋ฏธ๋ž˜ ๊ฒฐ๊ณผ๋ฅผ ๋ณ€๊ฒฝํ•˜๋Š” ๋ฐ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์‹คํ–‰๊ฐ€๋Šฅํ•œ ํ•ญ๋ชฉ์ž…๋‹ˆ๋‹ค. ์ธ๊ณผ ๋ถ„์„ ๋„๊ตฌ๋Š” ํŠน์ • ๊ด€์‹ฌ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ธฐ ์œ„ํ•ด ๊ฐœ์ž…ํ•  ์ˆ˜ ์žˆ๋Š” ์‹œ์Šคํ…œ์˜ ๋ณ€์ˆ˜๋ฅผ ๋ฐœ๊ฒฌํ•˜๋Š”๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

์‹ค์ œ ์‚ฌ๋ก€

๐Ÿ’กํ•ญ๊ณต๊ถŒ ๊ฐ€๊ฒฉ์ด ๋น„์‹ธ์ง์— ๋”ฐ๋ผ ๊ฐ€๊ฒฉ์„ ๋‚ฎ์ถœ ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋Šฅํ•œ ๊ฑฐ์‹œ๊ฒฝ์ œ์  ์กฐ์น˜๋ฅผ ์ฐพ๊ณ ์ž ํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•ฉ์‹œ๋‹ค.

๋จผ์ € ํ•ญ๊ณต๊ถŒ์˜ ๊ฐ€๊ฒฉ์ด ์˜ค๋ฅด๊ฑฐ๋‚˜ ๋‚ด๋ฆฌ๋Š” ์›์ธ์„ ์ฐพ๋Š” ๊ฒƒ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค. ์›์œ ์˜ ๊ณผ๊ฑฐ ์›”๋ณ„ ๊ฐ€๊ฒฉ๊ณผ ๋ฏธ๊ตญ์˜ ํ‰๊ท  ์›” ํ•ญ๊ณต๋ฃŒ์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ์—ˆ์œผ๋ฉฐ, ์ด ๋ฐ์ดํ„ฐ๋Š” ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

์›์œ  ๊ฐ€๊ฒฉ์ด ์˜ค๋ฅด๋ฉด ํ•ญ๊ณต๋ฃŒ๊ฐ€ ์–ด๋–ป๊ฒŒ ๋˜๋Š”์ง€, ํ•ญ๊ณต๋ฃŒ๊ฐ€ ์˜ค๋ฅด๋ฉด ์›์œ  ๊ฐ€๊ฒฉ์ด ์–ด๋–ป๊ฒŒ ๋˜๋Š”์ง€ ์•Œ๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ๋Š” ์ƒ๊ด€๊ด€๊ณ„์— ๋Œ€ํ•ด ๋งํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹™๋‹ˆ๋‹ค. ์˜คํžˆ๋ ค ํ•œ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ๊ฐœ์ž…์„ ์ˆ˜ํ–‰ํ•˜๊ณ  ๋‹ค๋ฅธ ๋ณ€์ˆ˜์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์— ๋Œ€ํ•ด ์ด์•ผ๊ธฐํ•˜๊ณ  ์žˆ์œผ๋ฉฐ ์ด๋Š” ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ํŒŒ์•…ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋” ์–ด๋ ค์šด ์ž‘์—…์ž…๋‹ˆ๋‹ค.

๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ด ํŠน์ • ๋ฌธ์ œ๋Š” ์ƒ๋‹นํžˆ ์ง๊ด€์ ์ด๋ฉฐ, ์œ ๊ฐ€๊ฐ€ ์ƒ์Šนํ•˜๋ฉด ํ•ญ๊ณต ํšŒ์‚ฌ์˜ ์—ฐ๋ฃŒ ๋น„์šฉ์ด ์ฆ๊ฐ€ํ•˜์—ฌ ํ•ญ๊ณต๊ถŒ ๊ฐ€๊ฒฉ์ด ์ธ์ƒ๋  ๊ฒƒ์ด๋ผ๋Š” ์ƒ์‹์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด์— ํ•ญ๊ณต์‚ฌ๊ฐ€ ์œ ๊ฐ€ ๋ณ€๋™๊ณผ ๋ฌด๊ด€ํ•˜๊ฒŒ ๊ฐ€๊ฒฉ์„ ์ธ์ƒํ•˜๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ๋‹ค๋ฉด ์ด๋Ÿฌํ•œ ์ธ์ƒ์€ ์œ ๊ฐ€์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š์•„์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์œ ๊ฐ€๋Š” ํ•ญ๊ณต๋ฃŒ์— ์˜ํ–ฅ์„ ์ฃผ์ง€๋งŒ ๊ทธ ๋ฐ˜๋Œ€๋Š” ์•„๋‹™๋‹ˆ๋‹ค. ๋ณด๋‹ค ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ๋Š”, ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ธ๊ณผ ๋ถ„์„์„ ํ†ตํ•ด ์œ ๊ฐ€์˜ ์ƒ์Šน์ด ๋‹ค๋ฅธ ์›์ž์žฌ ๊ฐ€๊ฒฉ์— ์—ฐ์‡„์ ์œผ๋กœ ์˜ํ–ฅ์„ ๋ฏธ์นœ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ•  ์ˆ˜๋„ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ํ•ญ๊ณต๊ถŒ ๋ฐ ๊ธฐํƒ€ ์ƒํ’ˆ์˜ ์ƒ์Šนํ•˜๋Š” ๋น„์šฉ์„ ์ค„์ด๊ธฐ ์œ„ํ•œ ๊ฐ€๋Šฅํ•œ ๊ฑฐ์‹œ๊ฒฝ์ œ์  ํ•ด๊ฒฐ์ฑ… ์ค‘ ํ•˜๋‚˜๋Š” ์„์œ  ๊ณต๊ธ‰์„ ๋Š˜๋ฆฌ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์„์œ  ๋น„์šฉ์„ ๋‚ฎ์ถ”์–ด์•ผ๋งŒ ๊ฐ€๊ฒฉ์„ ๋‚ฎ์ถœ ์ˆ˜ ์žˆ๋‹ค๋Š” ์˜๋ฏธ์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

์ธ๊ณผ ๋ถ„์„์˜ ์žฅ์ ์€ ๋‹จ์ˆœํžˆ ๊ณผ๊ฑฐ ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ "์ƒ์‹"์—†์ด ์ด๋Ÿฌํ•œ ๊ด€๊ณ„๋ฅผ ์ž๋™์œผ๋กœ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ด๋Ÿฌํ•œ ๋ถ„์„ ๊ธฐ๋ฒ•์€ ๋Œ€๊ทœ๋ชจ ๋‹ค๋ณ€์ˆ˜ ์‹œ์Šคํ…œ์„ ๋‹ค๋ฃจ๊ณ ์ž ํ•˜์ง€๋งŒ, ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ์™„์ „ํ•œ ์‚ฌ์ „ ์ง€์‹์ด ๋ถ€์กฑํ•  ๋•Œ ๊ทธ ํž˜์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค.


CausalAI ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๊ฐœ์š”

Salesforce์˜ CausalAI๋Š” ์œ„์—์„œ ์„ค๋ช…ํ•œ ์ธ๊ณผ๊ด€๊ณ„์˜ ๋ฐœ๊ฒฌ ๋ฐ ์ธ๊ณผ๊ด€๊ณ„ ์ถ”๋ก  ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜์—์„œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ API ํŒŒ์ดํ”„๋ผ์ธ, ์ฃผ์š” ๊ธฐ๋Šฅ, ์ง€์›๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ ์ด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€ ๊ธฐ์กด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€์˜ ๋น„๊ต๋ฅผ ๋ณด์—ฌ๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.

API ํŒŒ์ดํ”„๋ผ์ธ

์œ„์˜ ๊ทธ๋ฆผ์€ CausalAI ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ ํŒŒ์ดํ”„๋ผ์ธ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ๋ณธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ํฌ๊ฒŒ ์ธ๊ณผ์  ๋ฐœ๊ฒฌ(Causal Discovery)์™€ ์ธ๊ณผ์ถ”๋ก (Causal Inference)๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

  • ์ธ๊ณผ์  ๋ฐœ๊ฒฌ ๋ชจ๋“ˆ์€ ๋ฐ์ดํ„ฐ ๊ฐ์ฒด ๋ฐ ์‚ฌ์ „ ์ง€์‹ ๊ฐ์ฒด๋ฅผ ์ž…๋ ฅ์œผ๋กœ ์ทจํ•˜๊ณ  ์ธ๊ณผ ๊ทธ๋ž˜ํ”„(Causal Graph)๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค.
  • ์ธ๊ณผ์ถ”๋ก  ๋ชจ๋“ˆ์€ ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์™€ ์‚ฌ์šฉ์ž๊ฐ€ ์ง€์ •ํ•œ ๊ฐœ์ž…์„ ํ•จ๊ป˜ ์ž…๋ ฅ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ  ์ง€์ •๋œ ๋Œ€์ƒ ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ์ถ”์ •์˜ ํšจ๊ณผ๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ํ˜•ํƒœ์ž…๋‹ˆ๋‹ค.

์ฃผ์š” ๊ธฐ๋Šฅ

  • ๋ฐ์ดํ„ฐ : ๋ถˆ์—ฐ์†ํ˜•๊ณผ ์—ฐ์†ํ˜• Tabular์™€ TimeSeries ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ธ๊ณผ๊ด€๊ณ„ ๋ถ„์„์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  • ๊ฒฐ์ธก์น˜ : ๋ฐ์ดํ„ฐ์—์„œ ๋ˆ„๋ฝ๋˜์–ด ์žˆ๊ฑฐ๋‚˜ Nan ๊ฐ’์— ๋Œ€ํ•œ ์ฒ˜๋ฆฌ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ์ƒ์„ฑ๊ธฐ(Data Generator) : Tabular ๋ฐ TimeSeries ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์ง€์ •๋œ SEM(Structural Equation Model; ๊ตฌ์กฐ๋ฐฉ์ •์‹ ๋ชจ๋ธ)์„ ์‚ฌ์šฉํ•˜๋Š” ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ๊ธฐ์ž…๋‹ˆ๋‹ค. ์ธ๊ณผ๊ด€๊ณ„ ๋ฐœ๊ฒฌ์˜ ์ธก๋ฉด์—์„œ Ground Truth๋กœ ๊ธฐ๋Šฅํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์—ฌ๋Ÿฌ ์ธ๊ณผ ๊ด€๊ณ„ ๋ฐœ๊ฒฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜๋“ค์„ ํ‰๊ฐ€ํ•˜๊ณ  ๋น„๊ตํ•˜๋Š”๋ฐ์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋ถ„์‚ฐ ์ปดํ“จํŒ… : ๋ณ‘๋ ฌํ™”๋ฅผ ์œ„ํ•ด Ray ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ค์ค‘ ์ฒ˜๋ฆฌ๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋” ๋น ๋ฅธ ๊ณ„์‚ฐ์ด ํ•„์š”ํ•œ ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ์…‹ ๋˜๋Š” ๋‹ค๋ณ€์ˆ˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ๋•Œ ์‚ฌ์šฉ์ž๊ฐ€ ์„ ํƒ์ ์œผ๋กœ ์ผค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ํฌ๊ธฐ์— ๋”ฐ๋ผ ์ตœ๋Œ€ 5๋ฐฐ์˜ ์†๋„ ํ–ฅ์ƒ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค
  • ๋ชฉํ‘œ์— ๋Œ€ํ•œ ์ธ๊ณผ์  ๋ฐœ๊ฒฌ(Targeted Causal Discovery) : ๊ฒฝ์šฐ์— ๋”ฐ๋ผ ์‚ฌ์šฉ์ž๊ฐ€ ์ „์ฒด ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ๋„์ถœํ•˜๋Š” ๋Œ€์‹  ๊ด€์‹ฌ์ด ์žˆ๋Š” ํŠน์ • ๋ณ€์ˆ˜์— ๋Œ€ํ•œ ์ธ๊ณผ๊ด€๊ณ„๋ฅผ ์ฐพ๊ณ ์žํ•˜๋Š” ๊ฒฝ์šฐ ๋ชฉํ‘œ์— ๋Œ€ํ•œ ์ธ๊ณผ ๊ด€๊ณ„ ๊ฒ€์ƒ‰์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์ด ์˜ต์…˜์„ ํ†ตํ•ด ๊ณ„์‚ฐ ๋ณต์žก๋„๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์‹œ๊ฐํ™” : ์ธ๊ณผ ๊ทธ๋ž˜ํ”„์˜ ์‹œ๊ฐํ™”๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  • ๋„๋ฉ”์ธ ์ง€์‹(Domain Knowledge) : ์ธ๊ณผ ๊ด€๊ณ„ ๋ฐœ๊ฒฌ ๊ณผ์ •์—์„œ ์ธ๊ณผ ๊ด€๊ณ„ ๊ทธ๋ž˜ํ”„์— ๋Œ€ํ•œ ๋ถ€๋ถ„์ ์ธ ์‚ฌ์ „ ์ง€์‹์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์ „ ์ง€์‹์€ ๋„๋ฉ”์ธ ์ง€์‹์„ ๋ฐ”ํƒ•์œผ๋กœ SEM์—์„œ ํŠน์ • ๋…ธ๋“œ์™€ ํŠน์ • ๋…ธ๋“œ๊ฐ€ ์—ฐ๊ฒฐ๋˜์ง€ ์•Š๋Š”๋‹ค๋Š” ํ˜•ํƒœ๋กœ ์ง€์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์•Œ๊ณ ๋ฆฌ์ฆ˜

์ œ๊ณต๋˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  • ์‹œ๊ณ„์—ด ์ธ๊ณผ ๋ฐœ๊ฒฌ์„ ์œ„ํ•ด PC ์•Œ๊ณ ๋ฆฌ์ฆ˜, Granger Causality, VARLINGAM์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • ํ‘œ ํ˜•์‹ ์ธ๊ณผ ๋ฐœ๊ฒฌ์„ ์œ„ํ•œ PC ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.
  • ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•ด, ๊ฐ„์„ญ์ด ์ฃผ์–ด์ง„ ๋ฐ˜์‚ฌ์‹ค์„ ์ถ”์ •ํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ํ”„๋กœ์„ธ์Šค๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์œ„ํ•ด ์ธ๊ณผ ๊ทธ๋ž˜ํ”„๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์กฐ๊ฑด๋ถ€ ๋ชจ๋ธ์„ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

ํ–ฅํ›„ ์ธ๊ณผ ๊ด€๊ณ„ ๋ฐœ๊ฒฌ๊ณผ ์ธ๊ณผ์ถ”๋ก ์„ ์œ„ํ•ด ๋” ๋งŽ์€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ถ”๊ฐ€ํ•  ๊ณ„ํš์ž…๋‹ˆ๋‹ค.

๊ธฐ์กด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์™€์˜ ๋น„๊ต

My Opinion โœ…

GroundTruth๋ฅผ ์•Œ๊ธฐ ์–ด๋ ค์šด ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋‚˜ ํƒœ๋ทธ๋Ÿฌ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์ข‹์€ ํ”„๋ ˆ์ž„์›Œํฌ์ธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.
์ธ๊ณผ ๋ฐœ๊ฒฌ๊ณผ ์ธ๊ณผ ์ถ”๋ก  ๊ธฐ๋Šฅ์„ ๋ชจ๋‘ ์ œ๊ณตํ•ด์ฃผ๊ธฐ ๋•Œ๋ฌธ์— ์‹ค๋ฌด์—์„œ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์„ ๊ฒƒ์œผ๋กœ ์˜ˆ์ƒ๋ฉ๋‹ˆ๋‹ค.
Tutorial์„ ์ง„ํ–‰ํ•˜๊ณ , ํ˜„์‹ค ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ ์šฉํ•ด๋ณด๋Š” ๊ฒƒ๊นŒ์ง€์˜ ํ† ์ด ํ”„๋กœ์ ํŠธ๋กœ CausalAI ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ๋Œ€ํ•œ ์‹œ๋ฆฌ์ฆˆ๋ฅผ ์ด์–ด๊ฐ€๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค!

๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค:)
.
.
.

Reference

profile
๋ฐ์ดํ„ฐ์‚ฌ์ด์–ธํ‹ฐ์ŠคํŠธ ๋Œ€ํ•™์›์ƒ

0๊ฐœ์˜ ๋Œ“๊ธ€