๐Ÿง  ๊ฐœ๋… ์š”์•ฝ: LIME์ด๋ž€?

์Œ€๊ณผ์žAIยท2025๋…„ 9์›” 3์ผ

XAI

๋ชฉ๋ก ๋ณด๊ธฐ
3/5

LIME์€ ๋ณต์žกํ•œ ๋ชจ๋ธ(black-box)์˜ ๊ฐœ๋ณ„ ์˜ˆ์ธก๊ฐ’ ํ•˜๋‚˜ํ•˜๋‚˜์— ๋Œ€ํ•ด, ๊ทธ ์ฃผ๋ณ€์˜ ๊ตญ์†Œ์ ์ธ ์˜์—ญ(local neighborhood)์—์„œ ์„ ํ˜• ๋ชจ๋ธ์„ ํ•™์Šต์‹œ์ผœ ์„ค๋ช…์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

์ฆ‰, โ€œ์ด ๋ชจ๋ธ์ด ์™œ ์ด ์˜ˆ์ธก์„ ํ–ˆ๋Š”๊ฐ€?โ€๋ฅผ ํ•ด๋‹น ์ƒ˜ํ”Œ ํ•˜๋‚˜ ๋‹จ์œ„๋กœ ์„ค๋ช…ํ•ฉ๋‹ˆ๋‹ค.

  • LIME = Local + Interpretable + Model-agnostic

๐Ÿ’ก ํ•ต์‹ฌ ์•„์ด๋””์–ด

  1. ์ „์ฒด ๋ชจ๋ธ์„ ํ•ด์„ํ•˜์ง€ ์•Š๋Š”๋‹ค.
    • ์ „์—ญ์ ์ธ(global) ๋ชจ๋ธ ํ•ด์„์ด ์•„๋‹ˆ๋ผ, ํŠน์ • ์ธ์Šคํ„ด์Šค์— ๋Œ€ํ•œ ์ง€์—ญ(local) ๋ชจ๋ธ์„ ํ•™์Šตํ•ด์„œ ํ•ด์„.
  2. *๋ชจ๋ธ ์ข…๋ฅ˜์— ๋ฌด๊ด€(model-agnostic)**ํ•˜๋‹ค.
    • ์–ด๋–ค ๋ชจ๋ธ์ด๋“  ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Œ (๋”ฅ๋Ÿฌ๋‹, ํŠธ๋ฆฌ๋ชจ๋ธ, ์•™์ƒ๋ธ”, etc.)
    • ์ด์œ : ๋ชจ๋ธ์˜ ์˜ˆ์ธก๊ฐ’๋งŒ ์‚ฌ์šฉํ•˜๊ณ  ๋‚ด๋ถ€ ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ.
  3. ์ž…๋ ฅ์„ ์กฐ๊ธˆ์”ฉ ๋ณ€ํ˜•ํ•œ ๊ฐ€์งœ ๋ฐ์ดํ„ฐ(perturbed samples)๋ฅผ ์ƒ์„ฑํ•˜์—ฌ, ์›๋ž˜ ๋ชจ๋ธ์˜ ์˜ˆ์ธก๊ฐ’์„ ๋ฐ›์•„์˜ค๊ณ , ๊ทธ์— ๋Œ€ํ•œ ์„ ํ˜• ๋ชจ๋ธ์„ fittingํ•ด์„œ ์„ค๋ช… ์ƒ์„ฑ.
  4. ๊ฐ€์ค‘์น˜๋ฅผ ์ค€ ๊ฑฐ๋ฆฌ ๊ธฐ๋ฐ˜(locality-aware) ํ•™์Šต.
    • ์›๋ณธ ์ธ์Šคํ„ด์Šค์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๋” ๋†’์€ ๊ฐ€์ค‘์น˜๋ฅผ ๋ถ€์—ฌ.

๐Ÿ“Š ์ž‘๋™ ๋ฐฉ์‹ (Step by Step)

์˜ˆ: ์–ด๋–ค ๋ฆฌ๋ทฐ๊ฐ€ โ€œpositiveโ€๋ผ๊ณ  ๋ถ„๋ฅ˜๋œ ์ด์œ ๋ฅผ ์„ค๋ช…ํ•˜๊ณ  ์‹ถ๋‹ค.

  1. ํ•ด๋‹น ์ธ์Šคํ„ด์Šค๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฌด์ž‘์œ„๋กœ ์ƒ์„ฑ
    • ํ…์ŠคํŠธ์˜ ๊ฒฝ์šฐ ๋‹จ์–ด๋ฅผ ๋žœ๋คํ•˜๊ฒŒ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ ๋งˆ์Šคํ‚น
    • ์ด๋ฏธ์ง€์˜ ๊ฒฝ์šฐ ํŒจ์น˜๋ฅผ ์ œ๊ฑฐ (superpixel masking)
  2. ์ด ๊ฐ€์งœ ๋ฐ์ดํ„ฐ๋“ค์— ๋Œ€ํ•ด ์›๋ž˜ ๋ชจ๋ธ๋กœ ์˜ˆ์ธก ์ˆ˜ํ–‰
  3. ์ด ์˜ˆ์ธก๊ฐ’๊ณผ ๊ฐ€์งœ ๋ฐ์ดํ„ฐ ์ƒ˜ํ”Œ๋“ค์„ ์ด์šฉํ•ด ์„ ํ˜• ๋ชจ๋ธ ํ•™์Šต
    • ์ด ์„ ํ˜• ๋ชจ๋ธ์€ ๊ตญ์†Œ ์˜์—ญ ๋‚ด์—์„œ ์›๋ž˜ ๋ชจ๋ธ์˜ ์ž‘๋™์„ ๊ทผ์‚ฌ
  4. ์„ ํ˜• ๋ชจ๋ธ์˜ feature ๊ฐ€์ค‘์น˜(weight)๋กœ ํ•ด์„ ์ œ๊ณต

๐Ÿงช ์˜ˆ์‹œ

์›๋ฌธ: "This movie is absolutely fantastic and inspiring"
โ†’ LIME์ด ์ƒ์„ฑํ•œ ์„ค๋ช…:
- "fantastic": +0.8 (positive ์˜ํ–ฅ)
- "inspiring": +0.6 (positive ์˜ํ–ฅ)
- "absolutely": +0.1 (๊ฑฐ์˜ ์˜ํ–ฅ ์—†์Œ)

๐Ÿงฉ ๊ด€๋ จ ๋ณด๊ธฐํ˜• ํ‘œํ˜„ ์˜ˆ์‹œ

์‹œํ—˜์—์„œ ์ž์ฃผ ๋“ฑ์žฅํ•  ์ˆ˜ ์žˆ๋Š” ๋ณด๊ธฐ ์œ ํ˜•์„ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •๋ฆฌํ•ด ๋ด…๋‹ˆ๋‹ค.

๋ณด๊ธฐ์˜ณ์€์ง€ ์—ฌ๋ถ€์„ค๋ช…
LIME์€ ์ž…๋ ฅ๊ฐ’์— ๋…ธ์ด์ฆˆ๋ฅผ ์ถ”๊ฐ€ํ•ด ๋ชจ๋ธ์˜ ์˜ˆ์ธก๊ฐ’์„ ๋ถ„์„ํ•œ๋‹คโœ… ์˜ณ์ŒPerturbation ๊ธฐ๋ฐ˜
LIME์€ ๊ฐœ๋ณ„ feature์˜ ์˜ํ–ฅ๋ ฅ์„ ๊ฐ€์ค‘์น˜๋กœ ์„ค๋ช…ํ•œ๋‹คโœ… ์˜ณ์Œ์„ ํ˜• ๋ชจ๋ธ์˜ weight
LIME์€ ์ „์—ญ์ ์ธ(global) ๋ชจ๋ธ ๋™์ž‘์„ ์„ค๋ช…ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋œ๋‹คโŒ ํ‹€๋ฆผLIME์€ ์ง€์—ญ์ (local) ์„ค๋ช…
LIME์€ ๋ชจ๋ธ ๋‚ด๋ถ€์˜ gradient๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์„ค๋ช…์„ ์ƒ์„ฑํ•œ๋‹คโŒ ํ‹€๋ฆผGradient ๊ธฐ๋ฐ˜์€ SHAP, Integrated Gradients ๋“ฑ
LIME์€ ์ด๋ฏธ์ง€ ๋ชจ๋ธ์—๋Š” ์ ์šฉํ•  ์ˆ˜ ์—†๋‹คโŒ ํ‹€๋ฆผ์ด๋ฏธ์ง€์—๋„ ์‚ฌ์šฉ ๊ฐ€๋Šฅ (superpixel masking)
LIME์€ ๋ชจ๋ธ์— ์ข…์†์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ ์ž‘๋™ํ•œ๋‹คโŒ ํ‹€๋ฆผModel-agnostic ํŠน์„ฑ

๐Ÿ” LIME vs SHAP ๋น„๊ต

ํ•ญ๋ชฉLIMESHAP
ํ•ด์„ ๋ฐฉ์‹์„ ํ˜• ๋ชจ๋ธ ๊ทผ์‚ฌShapley ๊ฐ’ (๊ฒŒ์ž„ ์ด๋ก )
๋Œ€์ƒ๊ตญ์†Œ์ (local)๊ตญ์†Œ + ์ „์—ญ ๊ฐ€๋Šฅ
๊ณ„์‚ฐ ๋น„์šฉ๋‚ฎ์Œ๋†’์Œ (๋ณต์žก)
๋ชจ๋ธ ์˜์กด์„ฑ๋น„์˜์กด (agnostic)model-agnostic or model-specific (TreeSHAP ๋“ฑ)
์•ˆ์ •์„ฑ๋ถˆ์•ˆ์ •ํ•  ์ˆ˜ ์žˆ์Œ์ƒ๋Œ€์ ์œผ๋กœ ์•ˆ์ •

๐Ÿง  ํ•œ ์ค„ ์š”์•ฝ

LIME์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ€ํ˜•ํ•ด ์ƒ์„ฑํ•œ ์œ ์‚ฌ ์ƒ˜ํ”Œ๋“ค์— ๋Œ€ํ•ด black-box ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ์–ป์€ ํ›„, ํ•ด๋‹น ์ธ์Šคํ„ด์Šค ์ฃผ๋ณ€์—์„œ ์„ ํ˜• ๋ชจ๋ธ์„ ํ•™์Šต์‹œ์ผœ ๊ฐ feature์˜ ์˜ํ–ฅ๋ ฅ์„ ํ•ด์„ํ•˜๋Š”, ๋ชจ๋ธ ๋น„์ข…์†์ ์ธ XAI ๊ธฐ๋ฒ•์ด๋‹ค.


profile
AI์— ๊ด€์‹ฌ์ด ๋งŽ์€ 23์‚ด ๋Œ€ํ•™์ƒ์ž…๋‹ˆ๋‹ค.

0๊ฐœ์˜ ๋Œ“๊ธ€