๐Ÿšฉ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ์ดˆ - part09. ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ๋ถ„์„ (feat. ๋ถ„๋ฅ˜ ์ •ํ™•๋„ ๊ณ„์‚ฐ)

vincaยท2022๋…„ 10์›” 27์ผ
0

๐ŸŒ“ AI/DL - theory

๋ชฉ๋ก ๋ณด๊ธฐ
10/24

๐ŸŸข Introduction

์ง€๊ธˆ๊นŒ์ง€ ํ•™์Šต์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ํ•™์Šตํ•˜์˜€๋‹ค.

์ด์ œ ํ•ด๋‹น ๋ชจ๋ธ์ด ์‹ค์ œ๋กœ ์ž˜ ์ž‘๋™ํ•˜๋Š”์ง€๋ฅผ ์•Œ์•„๋ด์•ผํ•˜์ง€ ์•Š๊ฒ ๋Š”๊ฐ€?

๋”ฐ๋ผ์„œ ์ž˜ ์˜ˆ์ธกํ•˜๋Š”์ง€(์„ ํ˜• ํšŒ๊ท€) ๋˜๋Š” ์ž˜ ๋ถ„๋ฅ˜ํ•˜๋Š”์ง€(๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€)๋ฅผ ํ‰๊ฐ€ํ•˜๋Š” ๊ธฐ์ค€๋“ค์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž.

โœ… ์ •ํ™•๋„

๋ชจ๋ธ์ด ์ž˜ ํ•™์Šต๋˜์—ˆ๋Š”์ง€ ์–ด๋–ป๊ฒŒ ์šฐ๋ฆฌ๋Š” ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ์„๊นŒ? ๋ฐ”๋กœ ์ •ํ™•๋„์ด๋‹ค.

์ •ํ™•๋„๋ฅผ ๊ณ„์‚ฐํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์— test data๋ฅผ ๋„ฃ์–ด ๋‚˜์˜จ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์ž˜ ํ•™์Šต์ด ๋˜์—ˆ๋Š”์ง€ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋‹ค.
ํ•˜์ง€๋งŒ ๋ชจ๋ธ์„ ํ•™์Šต์‹œ์ผฐ๋˜ data๋ฅผ test data๋กœ ๊ทธ๋Œ€๋กœ ์ง‘์–ด๋„ฃ๋Š”๋‹ค๋ฉด, ๋‹น์—ฐํžˆ ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•œ ๋ชจ๋ธ์ด๋ฏ€๋กœ 100%์˜ ์ •ํ™•๋„๊ฐ€ ๋‚˜์˜ฌ ๊ฒƒ์ด๋‹ค.
(์ด๋Š” A์‹œํ—˜๋ฌธ์ œ๋กœ ๊ณต๋ถ€ํ•œ ํ•™์ƒ์ด ์‹ค์ œ ์‹œํ—˜์—์„œ๋„ ๋˜‘๊ฐ™์€ A์‹œํ—˜๋ฌธ์ œ๋ฅผ ์น˜๋Š” ๊ฒƒ๊ณผ ๋™์ผํ•˜๋‹ค.)

๋”ฐ๋ผ์„œ ์šฐ๋ฆฌ๋Š” test data๋Š”, ํ•™์Šต์— ์‚ฌ์šฉํ–ˆ๋˜ ๊ฒƒ๊ณผ๋Š” ๋‹ค๋ฅธ sample data๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.

๐ŸŽˆ ์ฐธ๊ณ ) test data = vaild data ๊ฐ™์€ ๋œป.

๐Ÿ”  ํ˜ผ๋™ํ–‰๋ ฌ

ํ˜ผ๋™ ํ–‰๋ ฌ(confusion matrix)์ด๋ž€ ์˜ค๋ฅ˜ ๊ฒฝํ–ฅ์„ ๋ถ„์„ํ•œ ํ–‰๋ ฌ์ด๋‹ค.
์ด์ง„ ๋ฌธ์ œ(T/F)์˜ ๋ถ„์„์— ์ ์šฉ๋˜๋ฉฐ, ์ด ๋˜ํ•œ ๋ชจ๋ธ์ด ์ž˜ ํ•™์Šต๋˜์—ˆ๋Š”์ง€ ํŒ๋‹จํ•˜๋Š” ์ง€ํ‘œ๊ฐ€ ๋œ๋‹ค.

ํ˜ผ๋™ํ–‰๋ ฌ์—์„œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ 4๊ฐ€์ง€์˜ ์•ŒํŒŒ๋ฒณ์œผ๋กœ ํ‘œํ˜„๋œ๋‹ค. T P N F (ํ‹ฐํ”ผ์—”์—ํ”„๊ฐ€ ๋ญ”๊ฐ€ ์ž…์— ์ž˜ ๋‹ฌ๋ผ๋ถ™์–ด์„œ ์ด๋ ‡๊ฒŒ ํ–ˆ๋‹ค.)

T P N F์˜ ์˜๋ฏธ๋ฅผ ๊ฐ๊ฐ ์‰ฝ๊ฒŒ ์•Œ์•„๋ณด์ž.

  • T/F (True, False): ๊ฒฐ๊ณผ์˜ ๋งž๊ณ , ํ‹€๋ฆผ์„ ๊ฒฐ์ •
    • T : ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋งž์Œ
    • F : ๊ฒฐ๊ณผ์ ์œผ๋กœ ํ‹€๋ฆผ
  • P/N (Postive Negative): ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ๊ฐ’
    • P : ์˜ˆ์ธก๊ธฐ(๋ชจ๋ธ)๊ฐ€ ๋งž๋‹ค๊ณ  ํ•จ
    • N : ์˜ˆ์ธก๊ธฐ(๋ชจ๋ธ)๊ฐ€ ์•„๋‹ˆ๋ผ๊ณ  ํ•จ

์ž ๊ทธ๋Ÿผ ํ˜ผ๋™ํ–‰๋ ฌ์„ ๋ณธ๊ฒฉ์ ์œผ๋กœ ์‚ดํŽด๋ณด๋„๋ก ํ•œ๋‹ค.

  • ํ˜ผ๋™ํ–‰๋ ฌ

๋Œ€์ถฉ ์•Œ๊ฒ ๋Š”๊ฐ€?

  • TP : T(๊ฒฐ๊ณผ์ ์œผ๋กœ ๋งž์Œ), P(์˜ˆ์ธก๊ธฐ(๋ชจ๋ธ)๊ฐ€ ๋งž๋‹ค๊ณ  ํ•จ) ์ด๋Ÿฐ์‹์œผ๋กœ ๋‚˜๋‰˜๊ฒŒ ๋œ๋‹ค.
  • ์™ผ์ชฝ ๊ทธ๋ฆผ์€ ์ฐธ๊ณ ์ ์œผ๋กœ ๋ณด๋ฉด ๋˜๋Š”๋ฐ,
    actual class๋Š” ์‹ค์ œ ์ •๋‹ต์˜ ์˜์—ญ์„ ๋‚˜ํƒ€๋‚ด๊ณ  predicted class๋Š” ์˜ˆ์ธก๊ธฐ๊ฐ€ ์ •๋‹ต์œผ๋กœ ๊ฒ€์ถœํ•œ ์˜์—ญ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค.

์ž˜ ์ดํ•ด๊ฐ€ ์•ˆ๋œ๋‹ค๋ฉด ์˜ˆ์‹œ๋ฅผ ํ†ตํ•ด ์•Œ์•„๋ณด์ž.

ํ˜ผ๋™ํ–‰๋ ฌ ์˜ˆ์‹œ

์˜ˆ์‹œ ) ํ•ฉ๊ฒฉ๊ณผ ๋ถˆํ•ฉ๊ฒฉ์œผ๋กœ ์ด์ง„๋ถ„๋ฅ˜๋ฅผ ํ•˜๋Š” ์˜ˆ์ธก๊ธฐ(๋ชจ๋ธ)๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.

  • ์‹ค์ œ๋กœ ํ•ฉ๊ฒฉ์ธ๋ฐ, ๋ถˆํ•ฉ๊ฒฉ์„ ์คฌ๋‹ค โ†’ ํ‹€๋ ธ์Œ(F), ์˜ˆ์ธก๊ธฐ๊ฐ€ ๋ถˆํ•ฉ๊ฒฉ์„ ์คŒ(N) โ†’ (FN)
  • ์‹ค์ œ๋กœ ๋ถˆํ•ฉ๊ฒฉ์ธ๋ฐ ํ•ฉ๊ฒฉ์„ ์คฌ๋‹ค โ†’ ํ‹€๋ ธ์Œ(F), ์˜ˆ์ธก๊ธฐ๊ฐ€ ํ•ฉ๊ฒฉ์„ ์คŒ(P) โ†’ (FP)
  • ์‹ค์ œ๋กœ ํ•ฉ๊ฒฉ์ธ๋ฐ ํ•ฉ๊ฒฉ์œผ๋กœ ์คฌ๋‹ค โ†’ ๋งž์•˜์Œ(T), ์˜ˆ์ธก๊ธฐ๊ฐ€ ํ•ฉ๊ฒฉ์„ ์คŒ(P) โ†’ (TP)
  • ์‹ค์ œ๋กœ ๋ถˆํ•ฉ๊ฒฉ์ธ๋ฐ ๋ถˆํ•ฉ๊ฒฉ์œผ๋กœ ์คฌ๋‹ค โ†’ ๋งž์•˜์Œ(T), ์˜ˆ์ธก๊ธฐ๊ฐ€ ๋ถˆํ•ฉ๊ฒฉ์„ ์คŒ(N) โ†’ (TN)

โ‰ ์ฐธ ๊ธ์ •๋ฅ ๊ณผ ๊ฑฐ์ง“ ๊ธ์ •๋ฅ  (๊ฒ€์ถœ)

์ฐธ๊ธ์ •๋ฅ ๊ณผ ๊ฑฐ์ง“ ๊ธ์ •๋ฅ ์€ ์ฃผ๋กœ ๊ฒ€์ถœ์—์„œ์˜ ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉ๋œ๋‹ค. ์ด๋“ค์€ ๋ชจ๋‘ ํ˜ผ๋™ํ–‰๋ ฌ์„ ํ†ตํ•ด ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ํ‰๊ฐ€ ์ง€ํ‘œ์ด๋‹ค.

  • ํ˜ผ๋™ํ–‰๋ ฌ

์ž, ์ฐธ ๊ธ์ •๋ฅ ๊ณผ ๊ฑฐ์ง“ ๊ธ์ •๋ฅ ์„ ์•Œ๊ธฐ์œ„ํ•ด, ์ตœ๊ทผ ์ฝ”๋กœ๋‚˜ ์‚ฌํƒœ๋ฅผ ํ†ตํ•ด ์ดํ•ดํ•ด๋ณด์ž.

์‹ค์ œ๋กœ ์ฝ”๋กœ๋‚˜๊ฐ€ ์ „ ์„ธ๊ณ„์ ์œผ๋กœ ํ™•์‚ฐ๋˜๋ฉฐ ์ด๋Ÿฌํ•œ ๊ฒ€์ถœ์—์„œ์˜ ํ‰๊ฐ€ ์ง€ํ‘œ์ธ ์ฐธ๊ธ์ •๋ฅ ๊ณผ ๊ฑฐ์ง“ ๊ธ์ •๋ฅ ์ด ์ •ํ™•๋„ ๋ถ„์„์˜ ์ง€ํ‘œ๋กœ ๋งŽ์ด ์‚ฌ์šฉ๋˜์—ˆ๋‹ค.

โญ• ์ฐธ ๊ธ์ •๋ฅ (TPR) = ๋ฏผ๊ฐ๋„

์ฐธ ๊ธ์ •๋ฅ ์€ "์‹ค์ œ YES(True)์ธ ๊ฐ’๋“ค ์ค‘์—์„œ ์˜ˆ์ธกํ•œ YES(True)๋Š” ์–ผ๋งŒํผ์ธ๊ฐ€"๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค.

Q. PCR ๊ฒ€์‚ฌ๋ฅผ ์‹ค์‹œํ–ˆ๋‹ค. ์‹ค์ œ ์ฝ”๋กœ๋‚˜์— ๊ฑธ๋ฆฐ ํ™˜์ž๋“ค ์ค‘ ์–ผ๋งˆ๋‚˜ ์ฝ”๋กœ๋‚˜ ํ™˜์ž๋กœ ๊ฒ€์ถœํ–ˆ๋Š”๊ฐ€? (์ฐธ ๊ธ์ •๋ฅ )

์ด๋ฅผ ํ˜ผ๋™ํ–‰๋ ฌ์„ ํ™œ์šฉํ•ด์„œ ๋‚˜ํƒ€๋‚ด๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผ ํ•˜๋Š”์ง€ ๊ฐ์ด์˜ค๋Š”๊ฐ€? ๋ฐ”๋กœ ์‚ดํŽด๋ณด์ž.

๋ถ„๋ชจ๋Š” ์‹ค์ œ ์ฝ”๋กœ๋‚˜ ํ™˜์ž๋“ค ์ „์ฒด์ด๋ฏ€๋กœ, ์‹ค์ œ ๊ฐ์—ผ์ด๋œ YES. n11n_{11} ๊ณผ n12n_{12}๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค.
(์ฝ”๋กœ๋‚˜๊ฐ€ ๊ฑธ๋ฆฐ ๊ฒƒ์ด true ์ฆ‰, YES์— ํ•ด๋‹น)

๋ถ„์ž๋Š” ์–ผ๋งˆ๋‚˜ ์ฝ”๋กœ๋‚˜ ํ™˜์ž๋กœ ๊ฒ€์ถœํ–ˆ๋Š”๊ฐ€ ์ด๋ฏ€๋กœ, ์‹ค์ œ ๊ฒฐ๊ณผ์™€ ๊ฒ€์ถœํ•œ ๊ฒฐ๊ณผ๊ฐ€ ์ผ์น˜ํ•˜๋Š” TP ์ฆ‰, n11n_{11}์ด ๋  ๊ฒƒ์ด๋‹ค.

  • ์ด๋ฅผ TPR(true positive rate)์ด๋ผ๊ณ  ํ•œ๋‹ค.
  • ์ฐธ ๊ธ์ •๋ฅ ์€ ๋‹ค๋ฅธ๋ง๋กœ ๋ฏผ๊ฐ๋„๋ผ๊ณ  ํ•œ๋‹ค.

โŒ ๊ฑฐ์ง“ ๊ธ์ •๋ฅ (FPR) = ํŠน์ด๋„

Q. PCR ๊ฒ€์‚ฌ๋ฅผ ์‹ค์‹œํ–ˆ๋‹ค. ์ฝ”๋กœ๋‚˜ ํ™˜์ž๊ฐ€ ์•„๋‹Œ ์‚ฌ๋žŒ๋“ค์„ ์–ผ๋งˆ๋‚˜ ์ฝ”๋กœ๋‚˜ ํ™˜์ž๋กœ ๊ฒ€์ถœํ–ˆ๋Š”๊ฐ€?

๋ฐ”๋กœ ๋‚˜ํƒ€๋‚ด ๋ณด๋„๋กํ•˜์ž.

์ฝ”๋กœ๋‚˜๊ฐ€ ์•„๋‹Œ ์‚ฌ๋žŒ๋“ค ์ฆ‰, ์‹ค์ œ NO์ธ FP, TN ๊ฐ€ ๋ถ„๋ชจ๊ฐ€ ๋œ๋‹ค. ( n21n_{21} ๊ณผ n22n_{22} )
๊ทธ๋ฆฌ๊ณ  ์ด๋“ค ์ค‘ ์ฝ”๋กœ๋‚˜๋กœ ๊ฒ€์ถœํ•œ FP( n21n_{21} )๊ฐ€ ๋ถ„์ž๊ฐ€ ๋œ๋‹ค.

  • ์ด๋ฅผ ๊ฑฐ์ง“ ๊ธ์ •๋ฅ  FPR(False positive rate)๋ผ๊ณ  ํ•œ๋‹ค.
  • ๊ฑฐ์ง“ ๊ธ์ •๋ฅ ์€ ๋‹ค๋ฅธ ๋ง๋กœ ํŠน์ด๋„๋ผ๊ณ  ํ•œ๋‹ค.

์ฐธ/๊ฑฐ์ง“ ๊ธ์ •๋ฅ ์˜ ์˜ˆ์‹œ

๐ŸŽฏ ๋ถ„๋ฅ˜์—์„œ์˜ ์ •ํ™•๋„

๋ถ„๋ฅ˜์—์„œ์˜ ๊ธฐ์ค€์€ ์ •ํ™•๋„ (accuracy)๋ฅผ ํ†ตํ•ด ๋‚˜ํƒ€๋‚ธ๋‹ค.
๋ถ„๋ชจ๋Š” ํ˜ผ๋™ํ–‰๋ ฌ์˜ ๊ฐ’ ์ „์ฒด์ด๊ณ , ๋ถ„์ž๋Š” T๊ฐ€ ๋ถ™์€ ๊ฐ’๋“ค(๋งž์ถ˜ ๊ฐ’๋“ค)์ด๋‹ค.

โœ” ์ •๋ฐ€๋„์™€ ์žฌํ˜„๋ฅ  (๊ฒ€์ƒ‰)

๊ฒ€์ƒ‰์—์„œ๋Š” ์•ฝ๊ฐ„ ๋‹ค๋ฅธ ํ‰๊ฐ€์ง€ํ‘œ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.

๐ŸŽฏ ์ •๋ฐ€๋„(Precision)

์ •๋ฐ€๋„ : ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์˜ˆ์ธกํ•œ ๊ฐ’๋“ค ์ค‘ ์‹ค์ œ ๊ฐ’์ด Positive

์–ด๋–ป๊ฒŒ ๋ ๊นŒ?
๋ชจ๋ธ์ด P๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๊ฒฝ์šฐ๋Š” โ–กP์™€ ๊ฐ™์€ ํ˜•์‹์œผ๋กœ ๋‚˜์˜จ๋‹ค.
๋”ฐ๋ผ์„œ n11n_{11}, n21n_{21}์ด ๋ถ„๋ชจ๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค.

๋ถ„์ž๋Š” ์‹ค์ œ positive์ด๋ฏ€๋กœ n11n_{11} ์ด ๋œ๋‹ค.
๋”ฐ๋ผ์„œ ๊ฒ€์ƒ‰์—์„œ์˜ ์ •๋ฐ€๋„๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

  • ์ •๋ฐ€๋„

๐Ÿ“Š ์žฌํ˜„๋ฅ (Recall)

์‹ค์ œ positive์ค‘์— ๋งž์ถ˜ positive๋Š” ์–ผ๋งˆ๋‚˜ ๋˜๋Š”๊ฐ€?

  • ๐ŸŽˆ ์ฐธ๊ธ์ •๋ฅ  = ๋ฏผ๊ฐ๋„ = ์žฌํ˜„๋ฅ  ๋ชจ๋‘ ๋˜‘๊ฐ™์€ ๊ฐ’์ด๋‹ค.
    ์–ด๋–ค ์ƒํ™ฉ(๊ฒ€์ถœ, ๊ฒ€์ƒ‰)์ด ๊ธฐ์ค€์ธ๊ฐ€์— ๋”ฐ๋ผ์„œ ๊ทธ์ € ์ด๋ฆ„์ด ๋‹ฌ๋ผ์งˆ ๋ฟ์ด๋‹ค.

์ •๋ฐ€๋„์™€ ์žฌํ˜„๋ฅ ์˜ ๊ด€๊ณ„ (trade off)

๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ŠคํŒธ์„ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ชจ๋ธ์ด ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜์ž.

์ŠคํŒธ์ด(positive), ์ŠคํŒธ์ด ์•„๋‹Œ ๋ฉ”์ผ์ด(negative)์ด๋‹ค.

์ž„๊ณ„๊ฐ’์ด ์˜ฌ๋ผ๊ฐ„๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ๋ ๊นŒ?

๊ฒฐ๊ณผ

  • ์ •๋ฐ€๋„(Precesion) - ์ฆ๊ฐ€
    ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๋ฒ”์œ„๊ฐ€ ๋”์šฑ tightํ•˜๊ฒŒ ์ค„์–ด๋“ค ๊ฒƒ์ด๋ฏ€๋กœ, ๊ฒฐ๊ณผ์ ์œผ๋กœ ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฐ’(TP, FP)๊ฐ€ ์ค„์–ด๋“ ๋‹ค. ์ด๋Š” ์ •๋ฐ€๋„์˜ ๋ถ„๋ชจ๊ฐ€ ๊ฐ์†Œํ•˜๋Š” ๊ฒฐ๊ณผ์ด๋ฏ€๋กœ ์ •๋ฐ€๋„๋Š” ์ฆ๊ฐ€ํ•œ๋‹ค.
    • ์—„๋ฐ€ํžˆ ๋งํ•ด ๋ถ„์ž(TP)๋˜ํ•œ ์ค„์–ด๋“œ๋Š” ๊ฒƒ์ด์ง€๋งŒ, ๋ถ„๋ชจ๋Š” (TP, FP) 2๊ฐœ๊ฐ€ ์ค„์–ด๋“œ๋Š” ๊ผด์ด๋‹ค
  • ์žฌํ˜„๋ฅ (Precesion)- ๊ฐ์†Œ
    ์ด์— ๋ฐ˜ํ•ด ์žฌํ˜„๋ฅ ์€ "์–ผ๋งˆ๋‚˜ ์ž˜ ์žฌํ˜„์„ ํ•˜์˜€๋Š”๊ฐ€" ๋ฅผ ๋œปํ•œ๋‹ค.
    Positive๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๋ฒ”์œ„๊ฐ€ tightํ•ด์กŒ์œผ๋ฏ€๋กœ, ๋ชจ๋ธ์ด Positive๋ผ๊ณ  ์ƒ๊ฐํ•˜๋Š” ๊ฐ’(TP)๊ฐ€ ์ค„์–ด๋“ ๋‹ค. ๋”ฐ๋ผ์„œ ๋ถ„์ž๊ฐ€ ๊ฐ์†Œํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™๋‹ค.
    • ์ •๋ฆฌํ•˜์ž๋ฉด ์‹ค์ œ Positive๋ฅผ ์–ผ๋งˆ๋‚˜ ์ฐพ์•˜๋Š”๊ฐ€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š”๋ฐ, ๋ชจ๋ธ์ด Positive๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฒ”์œ„ ์ž์ฒด๊ฐ€ ์ค„์–ด๋“ค์—ˆ์œผ๋ฏ€๋กœ ์žฌํ˜„๋ฅ ์€ ๊ฐ์†Œํ•œ๋‹ค.

์ž„๊ณ„๊ฐ’์ด ๊ฐ์†Œํ•œ๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ๋ ๊นŒ?

๊ฒฐ๊ณผ

  • ์ •๋ฐ€๋„(Precesion) - ๊ฐ์†Œ
    ์ด ๊ฒฝ์šฐ ์ •๋ฐ€๋„๋Š” ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•˜๋Š” positive์˜ ๋ฒ”์œ„๊ฐ€ ๋„“์–ด์กŒ์œผ๋ฏ€๋กœ ์ฆ‰, ๋งŽ์€ positive๋ฅผ ๊ฒ€์ถœํ•˜๋ฏ€๋กœ ๋ถ„๋ชจ๊ฐ€ ์ปค์ง€๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋‚˜ํƒ€๋‚ด๊ณ  ๋”ฐ๋ผ์„œ ์ •๋ฐ€๋„๋Š” ๊ฐ์†Œํ•œ๋‹ค.

  • ์žฌํ˜„๋ฅ (Precesion)- ์ฆ๊ฐ€
    ์žฌํ˜„๋ฅ ์€ ๊ทธ๋งŒํผ ๋ชจ๋ธ์ด ๋„“์€ ๋ฒ”์œ„์˜ positiveํ•œ ์˜ˆ์ธก์„ ํ•˜๋ฏ€๋กœ ์‹ค์ œ positive๊ฐ’์„ positive๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ์ผ€์ด์Šค๊ฐ€ ๋งŽ์•„์ง„๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋Š” ์ฆ‰, ๋ถ„์ž์—์„œ์˜ n11n_{11}์˜ ๊ฐ’์ด ์ปค์ง€๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•˜๋ฏ€๋กœ ์žฌํ˜„์œจ์€ ์ฆ๊ฐ€ํ•œ๋‹ค.

  • ์ •๋ฐ€๋„์™€ ์žฌํ˜„๋ฅ ์˜ trade-off ๊ด€๊ณ„

๐Ÿ F1 Score

๊ฒ€์ƒ‰์—์„œ์˜ ์ •๋ฐ€๋„(precision)์™€ ์žฌํ˜„์œจ(recall)์„ ํ†ตํ•ด์„œ ์กฐํ™”ํ‰๊ท ์„ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค.
์ด๋ฅผ F1 Score๋ผ ๋ถ€๋ฅธ๋‹ค.

๐Ÿ’  ROC curves์™€ Precision-Recall curves

threshold(์ž„๊ณ„๊ฐ’)์˜ ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š๊ณ , ๋ชจ๋ธ์˜ ๋ถ„๋ฅ˜ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•.

ROC curves & ACU

  • ์ƒ˜ํ”Œ์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋น„์Šทํ•œ ๊ฒฝ์šฐ ์‚ฌ์šฉํ•œ๋‹ค.
  • Roc curves์•„๋ž˜ ์žˆ๋Š” ๋ฉด์ ์„ AUC๋ผ๊ณ  ํ•œ๋‹ค.
  • ์ด ๊ฐ’์ด ํด์ˆ˜๋ก ๋ชจ๋ธ์ด ์ž˜ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.
  • TPR(์ฐธ๊ธ์ •๋ฅ )๊ฐ€ Y์ถ• FPR(๊ฑฐ์ง“ ๊ธ์ •๋ฅ )๊ฐ€ X์ถ•์œผ๋กœ ์ด๋ฃจ์–ด์ง„๋‹ค.

Precision-Recall curve & AP

  • ์ƒ˜ํ”Œ์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋‹ค๋ฅธ ๊ฒฝ์šฐ ์‚ฌ์šฉํ•œ๋‹ค.
  • Precision-Recall curve์˜ ์•„๋ž˜ ์žˆ๋Š” ๋ฉด์ ์„ AP๋ผ๊ณ  ํ•จ.
  • ์ด ๊ฐ’์ด ํด์ˆ˜๋ก ๋ชจ๋ธ์ด ์ž˜ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค.
  • ์ •๋ฐ€๋„๊ฐ€ Y์ถ• ์žฌํ˜„๋ฅ ์ด X์ถ•์„ ๋‚˜ํƒ€๋‚ธ๋‹ค.

์ฐธ๊ณ  ์ง€ํ‘œ - IOU(Intersection over Union)

profile
๋ถ‰์€ ๋ฐฐ ์˜ค์ƒ‰ ๋”ฑ๋‹ค๊ตฌ๋ฆฌ ๊ฐœ๋ฐœ์ž ๐ŸฆƒCloud & DevOps

0๊ฐœ์˜ ๋Œ“๊ธ€