Object Detection / Recognition / Localization

sun1ยท2026๋…„ 2์›” 14์ผ

https://www.ultralytics.com/ko/blog/a-guide-to-deep-dive-into-object-detection-in-2025#Ta6HDcB5

1๏ธโƒฃ Object Detection (๊ฐ์ฒด ํƒ์ง€)

๐Ÿ‘‰ โ€œ์–ด๋””์— ์žˆ๊ณ  + ๋ฌด์—‡์ธ์ง€โ€๋ฅผ ์ฐพ๋Š” ๊ฒƒ

  • ์ด๋ฏธ์ง€ ์•ˆ์—์„œ ๊ฐ์ฒด์˜ ์œ„์น˜(์ขŒํ‘œ, bounding box) ๋ฅผ ์ฐพ์Œ

  • ๋™์‹œ์— ๊ทธ ๊ฐ์ฒด๊ฐ€ ๋ฌด์—‡์ธ์ง€ ๋ถ„๋ฅ˜

  • ๊ฒฐ๊ณผ: ๋ฐ•์Šค + ํด๋ž˜์Šค ๋ผ๋ฒจ

  • ์˜ˆ์‹œ
    - ์‚ฌ์ง„ ์†์—์„œ ์‚ฌ๋žŒ 3๋ช…, ์ž๋™์ฐจ 2๋Œ€๋ฅผ ๊ฐ๊ฐ ๋ฐ•์Šค๋กœ ํ‘œ์‹œ
    - CCTV์—์„œ ์‚ฌ๋žŒ ์œ„์น˜ ์ถ”์ 
    - ์ž์œจ์ฃผํ–‰์—์„œ ๋ณดํ–‰์ž/์ฐจ๋Ÿ‰ ์œ„์น˜ ํŒŒ์•…

  • ๋Œ€ํ‘œ ๋ชจ๋ธ:
    - YOLO
    - Faster R-CNN
    - SSD

๐Ÿ“Œ ํ•ต์‹ฌ: Localization + Classification ๋‘˜ ๋‹ค ํ•จ

2๏ธโƒฃ Object Recognition (๊ฐ์ฒด ์ธ์‹)

๐Ÿ‘‰ โ€œ์ด๊ฒŒ ๋ญ๋ƒโ€๋งŒ ํŒ๋‹จํ•˜๋Š” ๊ฒƒ

  • ์ด๋ฏธ์ง€ ์ „์ฒด ๋˜๋Š” ์ž˜๋ผ์ง„ ๊ฐ์ฒด๊ฐ€ ๋ฌด์—‡์ธ์ง€ ๋ถ„๋ฅ˜

  • ์œ„์น˜๋Š” ๋ชจ๋ฆ„

  • ๊ฒฐ๊ณผ: ํด๋ž˜์Šค ์ด๋ฆ„๋งŒ ๋‚˜์˜ด

  • ์˜ˆ์‹œ
    - ์‚ฌ์ง„์ด "๊ณ ์–‘์ด ์‚ฌ์ง„"์ธ์ง€ ํŒ๋ณ„
    - ์ž˜๋ผ๋‚ธ ๋ฌผ์ฒด๊ฐ€ "์‚ฌ๊ณผ"์ธ์ง€ ํŒ๋ณ„

  • ๋Œ€ํ‘œ ๋ชจ๋ธ
    - ResNet
    - VGG

๐Ÿ“Œ ํ•ต์‹ฌ: Classification๋งŒ ํ•จ

3๏ธโƒฃ Object Localization (๊ฐ์ฒด ์œ„์น˜ ์ถ”์ •)

๐Ÿ‘‰ โ€œ์ด ์ด๋ฏธ์ง€ ์•ˆ์— ์žˆ๋Š” ํ•˜๋‚˜์˜ ๊ฐ์ฒด๊ฐ€ ์–ด๋”” ์žˆ๋Š”์ง€โ€ ์ฐพ๋Š” ๊ฒƒ

  • ์ „์ œ: ์ด๋ฏธ์ง€์— ๊ฐ์ฒด๊ฐ€ 1๊ฐœ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •

  • ํ•˜๋Š” ์ผ:
    - ๊ทธ ๊ฐ์ฒด๊ฐ€ ๋ฌด์—‡์ธ์ง€ ๋ถ„๋ฅ˜
    - ๊ทธ ๊ฐ์ฒด์˜ ์œ„์น˜(bounding box) ์˜ˆ์ธก

  • ์ถœ๋ ฅ:
    - ํด๋ž˜์Šค ๋ผ๋ฒจ

    • ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค ์ขŒํ‘œ(๋ณดํ†ต ์ •๊ทœํ™”๋œ ๊ฐ’์œผ๋กœ ์˜ˆ์ธก)
  • ์˜ˆ์‹œ:
    - ๊ณ ์–‘์ด ํ•œ ๋งˆ๋ฆฌ๊ฐ€ ์žˆ๋Š” ์‚ฌ์ง„์—์„œ ๊ณ ์–‘์ด๋ฅผ ๊ฐ์‹ธ๋Š” ๋ฐ•์Šค ์ƒ์„ฑ

    • ์ œํ’ˆ ์‚ฌ์ง„์—์„œ ์ค‘์‹ฌ ๋ฌผ์ฒด ์œ„์น˜๋งŒ ์ฐพ๋Š” ๊ฒฝ์šฐ
    • ์˜๋ฃŒ ์˜์ƒ์—์„œ ํ•˜๋‚˜์˜ ์ข…์–‘ ์œ„์น˜ ์˜ˆ์ธก

๐Ÿ“Œ ํ•ต์‹ฌ: Classification + Bounding Box (๋‹จ, ๊ฐ์ฒด๋Š” 1๊ฐœ)
โ†’ Detection์˜ "๋‹จ์ผ ๊ฐ์ฒด ๋ฒ„์ „"์ด๋ผ๊ณ  ๋ณด๋ฉด ์ดํ•ด ์‰ฌ์›€

๐Ÿ”ฅ ํ•œ ์ค„ ์ •๋ฆฌ

Detection

  • ์œ„์น˜ ์ฐพ์Œ: โœ…
  • ๋ถ„๋ฅ˜ํ•จ: โœ…
  • ๊ฒฐ๊ณผ: ํด๋ž˜์Šค + ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค

Recognition

  • ์œ„์น˜ ์ฐพ์Œ: โŒ
  • ๋ถ„๋ฅ˜ํ•จ: โœ…
  • ๊ฒฐ๊ณผ: ํด๋ž˜์Šค

Localization

  • ์œ„์น˜ ์ฐพ์Œ: โœ…
  • ๋ถ„๋ฅ˜ํ•จ: โœ…
  • ๊ฒฐ๊ณผ: ํด๋ž˜์Šค + ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค(๋‹จ, ๊ฐ์ฒด๋Š” 1๊ฐœ)

๐Ÿ’ก ์‰ฝ๊ฒŒ ๋น„์œ ํ•˜๋ฉด

Recognition

  • โ€œ์ด ์‚ฌ์ง„์€ ๊ฐœ์•ผโ€

Detection

  • โ€œ์—ฌ๊ธฐ(์ขŒํ‘œ)์— ๊ฐœ 2๋งˆ๋ฆฌ, ์ €๊ธฐ(์ขŒํ‘œ)์— ์‚ฌ๋žŒ 1๋ช… ์žˆ์–ดโ€

Localization

  • โ€œ์ด ์‚ฌ์ง„์— ์žˆ๋Š” ๊ฐœ๋Š” ์—ฌ๊ธฐ(์ด ๋ฐ•์Šค ์œ„์น˜)์— ์žˆ์–ดโ€
    โ†’ ๋‹จ, ๊ฐœ๋Š” 1๋งˆ๋ฆฌ๋ผ๊ณ  ๊ฐ€์ •

๐Ÿ”Ž Detection๊ณผ์˜ ๊ด€๊ณ„ ์ •๋ฆฌ

  • Localization์€ ๊ฐ์ฒด๊ฐ€ 1๊ฐœ๋ผ๊ณ  ๊ฐ€์ •

  • Detection์€ ๊ฐ์ฒด๊ฐ€ ์—ฌ๋Ÿฌ ๊ฐœ ์กด์žฌ ๊ฐ€๋Šฅ

  • ๊ทธ๋ž˜์„œ Detection์ด Localization๋ณด๋‹ค ํ•œ ๋‹จ๊ณ„ ๋” ๋ณต์žกํ•จ (๊ฐ์ฒด ๊ฐœ์ˆ˜๊นŒ์ง€ ํ•จ๊ป˜ ์˜ˆ์ธกํ•ด์•ผ ํ•จ)

๐Ÿ’ก ๋ชจ๋ธ ๊ด€์ ์—์„œ ๋ณด๋ฉด

  • ๊ณผ๊ฑฐ์—๋Š” Classification ๋ชจ๋ธ(์˜ˆ: ResNet)์—
    Bounding Box ํšŒ๊ท€(regression) ํ—ค๋“œ๋ฅผ ์ถ”๊ฐ€ํ•ด์„œ
    Localization์„ ๊ตฌํ˜„ํ•˜๊ธฐ๋„ ํ–ˆ์Œ

  • ๋ฐ˜๋ฉด, YOLO ๊ฐ™์€ ๋ชจ๋ธ์€
    ์• ์ดˆ์— ๋‹ค์ค‘ ๊ฐ์ฒด Detection์„ ๋ชฉํ‘œ๋กœ ์„ค๊ณ„๋จ

๋‚ด๊ฐ€ ์ „์— YOLO ๋ชจ๋ธ ์‚ฌ์šฉํ–ˆ๋˜๊ฑด Object Detection ๋ชจ๋ธ์ž„.

profile
Frontend Developer๐Ÿ€

0๊ฐœ์˜ ๋Œ“๊ธ€