7์ฃผ์ฐจ ์์์ผ
- Object detection
- Two-stage detector
- One-stage detector
classification๊ณผ Box localization์ ๋์์ ์ํํ๋ ์์ ์ผ๋ก, ์ด๋ฏธ์ง ๋ด์์ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ฐพ๊ณ (์์น ์ ๋ณด), ๊ทธ ์์ ์ด๋ค ๋ฌผ์ฒด๊ฐ ์๋์ง ๋ถ๋ฅํ๋ค(์นดํ ๊ณ ๋ฆฌ ์ ๋ณด). ์์จ์ฃผํ์ด๋ OCR(Optical Character Recognition) ๋ฑ์ ํ์ํ ๊ธฐ์ ์ด๋ค.
๊ธฐ์กด์ object detection ๋ฐฉ์์ ์์ ๋ด์ ๊ฒฝ๊ณ์ (gradient)์ ์ฐพ์๋ด์ด ๊ด์ฌ ๋ฌผ์ฒด์ธ์ง ํ์ ํ๋ Gradient-based detector, ์์ด๋ gradient์ ๋ถํฌ๊ฐ ๋น์ทํ ์์ญ์ ๋ฌถ์ด์ ๋ฐ์ด๋ฉ ๋ฐ์ค(๋ฌผ์ฒด์ ํ๋ณด๊ตฐ)์ ์ ์ํ๋ Selective search ๋ฑ ์ฌ๋์ ์ง๊ด์ ํตํด ์ค๊ณ๋ ์๊ณ ๋ฆฌ์ฆ์ด์๋ค.
selective search ๋ฑ์ ์ด์ฉํด ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ถ์ถํ๋ ์์ ์ region proposal์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. two-stage detector ๋ชจ๋ธ์ region proposal์ ํตํด ์ถ์ถํ ๊ด์ฌ ์์ญ(Region Of Interest) ์ ๋ณด๋ฅผ ์ฌ์ฉํ๋ค. ROI๋ฅผ ์ถ์ถํ๋ ๊ณผ์ ์ ๊ฑฐ์ณ์ผ ํ๊ธฐ ๋๋ฌธ์ ์๋๊ฐ ๋๋ฆฌ๋ค.
R-CNN
์ด๊ธฐ ๋ฅ ๋ฌ๋ object detection ์๊ณ ๋ฆฌ์ฆ์ธ R-CNN์์๋ ์ถ์ถํ ๋ฐ์ด๋ฉ ๋ฐ์ค๊ฐ CNN์ ์
๋ ฅ์ผ๋ก ์ ์ ํ ํฌ๊ธฐ๊ฐ ๋๋๋ก wrapingํ ๋ค์, fine tuning์ ๊ฑฐ์น ์ฌ์ ํ๋ จ๋ CNN ๋ชจ๋ธ์ ์
๋ ฅํด ์นดํ
๊ณ ๋ฆฌ๋ฅผ ํ๋ณํ๋ ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค. ์ถ์ถ๋ ๋ชจ๋ ๋ฐ์ด๋ฉ ๋ฐ์ค์ ๋ํด ์์
์ ์ํํ๋ฏ๋ก ์๊ฐ์ด ๋๋ฆฌ๊ณ ํ์ต์ ํตํ ์ฑ๋ฅ ํฅ์์ ํ๊ณ๊ฐ ์๋ค๋ ๋จ์ ์ด ์๋ค.
Fast R-CNN
R-CNN์ ์๋๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํ ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, CNN์ ๊ฒฐ๊ณผ๋ก ์ป์ ํน์ฑ ๋งต์ ์ฌํ์ฉํ๋ ๋ฐฉ์์ ์ฌ์ฉํ๋ค. ๋จผ์ CNN ๋ ์ด์ด๋ฅผ ํตํด ํน์ฑ ๋งต์ ์ป๋๋ค. ๊ทธ๋ฆฌ๊ณ selective search ๋ฑ์ ํตํด ๋ฐ์ด๋ฉ ๋ฐ์ค๋ค์ ์ถ์ถํ๋ค. ๋ฐ์ด๋ฉ ๋ฐ์ค ์ค ROI์ ํด๋นํ๋ ๊ฒ์ ์๊น ๊ตฌํ ์ ์ฒด ์ด๋ฏธ์ง์ ํน์ฑ ๋งต์ ํฌ์ํ๋ฉด ROI์ ๋ํ ํน์ฑ ๋งต์ ์ป์ ์ ์๋ค. ์ดํ์ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ๋ ์์ธํ ์ถ์ ํ๊ธฐ ์ํ regressor์ ROI์ ์นดํ
๊ณ ๋ฆฌ ๋ถ๋ฅ๋ฅผ ์ํ classifier๋ฅผ ํต๊ณผํ๊ฒ ๋๋ค. ํน์ฑ ๋งต์ ์ฌํ์ฉํ์ฌ ์๋๊ฐ ํฅ์๋์์ง๋ง ์ฌ์ ํ ์ฌ๋์ ์ง๊ด์ ์ํด ์ค๊ณ๋ selective search ์๊ณ ๋ฆฌ์ฆ์ ์์งํ๋ค. ์ฌ๋์ ์ํ ์ฌ์ ์์
์ด ํ์ํ๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ๋ง ๊ฐ์ง๊ณ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๊ธฐ์๋ ํ๊ณ๊ฐ ์๋ค.
Faster R-CNN
Fast R-CNN์ ๋จ์ ์ ๊ฐ์ ํ๊ธฐ ์ํด ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ถ์ถํ๋ ์์
์ธ region proposal์ neural network ๊ธฐ๋ฐ์ผ๋ก ๋์ฒดํ์ฌ ๋ชจ๋ ๋ถ๋ถ์ด neural network ๊ธฐ๋ฐ์ธ ์ต์ด์ object detection ์๊ณ ๋ฆฌ์ฆ์ด๋ค.
๐IoU(Intersection over Union)
object detection์ ํํ ์ฐ์ด๋ ์ฒ๋๋ก, Area of Overlap / Area of Union
์ผ๋ก ๊ณ์ฐํ๋ค.
region proposal์ ํตํด ROI๋ฅผ ์ฐพ๋ ๊ณผ์ ์ ๊ฑฐ์น์ง ์๊ณ ๋ฐ๋ก regression์ ํตํด ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ฐพ๋๋ค. ์ฐพ์๋ธ ๋ฐ์ด๋ฉ ๋ฐ์ค ์์ญ์ ๋ํด ๋ด์ฉ๋ฌผ์ ๋ถ๋ฅํ๋ classification๊ณผ ๋ฐ์ค ์์ญ์ ๋ ์ ํํ๊ฒ ๋ง๋๋ refinement๋ฅผ ์ํํ๋ค. region proposal ๋จ๊ณ๋ฅผ ์๋ตํ๊ธฐ ๋๋ฌธ์ ์๋๊ฐ ๋น ๋ฅด๊ณ , ์ค์๊ฐ ์์์๋ ์ ์ฉ ๊ฐ๋ฅํ๋ค.
YOLO(you only look once)
์
๋ ฅ๋๋ ์ด๋ฏธ์ง๋ฅผ ์ผ์ ๊ฐ๊ฒฉ์ ๊ทธ๋ฆฌ๋๋ก ๋๋ ๋ฐ์ด๋ฉ ๋ฐ์ค์ ๊ฐ ๋ฐ์ค์ confidence ์ ์๋ฅผ ๊ตฌํ๋ค.
SSD(single shot multibox detector)
์ด๋ ค์...