์๊ฐ ๋๋ฅ ๋ฅ๋ฌ๋ ๋ด์ฉ ์ค ๊ฐ์ฅ ๊ธฐ์ต์ ๋จ๋ ๋ด์ฉ์ ๊ผฝ์ผ๋ผ๋ฉด ๋ค์์ ๋ฌธ๊ตฌ์ด๋ค.

Convolutional neural network(CNN ๋๋ ConvNet)๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ์ง์ ํ์ตํ๋ ๋ฅ๋ฌ๋์ ์ ๊ฒฝ๋ง ์ํคํ ์ฒ์ด๋ค.
CNN์ ์์์์ ๊ฐ์ฒด, ํด๋์ค, ๋ฒ์ฃผ ์ธ์์ ์ํ ํจํด์ ์ฐพ์ ๋ ํนํ ์ ์ฉํ๋ค. ๋ํ, ์ค๋์ค, ์๊ณ์ด ๋ฐ ์ ํธ ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฅํ๋ ๋ฐ๋ ๋งค์ฐ ํจ๊ณผ์ ์ด๋ค.

์ฌ์ค ์๋ ์๋ CNN์ ์์ฃผ์์ฃผ ์ ๋ง ์ด์ง ์ฐ๋จน์ ํ๋ ๋ฐ๋์ ๋๋ต์ ์ธ ๊ฐ๋ ๋ ํท๊ฐ๋ฆฌ๊ณ ์์๋๋ฐ ์ด๋ฒ ๊ธฐํ์ ๊ธฐ์ด ๊ฐ๋ ์ ์ดํดํ ์ ์์ด์ ๋์์ด ๋ง์ด ๋์๋ค.
CNN์ ์์ ๋ฐ ์๊ณ์ด ๋ฐ์ดํฐ์์ ์ฃผ์ ํน์ง์ ์ฐพ์๋ด๊ณ ํ์ตํ๊ธฐ ์ํ ์ต์ ์ ์ํคํ ์ฒ๋ฅผ ์ ๊ณตํ๋ค. CNN์ ๋ค์๊ณผ ๊ฐ์ ์์ฉ ๋ถ์ผ์์ ํต์ฌ ๊ธฐ์ ๋ก ์ฌ์ฉ๋๋ค.
์ค๋์ค ์ฒ๋ฆฌ: ๋ง์ดํฌ๊ฐ ์๋ ๋ชจ๋ ๊ธฐ๊ธฐ์์ ํค์๋ ๊ฒ์ถ์ ์ฌ์ฉํ์ฌ ํน์ ๋จ์ด๋ ๋ฌธ๊ตฌ("Hey Siri!")๊ฐ ๋ฐํ๋์์ ๋ ์ด๋ฅผ ๊ฒ์ถํ ์ ์๋ค. CNN์ ํค์๋๋ฅผ ์ ํํ๊ฒ ํ์ตํ์ฌ ์ด๋ค ํ๊ฒฝ์์๋ ๋ค๋ฅธ ๋ชจ๋ ๋ฌธ๊ตฌ๋ ๋ฌด์ํ๊ณ ํค์๋๋ฅผ ๊ฒ์ถํ ์ ์๋ค.
๊ฐ์ฒด ๊ฒ์ถ: ์์จ์ฃผํ์์๋ ํ์งํ์ด๋ ๋ค๋ฅธ ๊ฐ์ฒด์ ์กด์ฌ ์ฌ๋ถ๋ฅผ ์ ํํ๊ฒ ๊ฒ์ถํ๊ณ ์ถ๋ ฅ์ ๋ฐํ์ผ๋ก ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ๋ฐ CNN์ ์ฌ์ฉํ๋ค.
ํฉ์ฑ ๋ฐ์ดํฐ ์์ฑ: GAN(์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง)์ ์ฌ์ฉํ์ฌ ์ผ๊ตด ์ธ์ ๋ฐ ์์จ์ฃผํ์ ๋น๋กฏํ ๋ฅ๋ฌ๋ ์์ฉ ๋ถ์ผ์์ ์ฌ์ฉํ ์๋ก์ด ์์์ ์์ฑํ ์ ์๋ค.

You Only Look Once ์ ์ฝ์๋ก Object detection ๋ถ์ผ์์ ๋ง์ด ์๋ ค์ง ๋ชจ๋ธ์ด๋ค. ์ฒ์์ผ๋ก one-stage-detection ๋ฐฉ๋ฒ์ ๊ณ ์ํ์ฌ ์ค์๊ฐ์ผ๋ก Object Detection์ด ๊ฐ๋ฅํ๊ฒ ๋ง๋ค์๋ค.
R-CNN: ์ด๋ฏธ์ง๋ฅผ ์ฌ๋ฌ์ฅ์ผ๋ก ๋ถํ ํ๊ณ CNN ๋ชจ๋ธ์ ์ด์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ๋ถ์ํ๋ค. ๋ฐ๋ผ์ ์ด๋ฏธ์ง ํ์ฅ์ ๋ณด๋๋ผ๋ ์ฌ๋ฌ์ฅ์ ์ด๋ฏธ์ง๋ฅผ ๋ถ์ํ๋ ๊ฒ๊ณผ ๊ฐ์๋ค. ํ์ง๋ง YOLO๋ ์ด๋ฌํ ๊ณผ์ ์์ด ์ด๋ฏธ์ง๋ฅผ ํ ๋ฒ๋ง ๋ณด๋ ํน์ง์ ๊ฐ์ง๊ณ ์๋ค.
๊ธฐ์กด Object Detectin ๋ชจ๋ธ์ ์ ์ฒ๋ฆฌ๋ชจ๋ธ + ์ธ๊ณต์ ๊ฒฝ๋ง ์ ๊ฒฐํฉํ์ฌ ์ฌ์ฉํ๋ค. ํ์ง๋ง YOLO์์๋ ์๋ฅผ ํตํฉํ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค.
๊ธฐ์กด์ R-CNN๋ณด๋ค 6๋ฐฐ ๋น ๋ฅธ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค.
์ต์ detector ๋ ์ฃผ๋ก ๋ฐฑ๋ณธ๊ณผ ํค๋๋ผ๋ ๋ ๋ถ๋ถ์ผ๋ก ๊ตฌ์ฑ๋๋ค.

๋ฐฑ๋ณธ(Backbone)์ ์ ๋ ฅ์ด๋ฏธ์ง๋ฅผ feature map์ผ๋ก ๋ณํ์์ผ์ฃผ๋ ๋ถ๋ถ์ด๋ค.
ํค๋(Head)๋ Backbone์์ ์ถ์ถํ feature map์ location ์์ ์ ํด์ฃผ๋ ๋ถ๋ถ์ผ๋ก, predict classes ์ bounding boxes ์์ ์ด ์ํ๋๋ค. ํค๋๋ ํฌ๊ฒ Dense Prediction๊ณผ Sparse Prediction์ผ๋ก ๋๋์ด์ง๋ค.
Sparse Prediction์ ์ฌ์ฉํ๋ Two-Stage Detector: Predict Classes ์ Bounding Box Regression ๋ถ๋ฆฌ ex) R-CNN, R-FCN Dense Prediction์ ์ฌ์ฉํ๋ One-Stage Detector: Predict Classes ์ Bounding Box Regression ํตํฉ ex) YOLO, SSD
๋ฅ(Neck) ์ Backbone ๊ณผ Head๋ฅผ ์ฐ๊ฒฐํ๋ ๋ถ๋ถ์ผ๋ก, feature map์ ์ ์ ํ๊ณ ์ฌ๊ตฌ์ฑํ๋ค.
๐ ์ ์ฐจ
input(์ด๋ฏธ์ง) โ CNN โ FC(Fully Connected) โ PT(Prediction Tensor) ๋ฅผ ๋ฐ๋ณต