시각적 영상을 분석하는데 사용되는 다층의 피드-포워드 인공신경망의 한 종류.
딥러닝에서 심층 신경망으로 분류되며, 시각적 영상 분석에 주로 적용
영상 및 동엿아 인식, 추천시스템, 영상 분류, 의료 영상 분석 및 자연어 처리에 응용
참고
주어진 이미지에서 물체가 있을 법한 위치를 찾는 것
object라고 판단되는 곳에 직사각형을 그려주는 것
그렇다면 여기서 Region proposal과 localization의 차이는 무엇??
내 생각에는 localization 은 CV에서 물체라고 판단되는 곳에 직사각형을 그려주는데
region proposal은 딥러닝 faster RCNN 논문에서 제안을 하면서 신경망을 통해(network) 물체라고 판단되는 곳에 사각형을 출력해주는 것 같다.
즉, 두 역할은 비슷하나 성질이 다른 느낌?
분류를 위한 기준 선을 정의하는 모델
이미지 내에 있는 개체들을 의미있는 단위로 분할하는 작업
즉, 모든 픽셀의 레이블을 예측하는 dense prediction이라고도 불림
영상을 x축, y축, 회전, scale등을 이용해서 보정이나 찌그러진 이미지를 정규화하기 위한 처리방법
각 CNN 레이처 층에서 추출된 벡터로 SVM Classifier를 학습시켜서 얻은 mAP 비교한 것
깊은 신경망의 연산 및 메모리 접근 비용을 줄이기 위해 사용되는 유망한 네트워크 압축기법
pruning 기법은 크게 fine-grained pruning과 coarse-grained pruning으로 분류된다.
CNN에서 합성곱 계층의 입출력 데이터를 의미한다.
위 그림과 같이 prepresentive capacity를 결정하는 것
합성곱 연산을 수행하기 전, 입력데이터 주변을 특정값으로 채워 늘리는 것을 말한다.
패딩은 주로 출력 데이터의 공간적 크기를 조절하기 위해 사용한다.
패딩을 할 때 채울 값은 hypter-parameter로 어떤 값을 채울지 결정할 수 있지만 주로 zero-padding을 사용한다.
패딩을 사용한 이유는 conv layer를 지날 때마다 데이터의 공간적 크기가 작아지게 되므로 가장 자리의 정보들이 사라지는 문제를 해결하기 위해서
입력데이터에 필터를 적용할 때 이동할 간격을 조절하는 것, 즉 필터가 이동할 간격을 말하는 것이다.
또한 출력 데이터의 크기를 조절하기 위해 사용한다.