[DL] 딥러닝 용어 정리

JINJU·2021년 6월 28일
0

Convolutional neural network, CNN (합성곱)

시각적 영상을 분석하는데 사용되는 다층의 피드-포워드 인공신경망의 한 종류.
딥러닝에서 심층 신경망으로 분류되며, 시각적 영상 분석에 주로 적용
영상 및 동엿아 인식, 추천시스템, 영상 분류, 의료 영상 분석 및 자연어 처리에 응용
참고

Rigion proposal

주어진 이미지에서 물체가 있을 법한 위치를 찾는 것

Localization

object라고 판단되는 곳에 직사각형을 그려주는 것

그렇다면 여기서 Region proposal과 localization의 차이는 무엇??
내 생각에는 localization 은 CV에서 물체라고 판단되는 곳에 직사각형을 그려주는데
region proposal은 딥러닝 faster RCNN 논문에서 제안을 하면서 신경망을 통해(network) 물체라고 판단되는 곳에 사각형을 출력해주는 것 같다.
즉, 두 역할은 비슷하나 성질이 다른 느낌?

SVM (Support Vector Machine)

분류를 위한 기준 선을 정의하는 모델

Semantic segmentation

이미지 내에 있는 개체들을 의미있는 단위로 분할하는 작업
즉, 모든 픽셀의 레이블을 예측하는 dense prediction이라고도 불림

Warping

영상을 x축, y축, 회전, scale등을 이용해서 보정이나 찌그러진 이미지를 정규화하기 위한 처리방법

  • warped (일부로 resize하는 경우도 있음)

FT (Fine tune)

각 CNN 레이처 층에서 추출된 벡터로 SVM Classifier를 학습시켜서 얻은 mAP 비교한 것

Pruning

깊은 신경망의 연산 및 메모리 접근 비용을 줄이기 위해 사용되는 유망한 네트워크 압축기법
pruning 기법은 크게 fine-grained pruning과 coarse-grained pruning으로 분류된다.

Feature map (특징맵)

CNN에서 합성곱 계층의 입출력 데이터를 의미한다.

Filter


위 그림과 같이 prepresentive capacity를 결정하는 것

  • 필터를 3x3을 많이 사용하는 이유는 예전에는 데이터 양과 컴퓨터 성능이 좋지 않아 아키텍쳐(network)의 depth를 크게 가져가지 못하였다.
    그래서 필터가 전체 이미지를 다 보기 위해서는 처음부터 필터 사이즈를 크게 가져가야만 했다.
    그러나 오늘날에는 depth를 크게 가져갈 수 있는 환경이 구축되었고 필터 사이즈가 클 필요가 없기 때문에
    3x3 필터를 계속 사용함녀서 depth를 깊게 가져가자가 목표가 되었다.
  • depth를 깊게 가져가야하는 이유는 representative에서는 depth가 결정적이기 때문에 depth가 커야 high-level feature가 추출이 가능해지기 때문

Padding

합성곱 연산을 수행하기 전, 입력데이터 주변을 특정값으로 채워 늘리는 것을 말한다.
패딩은 주로 출력 데이터의 공간적 크기를 조절하기 위해 사용한다.
패딩을 할 때 채울 값은 hypter-parameter로 어떤 값을 채울지 결정할 수 있지만 주로 zero-padding을 사용한다.
패딩을 사용한 이유는 conv layer를 지날 때마다 데이터의 공간적 크기가 작아지게 되므로 가장 자리의 정보들이 사라지는 문제를 해결하기 위해서

Stride

입력데이터에 필터를 적용할 때 이동할 간격을 조절하는 것, 즉 필터가 이동할 간격을 말하는 것이다.
또한 출력 데이터의 크기를 조절하기 위해 사용한다.

filter 참고
padding, stride 참고

0개의 댓글