CNN - 2

CYSSSSSSSSS·2023년 9월 14일
0

CNN

목록 보기
2/8

Computer Vision

  • 컴퓨터가 이미지와 비디오에서 개체와 사람을 식별하고 파악할 수 있도록 지원하는 컴퓨터 과학 분야입니다
  • 컴퓨터가 이미지를 이해하는것
  • Rul Based Programming vs Machine Learning 방법을 사용할것인지

Pixel

  • computer 는 색깔을 숫자의 단위로 생각한다.
  • 화면을 구성하는 가장 기본 단위
  • 이미지 분석을 할때는 경계를 찾아야 하는데 일부분이 찾아지는것이 힘들가
  • 찾은 경계에는 노이즈가 존재한다.
  • 같은 object 도 각도 ,빛 , 움직임에 따라 이미지 데이터가 바뀐다.

Computer version 사례

Convolutional neural network

  • 데이터로부터 직접 학습하는 딥러닝의 신경망 아키텍처입니다. CNN은 영상에서 객체, 클래스, 범주 인식을 위한 패턴을 찾을 때 특히 유용합니다.

  • 조각을 본다

  • 각 조각이 조합된 패턴을 본다

  • 점점 더 복잡한 조합의 패턴을 본다.

  • 반응하는 여러 패턴의 조합을 가지고 이미지를 인식한다.

basic

  • mnist 를 하면서 Flatten 을 통해 1차원으로 쭉 늘어 놓는 방식을 많이 사용한다.
  • 그러나 이 방법은 이미지 내에 있는 위치 정보의 손실 이 발생한다.
  • Feature Map 을 만들어서 사용한다.
  • Feature Map 은 이미지의 형태를 다양하게 만들어 특징을 추출한다
  • Feature Map 은 높이 너비 채널이 있다.
  • Convolutional Layer 를 거쳐 만들어진 서로 다른 Feature 들의 모임이다.

ex)

  • 5X5 Pixel 이 있는 값으로 바꾼다.
  • Convolution Layer 를 filter sliding 을 사용해서 특징을 추출한다.
  • Random 변수와 곱하여 데이터를 추출하는 방식이다
  • 이렇게 전체 데이터를 convolution filter 를 탐색해서 만들어진 특징이 Feature map 이다
  • stride 옵션을 증가시키고 체크하는 영역을 줄이면 데이터가 수가 간결해진다.

padding

  • 상하좌우로 픽셀을 붙이는 방법이다.
  • 주로 출력 데이터의 크기를 조정할때 사용한다.
  • 외곽 정보를 더 반영하기 위해서 사용한다.

학습

  • Number of filter
  • filter size
  • padding
  • activation

polling 기법

maxpooling

  • 탐색하는 영역중에 가장 큰 데이터가 feature map 의 원소가 됨

avgpooling

  • 탐색하는 영역의 평균값이 feature map 의 원소가됨

output shape 계산

profile
개발자 되고 싶어요

0개의 댓글