[Week3] Day13 CNN

이규호·2021년 2월 3일
0

부스트캠프 U Stage

목록 보기
13/30

📒 Convolution은 무엇인가?


어제의 내용과 겹치는 부분이 많아 많이 생략했다.
같은 내용을 세 번 들으니 더 이해가 잘 되는 것 같다.
두 번째 강의인 Moredern CNN은 다음주에 아예 새로 공부해야겠다.

📝 Convolution


  • Continuous convolution
  • Discrete convolution
  • 2D image convolution

  • 필터에 따라 이미지를 다양하게 표현할 수 있다.

📝 Stride & Padding


  • Stride : Step이라고 생각하면 될 듯 하다.
  • Padding : Boundary 정보도 계산하기 위해 입력을 특정 값으로 감싸준다.

📒 Computer Vision Applications


RNN을 이용해 이미지 속의 물체를 찾는 것에 대한 연구이다.
세상엔 똑똑한 사람이 정말 많은 것 같다.
대충 무슨 느낌인지는 이해했는데, 코드로 어떻게 옮길 수 있을지는 감이 잡히지 않는다.
PyTorch로 구현한 모델들을 찾아보면서 공부하는 과정이 필요할 것 같다.

📝 Semantic Segmentation


  • 이미지가 있을 때, 이미지의 pixel마다 분류를 하는 것
    👉 이미지의 모든 pixel이 무슨 label인지 분류하는 작업이다.

✏️ Fully Convolutional Network

  • dense layer을 없애는 것으로, parameter는 동일하다.
  • input image의 크기에 상관 없이 네트워크가 돌아간다. (출력 차원은 줄어든다)
  • Deconvoilution을 통해 output size를 늘려줄 수 있다.

📝 Detection


  • 이미지의 분류를 bounding box로 하는 것

✏️ R-CNN

  1. 이미지 안에서 region을 많이 뽑는다. (약 2000개)
  2. AlexNet을 사용해서 똑같은 크기로 맞춘다.
  3. SVMs를 사용해서 분류한다.
  • 각각의 region마다 convolution을 해야되기 때문에 시간이 굉장히 오래 걸린다.
  • RPN을 통해 region을 더 효과적으로 뽑을 수 있다.

✏️ YOLO

  • 이미지 한 장에서 바로 output이 나온다.
  • bounding box를 따로 뽑는 과정이 없기 때문에 속도가 빠르다.
  1. 이미지가 들어오면, S x S grid로 나눈다.
  2. 찾고 싶은 물체의 중앙이 gird에 들어오면, bounding box와 label을 예측한다.
  3. 실제로 그 box가 해당 class일 확률이 높으면 보여준다.

📒 강아지 종류 분리하기


강의를 보기만 했음. 주말에 진행후 수정 예정. 강아지 귀엽다.

profile
Beginner

0개의 댓글