컴퓨터 비전

·2023년 12월 25일

딥러닝 기초 이론

목록 보기
1/14

컴퓨터 비전

  • 기계가 시각적 데이터를 이해하고 처리하는 능력을 개발하는 연구 분야
  • 이는 사람이 볼 수 있는 이미지나 비디오, 또는 컴퓨터가 인식할 수 있는 다른 형태의 시각적 데이터를 사용한다

컴퓨터 비전의 역사

  • 최초의 동물이 시력이 생기면서 폭발적인 종분화 시작
    • 시력이 생김으로써 더 적극적인 활동
    • 진화적 군비 경쟁 시작
    • 빠르게 진화해야 했음
  • 카메라의 등장
    • 동물의 눈과 닮은 카메라 등장
  • 시각의 메커니즘 연구
    • 어떤 방법으로 이미지를 처리하는 지 연구

블록 월드(Block World)

  • 시각적 세계를 단순한 기하학적 모양으로 단순화한 가상 세계
  • 간단한 구성과 직관적인 시각화를 통해 다양한 연구를 수행할 수 있는 유용한 도구

David Marr - Primal sketch(60년대)

  • Input Image - Primal sketch - 2.5D Sketch - 3D Model Representation
  • Primal Sketch
    • 가장자리, 막대, 끝, 가상선, 곡선, 경계가 표현되는 곳
  • 2.5D Sketch
    • 표면, 깊이 정보, 레이어 또는 시각적 장면의 불연속 점을 종합
  • 3D Model
    • 표면 및 체적 프리미티브 등의 측면에서 계층적으로 구성된 3D Model
  • 시각적 정보를 어떻게 분해할 수 있는지 생각하는 매우 직관적인 방법

Generalized Cylinder & Pictorial Structure(70년대)

  • 모든 객체가 단순한 기하학적 기본 요소로 구성됨
  • 사람을 원기둥으로 단순화하여 표현
  • 주요 부위/관절을 표현하여 단순화

David Lowe(80년대)

  • 선과 모서리, 그리고 대부분 직선과 그 조합을 구성하여 물체 표현하려 함

Image Segementation

  • 이미지를 가져와 픽셀을 의미 있는 영역으로 그룹화하는 작업

Face Detection

  • AdaBoost 알고리즘을 사용하여 실시간 얼굴 감지

Shift 기능

  • 카메라 각도, 폐색, 시점, 조명 및 본질적인 변화로 인해 모든 종류의 변화가 있을 수 있기 때문에 어려움
  • David Lowe는 물체의 특징 중 일부는 다양한 변화에 조금 더 강인하고 불변하다는 점을 발견
  • 객체의 중요한 특징을 식별한 다음 특징을 일치시키는 작업이다
  • 유사한 객체를 찾는 것은 전체 객체를 패턴 일치시키는 것보다 쉽다

Spatial Pyrmaid Matching 알고리즘

  • 이미지의 특징을 이미지의 다른 부분을 가져와 서로 다른 해상도로 Feature Descriptor에 함께 넣은 다음 그 위에 벡터 머신 알고리즘을 지원한다

ImageNet

  • 22,000 개의 개체 및 장면 범주로 구성된 거의 1,500만 또는 4,000 만 개 이사의 이미지로 구성된 데이터 셋

Image Classification

  • 알고리즘이 이미지를 본 다음 고정된 범주 세트 중에서 선택하여 해당 이미지를 분류하도록 설정된다

Object Detection

  • 전체 이미지를 고양이, 개, 말 등으로 분류하는 대신 경계 상자를 그려 여기에 개가 있고, 고양이가 있음을 알려준다

Convolution Neural Networks(CNN)

  • 일부 기능을 계산하고 다음으로 일부 지역 불변성과 일부 풀링을 계산하고 여러 단계의 처리를 거친 다음 마지막으로 이 결과를 선형 SVN에 제공한다

출처 및 참조

https://youtu.be/vT1JzLTH4G4?si=oESliDTazJ_LAooq

profile
공부 기록

0개의 댓글