210720 EXPLORATION 3. 카메라 스티커앱

시에나 Sienna·2021년 12월 2일
0

AIFFEL

목록 보기
55/66
  • CV(Computer Vision)
    • 시각적 세계를 해석하고 이해하도록 컴퓨터를 학습시키는 인공 지능 분야
object detectionface landmark detection
유의미한 특정 객체를 감지하는 작업눈, 코, 입, 귀와 같은 얼굴 각각의 위치들을 찾아내는 기술

keypoint detection : 이미지에서 특징점을 검출하는 것

OpenCV

  • 컴퓨터 비전 라이브러리 ex)cv2.imread('이미지 파일', flag 값)
  • cv2.IMREAD_COLOR : 이미지 파일을 Color로 읽기(Default), 1
    • 투명한 부분은 무시됨
  • cv2.IMREAD_GRAYSCALE : 이미지를 Grayscale로 읽기, 0
  • cv2.IMREAD_UNCHANGED : 이미지파일을 alpha channel까지 포함하여 읽기, -1

얼굴 검출 face detection

dlib의 face detector는 HOG(Histogram of Oriented Gradients) feature를 사용해서 SVM(Support Vector Machine)의 sliding window로 얼굴을 찾는다

  • HOG(Histogram of Oriented Gradients) : 영상의 지역적 그래디언트 방향 정보를 히스토그램으로 표현해서 영상의 형태를 표현하는 방법

  • sliding window : 사진을 윈도 사이즈에 맞춰 나눈 다음 매 윈도우로 잘린 이미지를 입력값으로 모델을 통과해서 결과를 얻는 방법

  • cvtColor(): convert color

  • detector_hog : 이미지 upsampling방법을 통해 데이터의 크기를 키우는 것 ⇨ 이미지 피라미드

  • dlib detector : dlib.rectangles 타입의 객체를 반환

    • dlib.rectangles 는 dlib.rectangle 객체의 배열 형태
    • left(), top(), right(), bottom(), height(), width() 등의 멤버 함수를 포함
  • face landmark localization : 이목구비의 위치를 추론하는 것

  • object keypoint estimation : Face landmark와 같이 객체 내부의 점을 찾는 기술

    • top-down : bounding box를 찾고 box 내부의 keypoint를 예측
    • bottom-up : 이미지 전체의 keypoint를 먼저 찾고 point 관계를 이용해 군집화 해서 box 생성
  • Dlib landmark localization

0개의 댓글