컴퓨터비전 5-1 정리

해담·2024년 10월 17일

컴퓨터비전

목록 보기
6/13

에지 검출

edge: 물체의 경계면에서 색상이 달라지는 부분의 선

에지 검출의 기초

  • 물체의 형태, 컬러, 글자 정보 등을 알 수 있기 때문에 물체의 의미론적 정보를 얻을 수 있음
  • 물체의 형태, 그림자의 정보, depth의 정보를 알 수 있단 측면에서 기하학적 정보도 얻을 수 있음
  • 그러나 조명 환경에 매우 예민하여 잘 검출되지 않을 수도 있음 (ex. 차선 검출 알고리즘)

디지털 영상의 미분

  • 1차원의 연속 공간에서 미분
    s(x)=dsdx=limΔx>0s(x+Δx)s(x)Δxs'(x) = {ds\over dx} = \displaystyle\lim_{Δx-> 0}{s(x+Δx)-s(x)\overΔx}

  • 1차원의 디지털(이산) 공간에서 미분
    f(x)=dfdx=f(x+Δx)f(x)Δx=f(x+1)f(x)f'(x) = {df\over dx} = {f(x+Δx)-f(x)\overΔx} = f(x+1)-f(x)

에지 모델과 연산자

계단 에지는 명암 차이가 급격히 변하는 곳이며, 램프 에지는 명암 차이가 서서히 변하는 곳입니다.

계단 에지는 1차 미분만 해도 계단 부분에서 봉우리(peak)가 나타나기 때문에, 에지 위치를 1차 미분하여 찾을 수 있습니다. 하지만 디지털 영상에서 대부분 나타나는 램프는 1차 미분을 한다면 두께가 있어 에지의 정확한 위치를 찾기가 어렵습니다. 따라서 2차 미분까지 하여 영교차가 나타나는 부분을 찾아 에지를 검출합니다.

영교차는 하나는 극댓값, 하나는 극솟값으로 하나 만나는 지점이 생기게 되는 것으로, 램프 에지라고 할 수 있습니다. 즉, -1, 0, 0, 1일 때, 사이에 있는 0 둘 중에 하나가 에지 → 두꺼운 에지를 찾을 때 효과적입니다. (예를 들어 차선을 2차 미분으로 구할 때 그 가운데 선이 영교차)

1차 미분은 2개의 마스크, 2차 미분은 3개의 마스크를 사용합니다. 따라서 계단과 램프에 따라 다르게 적용합니다. 예를 들어 차선 검출 같은 경우는 계단 에지이기 때문에 1차 미분을 써도 검출 가능하고, 2차 미분을 쓰면 차선의 (안이 비어있는)양쪽 선이 나옵니다.

  • 1차 미분
    -1 1
  • 2차 미분
    1 -2 1

Derivative of Gaussian filter
opencv 라이브러리에서 face-detection를 할 때, 가우시안 필터(도함수)의 어둡고 밝은 모양(x축, y축)을 이용하여 검출 → 필터가 공통으로 모여있는 곳을 모으면 얼굴이 검출 (hear-like filter 참고로 알아두기)

에지 강도와 에지 방향

  • 로버츠 필터 (잘 사용하지 않음)
  • 프레윗 필터
  • 소벨 필터
    1. 소벨 필터를 컨볼루션(필터를 상하좌우로 뒤집어야 함)하여 각각 dxd_xdyd_y 구하기
    2. 구한 dxd_xdyd_y를 에지 강도 식과 그레디언트 방향 식에 넣어 계산
    3. 에지 방향은 그레디언트 방향에 수직이므로, +90도
    4. 필요하다면 에지 방향을 양자화하기

영교차 이론

가우시안과 다중 스케일 효과

미분을 적용하기 전 가우시안으로 스무딩을 하는 과정은 중요합니다. 가우시안 스무딩은 두 가지 효과를 제공하는데, 첫 번째는 잡음 대처입니다. 미분은 잡음을 증폭시키기 때문에 스무딩은 매우 중요합니다. 특히 2차 미분은 미분을 두 번 수행하므로 잡음 증폭이 더욱 심하고, 잡음의 값뿐 아니라 폭도 넓어집니다.
두 번째 이유는 가우시안의 매개변수 σ를 조절해 다중 스케일 효과를 얻는 데 있습니다. σ를 크게 하면 영상 디테일이 사라져 큰 물체의 에지만 추출되고 반대로 작게 하면 물체의 디테일에 해당하는 에지까지 검출할 수 있습니다.

최종 정리

  • 에지 검출 알고리즘
  • 에지의 강도와 방향을 나타내는 gradient
  • 소벨 예제 문제 풀어보기 (에지의 다른 마스크로도 풀어봐야 함)
profile
해담이를먹여살리기위한..

0개의 댓글