edge: 물체의 경계면에서 색상이 달라지는 부분의 선
1차원의 연속 공간에서 미분
1차원의 디지털(이산) 공간에서 미분
계단 에지는 명암 차이가 급격히 변하는 곳이며, 램프 에지는 명암 차이가 서서히 변하는 곳입니다.
계단 에지는 1차 미분만 해도 계단 부분에서 봉우리(peak)가 나타나기 때문에, 에지 위치를 1차 미분하여 찾을 수 있습니다. 하지만 디지털 영상에서 대부분 나타나는 램프는 1차 미분을 한다면 두께가 있어 에지의 정확한 위치를 찾기가 어렵습니다. 따라서 2차 미분까지 하여 영교차가 나타나는 부분을 찾아 에지를 검출합니다.
영교차는 하나는 극댓값, 하나는 극솟값으로 하나 만나는 지점이 생기게 되는 것으로, 램프 에지라고 할 수 있습니다. 즉, -1, 0, 0, 1일 때, 사이에 있는 0 둘 중에 하나가 에지 → 두꺼운 에지를 찾을 때 효과적입니다. (예를 들어 차선을 2차 미분으로 구할 때 그 가운데 선이 영교차)
1차 미분은 2개의 마스크, 2차 미분은 3개의 마스크를 사용합니다. 따라서 계단과 램프에 따라 다르게 적용합니다. 예를 들어 차선 검출 같은 경우는 계단 에지이기 때문에 1차 미분을 써도 검출 가능하고, 2차 미분을 쓰면 차선의 (안이 비어있는)양쪽 선이 나옵니다.
| -1 | 1 |
| 1 | -2 | 1 |
Derivative of Gaussian filter
opencv 라이브러리에서 face-detection를 할 때, 가우시안 필터(도함수)의 어둡고 밝은 모양(x축, y축)을 이용하여 검출 → 필터가 공통으로 모여있는 곳을 모으면 얼굴이 검출 (hear-like filter 참고로 알아두기)
미분을 적용하기 전 가우시안으로 스무딩을 하는 과정은 중요합니다. 가우시안 스무딩은 두 가지 효과를 제공하는데, 첫 번째는 잡음 대처입니다. 미분은 잡음을 증폭시키기 때문에 스무딩은 매우 중요합니다. 특히 2차 미분은 미분을 두 번 수행하므로 잡음 증폭이 더욱 심하고, 잡음의 값뿐 아니라 폭도 넓어집니다.
두 번째 이유는 가우시안의 매개변수 σ를 조절해 다중 스케일 효과를 얻는 데 있습니다. σ를 크게 하면 영상 디테일이 사라져 큰 물체의 에지만 추출되고 반대로 작게 하면 물체의 디테일에 해당하는 에지까지 검출할 수 있습니다.