실습자료

Alex·2024년 4월 25일

영상처리

P1

Q1.
이미지를 흑백으로 변환하는 경우, R, G, B 각 채널을 동일한 비율로 평균하여 구하게 되나요?
아니라면, 어떠한 방식으로 이미지를 흑백으로 변환하는지 설명하세요.

A1. 이미지를 흑백으로 변환하는 경우, 각 채널 별로 다른 비율을 주어 계산한다. (0.299 red + 0.587 green + 0.114 * blue)

Q2.
Video Frame Acquisition에서, 두 이미지 간의 차이를 구하여 이미지로 저장하기 위해 어떠한 방법을 사용하였는지 설명하세요.

A2. absdiff 함수를 활용하여 이미지 간의 차이를 계산하고 저장할 수 있다.

P2: Intensity Transformation

1) Histogram Equalization에 대해 설명하세요.

[답변작성] Histogram Equalization은는 이미지 프로세싱에서 사용되는 기술 중 하나로, 이미지의 명암 대비를 향상시키는 방법 중 나이다다. 주어진 이미지의 픽셀 값 분포를 조정하여 전체적인 밝기 차이를 균등하게 만들어주는 식이다다 히스토그램 평활화의 주요 단계는 다음과 같다 히스토그램 계산 > 누적 분포 함수 계산 > 히스토그램 정규화 > 새로운 픽셀 값 계산 > 이미지 업데이트 이러한 단계를 통해 히스토그램 평활화는 입력 이미지의 명암 대비를 향상시키고, 이미지의 시각적 품질을 향상시킬 수 있다. 특히 히스토그램이 좁은 범위에 집중되어 있는 경우에 효과적으로 동작한다.

2) Histogram Matching에 대해 설명하세요.

[답변작성] 히스토그램 매칭은 이미지 처리에서 사용되는 기술 중 하나로, 특정 이미지의 히스토그램 분포를 다른 이미지의 히스토그램 분포와 일치시키는 작업이다. 이는 이미지의 명암 대비를 향상시키거나, 이미지의 색상 특성을 조정하는 데 유용하게 활용된다.게 변환합니다.

히스토그램 매칭은 주로 이미지 간의 명암 대비 조정, 밝기 보된 된 보정 등에 사용됩니다. 예를 들어, 어두운 이미지의 명암 대비를 향상시키기 위해 밝은 이미지의 히스토그램을 사용하여 어두운 이미지의 토을 조정할 수 있습니다.

3) 주어진 pollen.jpg 이외의 다른 사진(각자 원하는 사진)을 Histogram Equalization에 사용해보세요.

[답변작성] aerial.jpg 에 적용해보았습니다.

P3: Spatial Domain Filtering

1) Gaussian Filter와 Bilateral Filter의 차이에 대해 설명하세요.

[답변작성]

필터링 방식:

Gaussian 필터: 이미지의 각 픽셀에 대해 가우시안 함수를 사용하여 주변 픽셀과의 가중 평균을 계산하여 픽셀 값을 업데이트합니다. 이것은 픽셀 주변의 정보만을 고려하여 필터링하는 선형 필터입니다.
Bilateral 필터: 주변 픽셀과의 거리뿐만 아니라 밝기 값의 유사성도 고려하여 가중 평균을 계산합니다. 따라서 이 필터는 이미지의 세부 정보를 보존하면서도 잡음을 줄이는 데 더 효과적입니다.
처리 시간:

Gaussian 필터: 계산이 비교적 간단하고 빠르게 처리됩니다.
Bilateral 필터: 주변 픽셀과의 거리 및 밝기 값의 유사성을 고려하기 때문에 계산이 더 복잡하고 느릴 수 있습니다.
효과:

Gaussian 필터: 이미지를 부드럽게 만들고 잡음을 제거하는 데 효과적입니다. 그러나 세부 정보를 보존하지 못할 수 있습니다.
Bilateral 필터: 잡음을 효과적으로 제거하면서도 이미지의 선명도와 세부 정보를 보존합니다. 따라서 주로 엣지 보존 필터로 사용됩니다.
적용 대상:

Gaussian 필터: 잡음이 적은 이미지 또는 덜 복잡한 이미지에 적합합니다.
Bilateral 필터: 잡음이 많은 이미지 또는 복잡한 이미지에 적합합니다. 특히 엣지를 보 결과에 따라 다를 수 있습니다.
2) Unsharp masking의 원리에 대해 설명하세요.

[답변작성]

Blurring (흐림 효과 적용): 먼저, 이미지에 Gaussian 필터 또는 다른 흐림 효과 필터를 적용하여 이미지를 흐릿하게 만듭니다. 이것은 이미지의 고주파 성분을 감소시키고 낮은 주파수 성분을 유지합니다. 이 과정에서 이미지의 세부 사항은 잃어버리게 됩니다.

Mask 생성: 원본 이미지에서 흐린 이미지를 빼면, 고주파 성분이 얻어집니다. 이것을 마스크라고 합니다. 마스크에는 주로 이미지의 엣지 정보가 포함되어 있습니다.

엣지 강화: 마스크를 원본 이미지에 추가하여 엣지를 강화합니다. 보통은 마스크에 상수를 곱하여 엣지를 강조합니다. 이렇게 하면 엣지가 뚜렷해지고 이미지의 선명도가 향상됩니다.드는 데 활용됩니다.드는 데 활용됩니다.다.

3) Gaussian Filter와 Median Filter를 잡음제거 관점에서 비교하세요.

[답변작성]

Gaussian 필터:

동작 방식: Gaussian 필터는 각 픽셀을 주변 픽셀의 가중 평균으로 대체하여 이미지를 흐리게 만듭니다. 이것은 이미지의 잡음을 부드럽게 만들고 평활화하는 데 도움이 됩니다.
효과: Gaussian 필터는 잡음을 감소시키면서도 이미지의 선명도를 보존합니다. 하지만 가우시안 필터링은 이미지의 세부 정보를 흐릿하게 만들 수 있으며, 특히 이미지에 고주파 성분이 많은 경우에는 부적합할 수 있습니다.
계산 복잡성: Gaussian 필터는 단순하고 효율적인 연산을 통해 비교적 빠르게 처리될 수 있습니다.
Median 필터:

동작 방식: Median 필터는 각 픽셀 주변의 픽셀 값들을 정렬한 후 중간값을 취하여 해당 픽셀의 값을 대체합니다. 이것은 이웃 픽셀 값 중에 잡음 픽셀 값이 포함되어 있을 때 효과적으로 잡음을 제거합니다.
효과: Median 필터는 이미지의 잡음을 효과적으로 제거하면서도 선명한 엣지를 보존합니다. 이것은 임펄스 노이즈와 같은 특정 종류의 잡음을 처리하는 데 특히 효과적입니다.
계산 복잡성: Median 필터는 정렬된 중간값을 찾는 과정이 필요하므로 계산 복잡성이 더 높습니다. 특히 필터 크기가 커질수록 계산량이 많아질 수 있습니다.수 있습니다. 수 있습니다.

P4 Point, Line & Edge Detection

1) Canny Detection 알고리즘을 4가지 단계로 나누어 설명하세요.

[답변작성]

1.노이즈 제거 :
먼저 입력 이미지에서 노이즈를 제거하기 위해 가우시안 필터링을 적용합니다. 이를 통해 이미지의 부드러운 버전을 얻게 됩니다. 노이즈가 많은 이미지에서는 노이즈를 제거하는 것이 엣지 검출의 정확성에 중요합니다.

2.그래디언트 계산 :
블러링된 이미지에서 각 픽셀의 밝기의 변화율을 계산합니다. 이러한 변화율은 엣지의 위치를 식별하는 데 사용됩니다. 일반적으로 이미지에서 밝기의 변화를 감지하기 위해 Sobel 마스크를 사용하여 x 및 y 방향의 그래디언트를 계산합니다.

3.그래디언트 방향에 대한 비최대 억제 :
이 단계에서는 이미지를 훑으면서 엣지 후보들을 식별합니다. 이때 각 픽셀의 그래디언트 방향을 고려하여 해당 방향으로의 엣지가 가장 강한지 확인합니다. 이를 통해 억제되지 않은 엣지 후보들만을 보존하고 나머지를 제거합니다.

4.이중 임계값 및 엣지 추적 :
이 단계에서는 두 개의 임계값을 사용하여 엣지 후보들을 최종적으로 분류합니다. 높은 임계값과 낮은 임계값을 설정하고, 이를 기준으로 엣지 후보들을 강한 엣지와 약한 엣지로 구분합니다. 그런 다음 약한 엣지 중에서 강한 엣지에 연결된 엣지만을 최종적인 엣지로 선택하여 엣지를 추적합니다.
2) Sobel 대비 Canny가 더 좋은 이유를 설명하세요.

[답변작성]

1.다단계 엣지 감지:
Canny 엣지 감지기는 다단계 프로세스를 통해 엣지를 검출합니다. 이 프로세스에는 노이즈 제거, 그래디언트 계산, 비최대 억제 및 이중 임계값 및 엣지 추적 단계가 포함됩니다. 이러한 다단계 프로세스는 엣지를 더 정확하게 검출하고 불필요한 엣지를 제거하여 더 깨끗한 결과를 얻을 수 있습니다.

2.노이즈 제거:
Canny 엣지 감지기는 가우시안 필터링을 사용하여 이미지에서 노이즈를 제거합니다. 이를 통해 노이즈가 있는 이미지에서도 정확한 엣지를 검출할 수 있습니다.

3.엣지 추적:
Canny 엣지 감지기는 약한 엣지 픽셀을 추적하여 강한 엣지와 연결합니다. 이를 통해 불연속적인 엣지가 아닌 연속적인 선으로 엣지를 표현할 수 있습니다.

4.이중 임계값:
Canny 엣지 감지기는 두 개의 임계값을 사용하여 엣지를 분류합니다. 이러한 이중 임계값을 사용하면 약한 엣지와 강한 엣지를 구별하고, 약한 엣지 중에서만 강한 엣지와 연결된 엣지를 선택하여 엣지를 추적할 수 있습니다.
3) Hough Transform을 이용해서 Line을 검출하는 원리에 대해 설명하세요.

[답변작성]

1.매개변수 공간 설정:
허프 변환은 매개변수 공간에서 작동합니다. 직선을 표현하기 위해 사용되는 매개변수는 일반적으로 극좌표(ρ, θ)입니다. 여기서 ρ는 직선이 원점에서 멀어진 거리이고, θ는 직선의 각도입니다. 매개변수 공간은 이러한 매개변수들의 조합으로 구성됩니다.

2.엣지 픽셀의 투표:
먼저 입력 이미지에서 엣지를 감지합니다. 이때 Canny 엣지 검출기 등을 사용하여 이미지에서 엣지 픽셀을 얻습니다. 이후 각 엣지 픽셀은 매개변수 공간 상의 모든 가능한 직선에 대해 투표를 합니다. 각 엣지 픽셀은 매개변수 공간 상의 직선에 대응하는 점으로 투영됩니다.

3.투표 수 계산:
엣지 픽셀들의 투표로 매개변수 공간 상의 투표 수를 계산합니다. 이 과정에서는 특정 매개변수 값에 대한 엣지 픽셀들의 투표 수를 누적하여 해당 매개변수 값에 해당하는 직선이 얼마나 많은 엣지 픽셀들과 관련이 있는지를 나타냅니다.

4.투표 최대값 탐지:
매개변수 공간에서 투표 수가 최대인 지점을 찾습니다. 이는 입력 이미지에서 직선에 해당하는 매개변수의 값을 결정합니다.

5.선 추출:
투표 최대값을 갖는 매개변수에 해당하는 직선을 추출합니다. 이때 각 직선의 매개변수 값은 원본 이미지 상의 실제 선의 위치를 나타냅니다.

P5: Segmentation by Thresholding
1) Otsu's Method에 대해 설명하고, Basic Threshold 방법대비 어떤 경우에 유리할 지 논하세요.

[답변작성]

Otsu의 이진화는 입력 이미지의 히스토그램을 분석하여 최적의 임계값을 자동으로 결정하는 알고리즘입니다.
이 알고리즘은 입력 이미지의 히스토그램을 분석하여 임계값을 결정할 때, 클래스 간 분산이 최소화되도록 하는 임계값을 찾아내는 것이 핵심 아이디어입니다.

Otsu의 알고리즘은 다음과 같은 단계로 작동합니다:

입력 이미지의 히스토그램을 계산합니다.
각 임계값에 대해 클래스 간 분산을 계산합니다.
클래스 간 분산을 최소화하는 임계값을 찾습니다.
이렇게 찾아진 최적의 임계값을 사용하여 이미지를 이진화합니다.

Otsu의 이진화 알고리즘은 이미지의 밝기 분포에 따라 최적의 임계값을 자동으로 결정하기 때문에,
사용자의 주관적인 판단이나 여러 가지 실험에 의존하지 않고도 좋은 결과를 얻을 수 있습니다.
특히 어두운 배경에 밝은 객체가 있는 경우나, 조명이나 촬영 조건에 따라 이미지의 밝기가 달라지는 경우에 유용합니다.

그러나 Otsu의 이진화는 이미지의 히스토그램을 기반으로 하기 때문에, 이미지의 밝기 분포가 양분될 수 있는 경우에 효과적입니다.
따라서 이미지의 밝기 분포가 단일한 경우에는 Otsu의 이진화가 잘 작동하지 않을 수 있습니다.
또한 이미지에 노이즈가 많거나, 객체와 배경의 밝기 대비가 낮은 경우에도 Otsu의 이진화가 부정확할 수 있습니다.
이러한 경우에는 기본적인 Thresholding 방법이 더 유리할 수 있습니다.
이러한 Thresholding 방법은 사용자가 임계값을 수동으로 지정하는 방법으로,
간단하고 직관적이지만 조명 변화에 취약하고 임계값을 결정하는 것에 주관적인 요소가 들어갑니다.

따라서 Otsu의 이진화는 이미지의 히스토그램에 기반하여 자동으로 최적의 임계값을 찾아내는 강력한 방법이지만,
특정 상황에서는 기본적인 Thresholding 방법이 더 적합할 수 있습니다.
2) P5.B의 Local Thresholding을 구현 했을 때 사용한 방법과 그 방법에 의해 어떻게 조명 변화가 제거될 수 있었는지 원리를 설명하세요.

[답변작성]

P5.B에서 사용된 Local Thresholding은 이웃 픽셀의 평균과 표준 편차를 이용하여 각 픽셀의 임계값을 동적으로 결정합니다.
이렇게 함으로써 픽셀마다 다른 임계값을 사용하여 이미지를 이진화할 수 있습니다.

평균과 표준 편차를 이용한 이진화의 원리는 다음과 같습니다:

이웃 픽셀의 평균과 표준 편차 계산: 각 픽셀을 중심으로 설정된 이웃 영역의 픽셀 값들의 평균과 표준 편차를 계산합니다.
임계값 계산: 평균에 표준 편차에 대한 상수 비율을 곱하여 임계값을 계산합니다. 이러한 상수 비율을 통해 임계값을 조정할 수 있습니다.
이러한 방법을 통해 픽셀의 밝기가 이웃 픽셀의 평균보다 높은지 낮은지에 따라 픽셀을 이진화합니다.

이렇게 하면 조명 변화가 있는 이미지에서도 픽셀마다 적절한 임계값을 사용하여 이진화를 수행할 수 있습니다.
조명이 밝은 영역에서는 평균이 더 높게 나오고, 표준 편차가 크게 나올 것이고, 따라서 임계값도 높아지게 됩니다.
그 결과로 밝은 영역의 픽셀은 255로 이진화되어 배경으로 나타나고, 어두운 영역의 픽셀은 낮은 값으로 이진화되어 글자로 나타날 것입니다.
이로써 글자만 깨끗하게 분할될 수 있습니다.

Alex

Engineering

이전 포스트

IP_L07_TemplateMatching

다음 포스트

실습자료

P1

P2: Intensity Transformation

IP_L07_TemplateMatching

Blockchain Technologies

0개의 댓글

관련 채용 정보