[컴퓨터비전] Basic Concept of Image Processing

유진·2025년 4월 24일

Digital Image Processing

Image Processing

✔️ 특정 목적을 달성하기 위해 원래 영상을 개선된 새로운 영상으로 변환하는 작업
✔️ 컴퓨터 비전의 전처리로 활용하여 인식 성능 향상

✔️ 가장 강력한 이미지 처리 시스템 : 인간의 눈과 뇌
→ 초점 맞추기, 획득, 향상, 복원, 분석, 압축, 저장 등
→ 생물학적 영상 처리 시스템이라고 표현

✔️ 광학적 영상 처리
→ optical element를 사용하여 연산을 수행
ex) 안경 등

✔️ 아날로그 영상 처리
→ 아날로그 전기회로 사용
ex) TV 화면 조정기

✔️ 디지털 영상 처리
→ 디지털 회로, 컴퓨터 하드웨어와 소프트웨어 이용

The Original of Digital Images

Bartlane 시스템

✔️ 1920년 유럽 <> 미국 영상 전송 시스템 개통
✔️ 미디어 산업에 혁신을 불러일으킴

디지털 영상의 획득과 표현

이미지란?

✔️ 2차원 함수 f(x,y)로 정의
✔️ x,y : 공간(평면) 좌표
✔️ 좌표 (x,y)에서의 f 진폭은 그 점에서의 밝기

디지털 영상

✔️ 컴퓨터에 의해 만들어진 디지털 영상
✔️ x,y,f의 진폭 값들이 모두 유한하고, 불연속적인(이산적) 형태
✔️ 좌표와 진폭을 디지털화 해야함

📍 좌표 값 디지털화 : 샘플링
✔️ 좌표값을 이산적으로 변환
✔️ ex) 연속적인 위치 -> 픽셀 단위로 나눔

📍 진폭 값 디지털화 : 양자화
✔️ 밝기(진폭) 값을 이산적으로 변환
✔️ ex) 0~255 범위의 값으로 변환

샘플링과 양자화

📍 샘플링
✔️ 2차원 영상 공간을 MxN으로 샘플링
✔️ 여기서 MxN을 해상도라고 함

📍 양자화
✔️ 명암을 L단계로 양자화
✔️ L : 명암 단계로 [0, L-1] 사이의 분포를 가짐

샘플링

✔️ 공간상의 2차원 함수를 규칙적이고 일정하게 특정한 좌표 x,y에 존재하는 값으로 표본을 취하는 작업
✔️ 화소, 픽셀, 펠

양자화

✔️ 샘플링 된 각 화소의 밝기값을 디지털 장치나 컴퓨터에서 표현할 수 있는 몇 단계의 밝기로 근사화 시키는 과정
✔️ 명암도 or 그레이 레벨 : 각각의 양자화된 값
✔️ 그레이 스케일 : 양자화된 값들의 범위

디지털 영상의 좌표계

✔️ 원좀이 좌측 상단에 위치
✔️ 화소의 위치는 x=(j,i) or x=(y,x)로 표기
✔️ 영상은 f(x) or f(j,i), 0<=j<=M-1, 0<=j<=N-1로 표기
✔️ OpenCV는 함수에 따라 (x,y)로 표기함 (cv.line 등)

디지털 영상의 표시 방법

Various Forms of Images

Tensor

✔️ 현실세계의 데이터는 텐서로 표현됨

스칼라(0D Tensor)

✔️ 하나의 숫자만 담고 있는 텐서
✔️ 스칼라, 스칼라텐서, 0차원 텐서, 0D 텐서
✔️ 𝑥 ∈ ℝ

벡터(1D Tensor)

✔️ 숫자 여러 개가 특정 순서대로 모여있는 것 (=배열)
✔️ 본래 벡터는 열 벡터, 행 벡터 둘 다 가리키지만 보통은 열 벡터를 의미
✔️ 열벡터 : 열은 하나, 행은 여러개 (세로)
✔️ 행벡터 : 열은 여러개, 행은 하나 (가로)

행렬(2D Tensor)

✔️ 가로, 세로 2개의 축을 가지는 2차원 텐서
✔️ 다음 x 데이터에서 xij는 i,j번째 데이터를 의미함
✔️ 첫번째 숫자는 행 축, 두번째 숫자는 열 축을 의미

텐서

✔️ 3차원 이상의 행렬
✔️ 3D 텐서는 크기가 동일한 행렬을 여러개 묶어 놓은 데이터

Binary Image

이진영상

✔️ 명암도 영상의 특수한 경우로 각 화소값이 0(흑) 또는 1(백)
✔️ 1bit면 저장 가능 (편의상 1byte 사용)
✔️ 지문, 팩스, 문자 영상 등
✔️ 경계 구분이 정확하지 않은 영상에서는 영상 정보가 손실될 수 있음
✔️ 에지 검출 결과를 표시하거나 물체와 배경을 구분하여 표시하는 응용 등에 사용

Gray-level Image

명암값 범위

✔️ 영상 f가 가질 수 있는 명암값의 범위는 [0,L-1]
✔️ 보통 화소 하나에 1byte 지정
✔️ L=256: 명암도 영상
✔️ L=2인 경우 이진 영상을 의미

명암도 영상

✔️ 각 화소의 밝기가 여러 단계로 이루어진 경우로 보통의 흑백 사진이 이에 해당
✔️ 밝기의 단계는 검정~중간 회색~흰색
✔️ 디지털 영상 처리는 기본적으로 그레이 레벨 영상으로 처리

Color Image

컬러 영상

✔️ RGB 모델로 영상 표현
✔️ fr(x), fg(x), fb(x)의 세 채널로 구성
✔️ 적, 녹, 청의 3개의 개별적 성분의 영상들로 구성 (RGB 칼라 시스템)

Color Model

컬러모델

✔️ 어떤 컬러와 다른 컬러와의 관계를 표현하는 논리적인 방법
✔️ 색깔을 어떠한 모델을 사용하여 수치적으로 표현할 것인가

RGB 컬러 모델

✔️ 주어진 색깔을 R,G,B 3가지 원색을 검정 바탕에 적절히 더해 표현하는 방식

RGB Color Model

명암도 영상

✔️ 명암도 영상으로 변환 가능
✔️ 각 R,G,B 값 중 한가지만 사용, 여러 방식으로 변환
ex) 1/3(r,g,b)
✔️ 영역 분할, 영상 검색, 배경 및 객체 분리 등에 응용

한계

✔️ 다른 영상 처리 응용에 한계
✔️ RGB 컬러 요소들의 상호 관계가 너무 커서 특정 색만 분리하기 어려움
✔️ ex) (100,150,200)은 무슨 색상인가

HSV 컬러 모델

✔️ 이를 보완하기 위한 HSV 컬러모델 존재
✔️ 색상, 채도, 명도로 구분한 컬러 공간
✔️ 인간의 시각 시스템과 유사함

HSV Color Model

HSV(HSI)컬러 모델

✔️ 인간의 색인지에 기반한 모델
✔️ 인간이 색을 인식하는 3가지 요인인 Hue, Saturation, Intensity 를 컬러 공간으로 옮겨놓은 것
✔️ 구체적 컬러를 만들기 위해 색조합이 불필요
✔️ H 좌표값 자체가 바로 색상값
✔️ RGB보다 빛 변환에 강건

색의 3 요소

  1. 색상 : Hue
    ✔️ 순수색(pure color)
    ✔️ 빨강, 노랑, 파랑 등 다른 색과 구별될 수 있는 색의 명칭이나 색의 특성, 색의 구분

  2. 채도 : Saturation
    ✔️ 색이 연함, 진함, 탁함 등의 정도를 나타내는 말
    ✔️ white와 pure color의 혼합 비율(0~100%)

  3. 명도 : Value (or Intensity)
    ✔️ 색의 밝고 어두운 정도
    ✔️ 색의 명암

Color Space Conversion

색공간 변환

✔️ BGR<>Gray, BGR<>HSV 등과 같이 한 색 공간에서 다른 색 공간으로 이미지를 변환
✔️ OpenCV에는 150개 이상의 색 공간 변환 방법 존재
✔️ 가장 널리 사용 되는 것이 BGR<>Gray, BGR<>HSV

Video

동영상

✔️ 컴퓨터 비전에서 말하는 영상이란 보통 image를 뜻함
✔️ 동영상의 경우에는 추가적으로 시간적인 표본화 간격, 즉 매초 당 몇 장의 프레임을 취급하는가를 고려
✔️ 동영상 프레임 양: 프레임 수평화소수 x 프레임 수직화소수 x 화소 당 비트 수 x 초당 프레임 수 x 동영상 시간

Image Resolution

영상 해상도

📍정지 영상 기준
✔️ 공간 해상도
: 이미지가 얼마나 세밀하게 공간 정도를 표현하는가 (픽셀 밀도)
: 얼마나 많은 화소가 디지털 영상에 포함되는가

✔️ 밝기 해상도
: 각 픽셀의 밝기 수준(진폭)을 얼마나 정밀하게 표현하는가
: 디지털 화소의 밝기가 얼마나 정확히 원 영상의 명암도를 표현할 수 있는가
: 화소 밝기의 수치적 범위가 증가하면 그 화소의 밝기 해상도도 증가

📍 동영상 기준
✔️ 시간 해상도
: 1초당 몇 장의 프레임(이미지)을 표현하는가 (프레임 속도)

🌟공간 주파수🌟
✔️ Spatial Frequency
✔️ 밝기가 순환하는 비율
✔️ 순환비율이 높을수록 공간주파수가 높아짐

Frame rate

Frame rate

✔️ 동영상의 취득과 디스플레이의 디지털 및 비디지털 형태로 적용되는 디지털 샘플링 용어
✔️ 방송 TV의 motion image의 time sampling(1/30sec)-> 30frames/sec
✔️ temporal resolution -> frame rate에 관련
✔️ 프레임율이 높으면 높을수록, 취득된 동영상에서 보다 정확히 움직임이 묘사됨
✔️ 1초동안 화면에 몇장의 이미지(프레임)가 표현되는가

Connected Component

화소의 연결성

✔️ 연결 요소 (connected component)
: 서로 연결된 화소의 집합

연결요소 번호 붙이기

✔️ 4-연결성과 8-연결성

0개의 댓글