컴퓨터 비전의 개요

이영준·2022년 4월 25일
0
post-thumbnail

🔑컴퓨터 비전 개요

컴퓨터 비전이란?
컴퓨터 비전(computer vision)은 컴퓨터를 이용하여 정지 영상 또는 동영상으로부터 의미 있는 정보를 추출하는 방법을 연구하는 학문임

사람이 눈으로 사물을 보고 인지하는 작업을 컴퓨터가 동등하게 수행할 수 있게끔 연구하는 학문이라고 할 수 있음

사람의 눈이 하는 작업을 카메라가 대신하고, 사람의 뇌가 하는 작업을 수학적 알고리즘을 통해 컴퓨터가 유사하게 수행할 수 있도록 만드는 작업이 컴퓨터 비전임

전통적인 컴퓨터 비전 문제 해결 방법에서는 영상으로부터 유용한 정보를 추출하고, 이를 조합하여 결과를 유추함

주로 활용하는 영상 정보 : 밝기, 색상, 모양, 텍스처(texture) 등
+ 머신러닝 알고리즘으로 사물을 인식

컴퓨터 비전 ≒ 영상 처리


컴퓨터 비전 & 수학

행렬 연산과 관련된 선형대수, 미적분학, 확률과 통계, 기하학 등의 다양한 수학적 이해가 있으면 컴퓨터 비전에 좀 더 쉽게 다가갈 수 있음

신호 처리(signal processing) 학문에도 컴퓨터 비전과 관련된 이론적 배경이 다수 존재함
과거에는 영상 처리가 2차원 디지털 신호 처리의 한 분야로서 간주되기도 하였으며, 많은 연구 분야에서 영상 처리와 신호 처리는 밀접한 관계를 가지고 있음

패턴 인식(pattern recognition)과 딥러닝으로 대표되는 머신 러닝도 컴퓨터 비전과 떼어 내서 생각 할 수 없는 분야임

수치 해석, 알고리즘, 최적화 등을 다루는 컴퓨터 과학(computer sciences),

카메라 구조 및 영상 획득과 관련된 광학, 사람이 영상을 이해하는 방식을 연구하는 인지 과학도 컴퓨터 비전과 관련이 많은 분야임

최근에는 영상 분석 정보를 이용하여 자연스럽게 영상을 재구성하는 컴퓨터 그래픽스와 컴퓨터 비전이 로봇의 눈과 머리 역할을 담당하는 로봇 공학 분야도 컴퓨터 비전과 함께 발전하고 있음


컴퓨터 비전의 활용

대부분의 스마트폰 카메라에서 지원하는 HDR(High Dynamic Range) 사진 촬영,
공장에서는 제품의 검사, 측정, 불량 판정,
공장 자동화에 주로 사용되는 컴퓨터 비전 시스템을 머신 비전(machine vision)이라고도 함

🔑영상의 구조와 표현 방법

태양의 가시광선 또는 특정 광원에서 발생한 빛이 피사체에 부딪혀 반사되고, 그반사된 빛이 카메라 렌즈(lens)를 통해 카메라 내부로 들어오게 됨

렌즈는 카메라 바깥으로부터 들어온 빛을 굴절시켜 이미지 센서(image sensor)로 모아 주는 역할을 함

이미지 센서는 빛을 전기적 신호로 변환하는 포토 다이오드(photodiode)가 2차원 평면상에 배열되어 있는 장치임

렌즈에서 모인 빛이 이미지 센서에 닿으면 이미지 센서에 포함된 포토 다이오드가 빛을 전기적 신호로 변환함

빛을 많이 받은 포토 다이오드는 큰 신호를 생성하고 빛을 적게 받은 포토 다이오드는 작은 크기의 신호를 생성함으로써 명암이 있는 2차원 영상을 구성함

전기적 신호는 아날로그-디지털 변환기(ADC, Ananlog-to-Digital Convertor)를 거쳐 디지털 신호로 바뀌게 됨

디지털 신호는 다시 카메라의 ISP(Image Signal Processor) 장치로 전달되고 ISP 장치는 화이트밸런스 조정, 색 보정, 잡음 제거 등의 기본적인 처리를 수행

피사체 > 렌즈 > 센서 > ISP > 사진 파일

픽셀

영상을 구성하는 최소 단위이다.
사진(picture)과 요소(element)를 뜻하는 영단어로부터 유래됨
좌표의 시작을 0부터 표현하는 방식을 0-기반(zero-based) 표현이라고 부르며, 보통 컴퓨터에서 많이 사용하는 방식임

그레이스케일

그레이스케일 영상에서 하나의 픽셀은 0부터 255 사이의 정수 값을 가질 수있으며, 0은 가장 어두운 검은색을 표현하고 255는 가장 밝은 흰색을 표현함

레이스케일 영상에서 픽셀이 가질 수 있는 값의 범위를그레이스케일 레벨(grayscale level) 이라고 함

그레이스케일 값을 저장하기 위하여 C/C++에서는 보통 unsigned char 자료형을 사용함
unsigned char 자료형은 1바이트(byte)의 크기를 가지며 부호 없는 8비트(bit) 정수 값을 저장할 수 있음

와 같이 재정의되어있는 운영체제, 라이브러리가 많음
BYTE: 윈도우 운영체제
uint8_t: 리눅스
uchar: Opencv

컬러

B, G, R의 색상 성분 조합으로 픽셀 값을 표현함
각각의 색상 성분을 0~255의 unsigned char 자료형 세개를 이용하여 표현할 수 있다.

profile
컴퓨터와 교육 그사이 어딘가

0개의 댓글