
1. 컴퓨터 비전 개요
컴퓨터 비전
컴퓨터 비전(computer vision)이란?
- 컴퓨터를 이용하여 정지 영상 또는 동영상으로부터 의미 있는 정보를 추출하는
방법을 연구하는 학문
- 즉, 사람이 눈으로 사물을 보고 인지하는 작업을 컴퓨터가 수행하게끔 만드는 학문

컴퓨터 비전(computer vision)과 영상 처리(image processing)

컴퓨터 비전의 역사

컴퓨터 비전 관련 학문

2. 컴퓨터 비전 응용 분야
영상의 화질 개선(image enhancement)
- 카메라로 찍은 사진을 더욱 선명하게 만들거나 색상을 원하는 형태로 변경
- RAW 영상의 변환, 사진앱의 필터, 잡음 제거, HDR, Super Resolution

내용 기반 영상 검색(content-based image/video retrieval)
- 영상에 존재하는 사람, 사물, 색상 정보 등을 인식하여 유사한 영상을 자동으로 찾아주는 시스템. 비주얼 검색(visual search).
얼굴 검출 및 인식
- 얼굴 검출(face detection): 영상에서 얼굴의 위치와 크기를 찾는 기법
- 얼굴 인식(face recognition): 검출된 얼굴이 누구인지를 판단하는 기술
- 미세한 표정 변화도 감지
- 조명 변화, 안경 착용, 헤어 스타일 변화 등

의료 영상 처리
- X-ray 또는 CT 영상 처리
- 영상의 화질 개선, 영상의 자동 분석

광학 문자 인식
- 영상에 있는 텍스트를 인식.
OCR(Optical Character Recognition)
- 번역, 자동차 번호판 인식 등

머신 비전(machine vision)
- 공장 자동화: 제품의 불량 검사, 위치 확인, 측정 등
- 높은 정확도와 빠른 처리 시간 요구

인공지능 서비스
- 입력 영상을 객체와 배경으로 분할 → 객체와 배경 인식 → 상황 인식 → 로봇과 자동차의 행동 지시
- Computer Vision + Sensor Fusion + Deep Learning
- 인공지능 로봇, Amazon Go, 구글/테슬라 자율 주행 자동차

3. 영상 데이터의 구조
영상(image)이란?
- 픽셀이 바둑판 모양의 격자에 나열되어 있는 형태 (2차원 행렬)
- 픽셀(pixel): 영상의 기본 단위, picture element, 화소(畵素)

영상에서 사용되는 좌표계

4. 영상 데이터의 종류
주로 사용되는 영상 데이터의 종류
그레이스케일 영상(grayscale image)
- 흑백 사진처럼 색상 정보가 없이 오직 밝기 정보만으로 구성된 영상
- 밝기 정보를 256 단계로 표현

트루컬러 영상(truecolor image)
- 컬러 사진처럼 색상 정보를 가지고 있어서 다양한 색상을 표현할 수 있는 영상
- 빨강(red), 초록(green), 파랑(blue) 색 성분을 각각 256 단계로 표현
→ 2563 = 16,777,216 색상 표현 가능

그레이스케일 영상의 특징
그레이스케일 영상의 픽셀 값 표현
- 밝기 성분을 0 ~ 255 범위의 정수로 표현
- 0 : 완전히 어두운 상태(검정색)
- 255 : 완전히 밝은 상태(흰색)

- 프로그래밍 언어에서 표현 방법: 1Byte 사용
- C/C++ → unsigned char
- Python → numpy.uint8
그레이스케일 영상에서 픽셀 값 분포의 예

트루컬러 영상의 특징
컬러 영상의 픽셀 값 표현
- R, G, B 색 성분의 크기를 각각 0 ~ 255 범위의 정수로 표현
- 0 : 해당 색 성분이 전혀 없는 상태
- 255 : 해당 색 성분이 가득 있는 상태
- 프로그래밍 언어에서 표현 방법: 3Bytes 사용
- C/C++ → 구조체, 클래스
- Python → 튜플, numpy.ndarray

트루컬러 영상에서 픽셀 값 분포의 예

5. 영상 파일 형식과 특징
주요 영상 파일 형식 특징

영상 데이터의 용량
영상 데이터 용량 분석
- 그레이스케일 영상: (가로 크기) × (세로 크기) Bytes
- 트루컬러 영상: (가로 크기) × (세로 크기) × 3 Bytes

파일 형식에 따른 파일 용량
BMP, PNG, JPG 파일 용량 비교
