딥러닝 | 컴퓨티 비전 시작하기

소리·2024년 1월 12일
0

컴퓨터 비전 (computer vision)

  • 컴퓨터를 이용해 정지 영상 또는 동영상으로부터 의미 있는 정보를 추출하는 방법을 연구하는 학문

  • 영상 처리와 컴퓨터 비전은 거의 비슷한 의미로,
    영상처리는 영상을 입력 받아 화질을 개선하는 등의 처리로 다시 영상을 출력으로 내보내는, 컴퓨터 비전을 위한 전처리 작업 같은 느낌으로 많이 통용된다.

응용분야

  • 영상 화질 개선 image enhancement
  • 내용 기반 영상 검색 content-based image / video retrieval
  • 얼굴 검출 및 인식 face detection & recognition
  • 의료 영상 처리
  • 광학 문자 인식(영상에 있는 텍스트를 인식)
  • 머신 비전 machine vision (공장 자동화)
  • 인공지능 서비스

영상 데이터 구조

  • 영상(image) : 픽셀이 바둑판 모양의 격자에 나열되어있는 2차원 행렬
  • 픽셀 : 영상의 기본 단위, picture element, 화소

영상 데이터 종류

  • 그레이스케일 영상(grayscale image)
    : 오직 밝기 정보(256단계)로 구성된 영상
    : Python ➡️ numpy.uint8
    : 용량 (가로 크기) x (세로 크기) Bytes
  • 트루컬러 영상(truecolor image)
    : Red, Green, Blue 색 성분 각각 256단계로 표현
    : Python ➡️ 튜플, numpy.ndarray
    : 용량 (가로 크기) x (세로 크기) x 3 Bytes

주요 영상 파일 형식

  • BMP : 픽셀 데이터를 압축하지 않고 그대로 저장 (파일 용량 大), 파일 구조 단순, 라이브러리 도움없이 파일 입출력 프로그래밍 가능

  • JPG : 사진과 같은 컬러 영상 저장, 압출률이 좋아 용량 크게 감소

  • GIF : 256 색상 이하의 영상 저장, 무손실 압축, 움직이는 GIF 지원

  • PNG : 무손실 압출, 알파 채널(투명도) 지원

OpenCV

  • 컴퓨터 비전 관련 라이브러리

  • 구성

  • 메인모듈

출처) 제로베이스 강의

profile
데이터로 경로를 탐색합니다.

0개의 댓글