이미지 데이터 이론ㅣ색공간, 이미지 형식, OpenCV
- 사람은 사물 각각을 개체로 인식 / 컴퓨터는 그림을 수치 데이터(비트, 점)로 인식
- 색 공간 (color space) : 색을 수치로 표현할 수 있는 체계
- Grayscale(흑백)
- 1채널 이미지 (명도값만을 가짐)
- 채널이 하나인 모델 만들 때 (ex.손글씨-mnist 구분에서 차원이 3배가 줄고 학습률은 올라감)
- RGB
- 빨강, 초록, 파랑의 세 가지 색상을 조합
- 빛의 조합이기 때문에 (가산 혼합 : 빛의 색을 기반으로 하며, 더해질수록 하양에 가까워짐), 주로 화소가 쓰이는 디지털 이미지 디스플레이에 사용
- 대부분 각 0에서 255 사이의 (16bit) 3채널로 된 값으로 구성됨
- RGBA
- 빨강, 초록, 파랑의 색상 정보 + 투명도 값의 4채널로 된 값으로 구성됨
- 디지털 이미지, 그중에서도 투명도가 사용되는 웹 디자인이나 모바일 앱 디자인에 사용
- CMYK
- 시안, 마젠타, 노랑, 검정의 4채널로 된 값으로 구성됨
- 색의 혼합이기 때문에 (감산 혼합 : 색을 기반으로 하며, 더해질수록 검정에 가까워짐), 화소가 아닌 잉크를 사용하는 매체에 사용
- HSV
- 색상, 채도, 명도의 3채널로 된 값으로 구성됨
- 사람 친화적인 값
- 포토샵 등 일러스트레이터 프로그램의 색 조정에 사용
- 이미지 형식
- Bitmap Image File(.bmp)
- 비트맵 이미지 형식으로 픽셀의 색상 정보를 압축 없이 저장
- 파일 크기가 크지만 원본이지만 품질 손실이 없음
- 각 비트가 RGB 값으로 구성됨 (투명도 미지원)
- Joint Photographic Experts Group (.jpeg, .jpg)
- 이미지를 압축하여 저장할 수 있는 형식, 큰 이미지나 사진 저장에 널리 사용됨
- 압축률 조정 가능 (크기, 품질 간 균형 조절 가능)
- 파일 크기가 작지만 복구 불가능한 품질 손실이 일어남 (손실 압축)
- Portable Network Graphics (.png)
- RGB에 더해 RGBA를 지원하며, 투명도를 표현할 수 있음
- 손실이 일어나지 않는 이미지 압축 형식 (비손실 압축)
- Graphics Interchange Format (.gif)
- 애니메이션 효과 지원
- 무손실 압축 방식을 지원하지만 256색(8bit)까지만 지원하기 때문에 복잡한 이미지에는 부적합
- Tagged Image File Format (.tif, .tiff)
- 고품질 이미지를 지원하는 무손실 압축 형식
- CMYK를 지원하며 고해상도에 적합하기 때문에 출판 및 인쇄 분야에서 광범위하게 사용
- OpenCV
- 오픈소스
- 기본적으로 C, C++ 기반이지만 다양한 환경에서 사용 가능