[CV] MS COCO dataset, OpenCV 개요

박경민·2023년 9월 5일
0

[Computer Vision]

목록 보기
4/25

MS COCO Dataset

  • 80개의 카테고리

  • 300k의 이미지와 1.5M 의 오브젝트들. (5개)

  • 많은 주요 패키지들이 MS COCO 를 기반으로 학습하고 있음!

MS COCO 데이터는 여기 링크 에서 다운 가능하다.

2017 데이터셋을 주로 사용한다!

데이터셋 구성도를 보자.

학습, 검증, 테스트 파일은 모두 나뉘어져 있고, JSON 파일은 딱 한개의 파일로 구성되어 있다.

OpenCV 개요

python 기반 주요 이미지 라이브러리는 다음과 같다.

PIL(Python Image Library): 이미지 처리만을 위해 사용하나, 느리다.

Scikit Image: Scipy 기반 전반적인 비전 기능을 제공한다.

OpenCV: 오픈소스 기반의 최고 인기 컴퓨터 비전 라이브러리다. C++ 기반이나 Python 도 지원한다!

  • 인텔이 개발 주도
  • 방대한 라이브러리, 손쉬운 인터페이스

✅ 이미지 로딩
imread() 를 이용해서 이미지를 로딩하는데, RGB가 아닌 BGR 로 로딩하여 색감이 원본 이미지와 다르게 나타난다.

import cv2
import matplotlib.pyplot as plt

imp_array = cv2.imread('파일명') 
plt.imshow(img_array) 

그렇다면 다시 RGB로 변환해야 한다. 위의 코드에 하나의 코드를 더 삽입하자.

import cv2
import matplotlib.pyplot as plt

img_array = cv2.imread('파일명') 
rgb_img_array = cv2.cvtColor(img_array, cv2.COLOR_BGR2RGB) # 삽입코드
plt.imshow(rgb_img_array) 

✅ 이미지 배열을 파일에 쓰기
imwrite() 를 이용하여 파일에 쓸 수 있다. 인자로는 출력파일명, 이미지배열를 전달한다.

import cv2
import matplotlib.pyplot as plt

img_array = cv2.imread('파일명') 
cv2.imwrite('출력파일명', img_array) 

갔다가 다시 오는 것이다. (결과에 차이는 없지만)

✅ Windows Frame 인터페이스

cv2.imshow(이미지배열): 이미지 배열을 윈도우 프레임에 보여줌
cv2.waitkey(): 키보드 입력이 있을 때까지 무한 대기
cv2.destroyAllWindows(): 화면의 윈도우 프레임 파괴

profile
Mathematics, Algorithm, and IDEA for AI research🦖

0개의 댓글