80개의 카테고리
300k의 이미지와 1.5M 의 오브젝트들. (5개)
많은 주요 패키지들이 MS COCO 를 기반으로 학습하고 있음!
MS COCO 데이터는 여기 링크 에서 다운 가능하다.
2017 데이터셋을 주로 사용한다!
데이터셋 구성도를 보자.
학습, 검증, 테스트 파일은 모두 나뉘어져 있고, JSON 파일은 딱 한개의 파일로 구성되어 있다.
python 기반 주요 이미지 라이브러리는 다음과 같다.
PIL(Python Image Library): 이미지 처리만을 위해 사용하나, 느리다.
Scikit Image: Scipy 기반 전반적인 비전 기능을 제공한다.
OpenCV: 오픈소스 기반의 최고 인기 컴퓨터 비전 라이브러리다. C++ 기반이나 Python 도 지원한다!
✅ 이미지 로딩
imread() 를 이용해서 이미지를 로딩하는데, RGB가 아닌 BGR 로 로딩하여 색감이 원본 이미지와 다르게 나타난다.
import cv2
import matplotlib.pyplot as plt
imp_array = cv2.imread('파일명')
plt.imshow(img_array)
그렇다면 다시 RGB로 변환해야 한다. 위의 코드에 하나의 코드를 더 삽입하자.
import cv2
import matplotlib.pyplot as plt
img_array = cv2.imread('파일명')
rgb_img_array = cv2.cvtColor(img_array, cv2.COLOR_BGR2RGB) # 삽입코드
plt.imshow(rgb_img_array)
✅ 이미지 배열을 파일에 쓰기
imwrite() 를 이용하여 파일에 쓸 수 있다. 인자로는 출력파일명, 이미지배열를 전달한다.
import cv2
import matplotlib.pyplot as plt
img_array = cv2.imread('파일명')
cv2.imwrite('출력파일명', img_array)
갔다가 다시 오는 것이다. (결과에 차이는 없지만)
✅ Windows Frame 인터페이스
cv2.imshow(이미지배열): 이미지 배열을 윈도우 프레임에 보여줌
cv2.waitkey(): 키보드 입력이 있을 때까지 무한 대기
cv2.destroyAllWindows(): 화면의 윈도우 프레임 파괴