컴퓨터 비전 분야는 크게 이미지 분류, 객체 탐지, 의미 체계 구분으로 나눌 수 있다고 필자는 생각합니다. 이미지 분류는 이미지 안의 객체의 유형에 따라 이미지를 분류하는 겁니다.객체 탐지는 이미지 안의 개별 객체를 분류하고, 경계 상자를 사용해 그 객체의 위치를 식별
지난번에 이어 계속 작성하겠습니다.객체 탐지 모델은 총 두 가지 출력이 있습니다.1\. 분류 결과에 대한 확률 분포2\. 경계 상자모델의 손실 함수는 경계 상자의 회귀 손실을 분류의 교차 엔트로피 손실에 추가하며, 일반적으로 '평균 제곱 오차(MSE)'를 사용합니다.
이미지 분류, 객체 탐지와 더불어 고급 기술인 이미지 분할과 관련한 유용한 사이트에 대해 알아 볼 것이다.공식 사이트segmentation 모델 중 하나인 Unet을 사용한 것이다.이걸로 모델 생성은 끝... 정말 쉽다. 필자는 이 사이트 존재 유무를 몰라 모델을 코드
오늘은 저번 Computer Vision - Image Segmentation(1)에서 소개한 공식 사이트 Github에 올라온 예제 코드를 작서해볼 생각입니다. 코드 주소는 여기를 클릭해 주세요.segmentation이라 image와 mask가 필요합니다. 저장된 방
Computer Vision - Object Detection(2)에 언급한 모델이 경계 상자를 두 객체 사이에 배치하는 문제에 대해 이야기 했습니다. 그렇다면 어떻게 해결해야 할까요?모델에 n개의 탐지기가 있다고 할때 각 탐지기는 하나의 객체가 아닌 모든 객체를 예측
모델은 YOLO를 기준으로 작성된 겁니다.하나의 객체 탐지기는 25개의 숫자를 생성합니다. 20개의 클래스 확률.4개의 경계 상자 구성 요소: 경계 상자 중심의 x, y 좌표 값. 그리고 높이와 길이.1개의 신뢰 점수.하나의 셀에는 5개의 탐지기가 있으니, 결국 5 x
공식 사이트저번에 언급한 NMS에 대해 깊게 파고들어 보겠습니다. 한국어로 번역해보면 '비최대 억제'로 가장 적합한 경계 상자(bounding box)를 찾는 것입니다.그려지는 많은 경계 상자 중에 과연 가장 적합한 경계 상자는 무엇일까요?가장 적합한 경계 상자를 선택
저번에 NMS는 언급하고 IOU는 언급하지 않아서 이번에는 IOU를 써보려 합니다.모델을 학습할 때 주어지는 이미지에는 객체와 그 객체를 정확하게 감싼 경계 박스가 감싸져 있습니다. 그 경계 박쓰는 당연히 객관성 점수가 100점이구요. 모델이 학습함에 따라 점차 정답인
기존에 이미지를 13 x 13 그리드로 나누는 것은 일종의 제약 조건입니다. 이 제약조건 덕분에 학습하는 모델은 객체를 예측하는 방법을 더 쉽게 학습할 수 있습니다. 그리드는 특정 위치에서 전문적인 능력을 뽐내는 물체 탐지기를 학습시키게 합니다. 예를 들어 정 가운데
이미지를 받아 여러 변형을 가해 우리가 원하는 경계 상자로 바꿔야 합니다. 경계 상자를 설명하는 데는 2가지 방법이 있습니다. 우선 상자의 네 꼭지점을 숫자로 표시한 xmin, ymin, xmax, ymax와 상자의 중심 좌표와 높이와 너비를 표시한 center_x,