이미지 분류

J. Hwang·2024년 9월 13일
0

이미지 분류란, 주어진 이미지 데이터를 사전에 정의된 클래스로 할당하는 작업이다.


binary classification

데이터를 두 개의 클래스 중 하나로 분류하는 것이다.
classifier에서 나온 최종 결과를 activation function (sigmoid function)을 거쳐 yes or no의 결과로 반환하게 한다.


multi-class classification

데이터를 여러 개의 클래스 중 하나로 분류하는 것이다.
classifier에서 나온 최종 결과를 activation function (softmax function)을 거쳐 A로 분류될 확률, B로 분류될 확률, C로 분류될 확률, ... 로 반환하게 한다.


multi-label classification

데이터가 여러 개의 클래스로 동시에 분류될 수 있는 문제이다. 따라서 예측할 각각의 클래스마다 sigmoid function으로 이진 분류를 수행하게 된다.


coarse-grined classification

클래스 간의 연관성이 비교적 적은 상황의 분류 작업이다. 예를 들어, 인라인 스케이트와 악어, 관람차, 사과 등 서로 다른 종류의 이미지들이 많이 섞여 있는 상황에서의 분류이다. ImageNet이나 CIFAR100 등의 데이터셋이 이런 분류 작업을 필요로 할 것이다.


fine-grained classification

동일한 상위 범주 내에서 세부적인 하위 범주로 분류하는 작업이다. 예를 들어, 조류 분류 (새들 중에서도 제비, 참새, 까마귀 등으로 구분), 자동차 모델 분류 등이 있다.


N-shot classification

학습할 때의 데이터 양에 따라서 분류 작업을 부르는 이름이 다르다.

  • few-shot classification : 클래스 당 몇 개의 데이터만으로 학습
  • one-shot classification : 클래스 당 단 하나의 예시만 학습
  • zero-shot classification : 학습 없이 바로 예측
profile
Let it code

0개의 댓글