Bidirectional Attention-Recognition Model for Fine-Grained Object Classification 제2부

이준석·2023년 1월 2일


Fine-grained object classification (FGOC) is a challenging research topic in multimedia computing with machine learning [1]–[5], which aims to distinguish objects from different subordinate-level categories within a general category [6], [7], such as bird species [8], dog breeds [9], pet breeds [10], car models [11], air-craft models [12], flowers categories [13], video retrieval [14]–[16], activity recognition [17], [18] and temporal prediction [19], [20], etc.
FGOC(Fine-grained Object Classification)는 기계 학습 [1]–[5]을 사용하는 멀티미디어 컴퓨팅에서 도전적인 연구 주제로, 조류 종 [6], 개 품종 [7], 애완 동물 품종 [10], 자동차 모델 [11], 항공기 모델 [12], 꽃과 같은 일반 범주 내에서 개체를 구별하는 것을 목표로 한다. 범주 [13], 비디오 검색 [14]–[16], 활동 인식 [17], [18] 및 시간 예측 [19], [20] 등.

In FGOC task, the objects from intra-category usually appear with marginal visual differences, meanwhile, the objects within the same category can appear significant variation due to the complex backgrounds and changeable pose (Fig. 1).
FGOC 작업에서 범주 내 개체는 일반적으로 미미한 시각적 차이로 나타납니다. 한편 동일한 범주 내의 개체는 복잡한 배경과 변경 가능한 포즈로 인해 상당한 변형으로 나타날 수 있습니다(그림 1).

Due to the low inter-class but high intra-class variations, the traditional one-step process for inter-class visual categorization encounters bottlenecks. Moreover, the one-step process is a black box method, which takes the entire image for feature learning and directly generates the recognition result.
클래스 간은 낮지만 클래스 내 변형이 높기 때문에 클래스 간 시각적 분류를 위한 기존의 한 단계 프로세스는 병목 현상에 직면합니다. 또한 원스텝 프로세스는 특징 학습을 위해 전체 이미지를 가져와 인식 결과를 직접 생성하는 블랙박스 방식이다.

인공지능 전문가가 될레요

0개의 댓글