Unlabeled Samples Generated by GAN Improve the Person Re-identification Baseline in vitro

박지예·2024년 8월 18일

논문 정리

목록 보기

7/9

Introduction

본 논문은 추가적인 데이터 수집 없이 작동하는 semi-supervised pipeline을 제시한다.
training set은 GAN을 이용한 unlabeled된 data를 활용한 것이고, 이 데이터를 이용해 모델의 성능을 개선한다.

문제 기존의 GAN은 대부분 생성된 sample의 질과 semi-unsupervised learning의 성능을 평가한다. 하지만 사용 가능한 learning framework에 효과적으로 적용하는 방법이 부족하다. DCGAN 모델을 사용하여 생성된 unlabeled data를 기존의 labeled data와 함께 사용하는 새로운 방법을 제안한다.
(2) CNN 기반의 semi-supervised learning에서 labeled와 unlabeled data를 활용한 방법을 제안한다.
보통 unsupervised data는 supervised learning 전 pre-train 단계에서 사용하지만, 여기서는 모든 데이터를 동시에 사용한다. 원래는 unlabeled data(실제 데이터)에 기존의 클래스에 따라 label을 할당하지만, GAN으로 생성된 데이터가 기존에 존재하는 클래스에 속하지 않는 방법을 제안한다.
LSRO 방법은 생성된 데이터를 기존의 클래스에 속하지 않는다고 생각해 특정 클래스를 특별히 높은 신뢰도로 예측하지 않도록 learning한다.
(3) person Re-ID 문제에서 data annotation은 비싸다.(한 사람에게 bounding box를 그리고 똑같은 ID라벨을 주는 것 때문) large Re-ID dataset과 CNN을 이용한 학습된 embedding of pedestrians이 최근 연구에 도움을 주었다. 하지만 아직 제한이 있다. GAN을 사용하면 training set을 확장할 수 있고 정규화로 semi-supervised system을 할 수 있다.

contribution GAN을 사용한 unlabeled data 생성: GAN으로 생성된 이미지를 CNN learning system에 통합하는 in vitro 방식의 semi-supervised pipeline을 제안한다.
(2) Label smooting regularization for outliers (LSRO)로 unlabeled data 통합
(3) 3개의 person Re-ID datasets에서의 CNN baseline을 넘어선 성능 향상: ResNet baseline보다 성능이 향상됨을 보인다.

GAN에 관한 연구와 semi-supervisied learning, person Re-ID 관련 선행 연구

Generative Adversarial Networks

generative adversarial networks(GANs)는 두 가지의 sub-network로 나뉜다.
(1) generator: discriminator를 속일 수 있는 sample들을 생성한다.
(2) discriminator: sample이 생성된 것인지 진짜인지 판별한다.

DCGANs는 학습의 안정성을 향상시키는 방법이다. 이 방법에서 discriminator는 강력한 특징 추출기로 사용 가능하다. 또한 GAN은 특정 분야에서 이미지 생성도 가능했다.(encoder-decoder method에서 이미지 생성자로 작용했다.)
본 논문에서는 기본적인 GAN 모델을 사용해 learning data에서 unlabeled sample을 생성하고, 이런 sample이 discriminative learning을 향상시키는 것에 도움을 준다는 것을 보인다.

Semi-supervised Learning

Semi-supervised learning: unlabeled data를 고려한 supervised learning의 하위 분야이다. annotated data의 양이 작을 때 유용하다. (supervised learning의 auxiliary task로 볼 수도 있다.)
compact한 representation을 얻기 위해 네트워크의 모든 레벨의 입력을 재구성하는 방법이 제안됨.