제조 현장에서 진행되는 Defect inspection은 결함 검출, 분류, Localization 등을 주요 업무로 함
지금까지 자동화된 defect inspection system에 대한 연구가 진행되어 왔음
그러나, 실제 결함 이미지의 수가 적고 높은 수집 비용으로 인해 다양한 결함 이미지를 확보하는 것이 어려우며 이러한 문제를 Data insuffciency problem 이라고 함
따라서 일반적으로 Unsupevised paradigm이 채택되어 활발히 연구되었지만, 다양한 결함 범주를 구분할 수 없으므로 Classification과 같은 특정 작업에는 적용할 수 없음
Data insuffciency problem을 해결하기 위한 직관적인 아이디어는 더 많은 결함 이미지를 생성하는 것이며, 이전의 방법들은 인공물을 수동으로 추가하거나 (DeVries and Taylor 2017) 결함이 없는 이미지의 패치(결함)을 잘라 붙여 넣거나 (Li et al. 2021), 한 이미지에서 다른 이미지로 결함 영역을 복사하는 방식 (Lin et al. 2021)으로 단순하지만 가짜 결함 이미지를 추가하려고 시도했음
그러나 이러한 방법으로 생성된 결함 이미지는 사실적이고 다양하지 못함
반면, Generatie Adversarial Network (Goodfellow et al. 2014)와 그 variation은 이미지 생성 작업에 널리 사용되고 있지만 data insuffciency problem에 취약하다는 단점때문에 결함 이미지 생성분야에는 몇가지 연구들을 (Niu et al. 2020 Zhang et al. 2021) 제외하고는 거의 사용되지 않음
해당 연구들은 수백 또는 수천 개의 결함 이미지와 그 이상의 결함 없는 이미지에 의존하거나 단일 Texture 범주에만 초점을 맞추고 있음
그러나, 실제 산업 제조에서는 생산 라인에서 실제 결함 이미지가 드물고 수집이 어렵기 때문에 일반적으로 소수의 결함 이미지만 활용이 가능함
이러한 한계를 극복하기 위해 본 논문에서는 제안된 결함 이미지를 활용하여 사실적이고 다양한 결함 이미지를 생성하는 새로운 Defect-Aware Feature Manipulation GAN을 제안함
DFMGAN은 대규모 도메인에서 학습한 Pre-trained 모델을 소규모 도메인에 적용하는 Few-shot image generation method에서 영감을 얻었음
본 논문에서는 수백 개의 결함 없는 물체 이미지로 훈련된 Backbone generator를 사용한 defect-aware residual blocks을 제안하여 그럴듯한 결함 영역을 생성하고 이 영역 내의 feature를 조작하여 다양하고 사실적인 결함 이미지를 생성함
Training process는 아래 그림과 같으며, MVTec AD Dataset을 통해 DFMGAN이 다양한 결함 이미지를 고해상도로 생성할 수 있을 뿐만 아니라 비전통적 증강으로 defect inspection 작업의 성능을 향상시킬 수 있음이 입증됨
지금까지 설명한 DFMGAN의 구조를 통해 예비 실험을 진행한 결과, 생성되는 결함 이미지는 에 많은 영향을 받는다는 것을 알게되었고 이는 유사한 물체에는 항상 닮은 결함이 동반되어 다양성을 크게 해치는 결과를 의미함
따라서, 이를 완화하기 위해 mode seeking loss를 활용함
defect mapping network는 무작위 과 를 사용하여 두 개의 대응하는 과 를 출력함
이를 사용하여 각각의 결함 마스크 과 를 생성한 뒤, DFMGAN은 mode seeking loss를 최소화함
즉, 서로 다른 을 사용할 때 결함 마스크 간의 차이가 최대화되길 바라는 것임
few-shot 이미지 생성 방법(Finetune, DiffAug, CDC)과 이전의 생성 결함 생성 방법(SDGAN, Defect-GAN)을 비교한 결과, 결함 생성을 위한 특별한 설계가 없는 전자는 과적합 경향이 있다는 것을 발견함
Finetune 또는 DiffAug로 생성된 대부분의 이미지는 실제 결함 이미지 중 하나와 거의 동일하기 때문에 일반적으로 KID score는 좋지만 Clustered LPIPS는 상대적으로 낮음
반면, CDC는 결함이 없는 이미지가 비슷하게 나타나기 때문에 변화가 많은 결함 이미지를 생성할 수 없다는 한계가 있음
그러나, 앞서 언급한 두 가지 방법에서 가장 중요한 한계점은 이미지 대 이미지 paradigm이라고 저자들은 주장함
결함을 생성하면서 동시에 결함이 없는 영역의 품질도 보장해야 하는데, 이는 생성된 결함 마스크에 의해 명시적으로 구분된 결함에만 집중하는 것보다 더 어려운 작업임
따라서, 앞선 두 가지 방법은 더 나쁜 KID score를 도출하며 생성된 이미지가 Downstream task에 도움이 되기에는 현실적이지 못함
또한, Copy&Paste의 경우 극소수의 결함 이미지만을 생성할 수 있으며 때때로 물체 외부에 결함이 존재하는데, 이는 이 방법의 생성 과정이 물체와 외부 요인에 의해 결함이 결정된다는 전제를 위배하기 때문에 적절치 않음
언급한 문제를 해결하기 위해 본 논문의 저자들은 DFMGAN을 설계하였음
첫 번째 훈련 단계에서는 결함이 없는 이미지로 모델을 훈련하여 결함 범주로 옮기는 데 유리한 물체 범주의 분포를 포착함
두 번째 훈련 단계에서는 첫 번째 단계에서 학습한 다양한 결함 없는 샘플의 feature에 실제와 같은 결함을 추가하도록 모델을 학습시켜 과적합을 방지하고 생성된 결함 이미지의 다양성을 향상시킴
결론적으로, 특수 설계된 구조를 통해 DFMGAN은 복잡한 구조 정보와 높은 변동성을 가진 물체에서도 까다로운 몇 장의 결함 이미지 생성을 할 수 있으며, 이전 방법보다 성능이 큰 폭으로 향상됨
Defect classification은 하나의 물체 범주에서 다양한 유형의 결함을 인식하는 defect inspection임
Cut&Paste의 한계로 인해 마스크가 필요없는 defect classification에 대해 DFMGAN을 테스트함
위 표는 defect classification의 정확도 결과를 표시한 것인데, 산업현장에서의 실제 defect inspection을 시뮬레이션한 이 classification 작업에서 DFMGAN은 모든 partition에서 가장 높은 점수를 얻었으며, 이는 본 논문의 방법이 Downstream task에서 가장 유익한 data augmentation 기법으로 작용한다는 것을 의미함