Data Augmentation

Heath_Jeong·2021년 3월 8일
0
post-custom-banner

실제 데이터와 학습 데이터의 gap

카메라에 의해 찍힌 사진들은 실제 데이터와 같지 않다.
즉, 이미지는 실제 세상의 데이터를 모두 표현하지 못한다.

심지어 사진 기법 등의 원인으로 편향되기까지 해서 적절한 추론을 못하게 된다.
예로 밝은 사진만 학습시키면 어두운 사진은 추론하지 못한다.

Data Augmentation

위의 문제를 해결하기 위해 데이터를 증강시킨다.
실제 데이터 분포처럼 학습 데이터를 만들자.

OpenCV 와 NumPy 에 데이터 증강과 관련된 함수들이 많다.

Crop

이미지의 일부를 확대시키는 방법
간단하지만 강력한 성능 향상 가능

Shear

이미지를 shear transformation 하는 방법

CutMix

여러 이미지를 자르고 합치는 방법

  • 두 종류의 강아지를 섞으면 y 값에도 concat 을 해야한다.

이외에 Brightness, Rotate 등의 방법들이 있다.

일반적으로는 하나의 방법만 사용하지 않고 여러 방법들을 조합해서 데이터 증강을 한다.
어떤 조합이 성능을 가장 좋게 만들까?

RandAugment

증강 방법들의 여러 조합을 사용해보고 가장 좋은 조합을 찾아내는 방법으로 최근에 많이 사용되는 방법이다.


참조

  • BoostCamp AI Tech
profile
데이터로 문제를 해결하는 엔지니어를 꿈꿉니다.
post-custom-banner

0개의 댓글