카메라에 의해 찍힌 사진들은 실제 데이터와 같지 않다.
즉, 이미지는 실제 세상의 데이터를 모두 표현하지 못한다.
심지어 사진 기법 등의 원인으로 편향되기까지 해서 적절한 추론을 못하게 된다.
예로 밝은 사진만 학습시키면 어두운 사진은 추론하지 못한다.
위의 문제를 해결하기 위해 데이터를 증강시킨다.
실제 데이터 분포처럼 학습 데이터를 만들자.
OpenCV 와 NumPy 에 데이터 증강과 관련된 함수들이 많다.
이미지의 일부를 확대시키는 방법
간단하지만 강력한 성능 향상 가능
이미지를 shear transformation 하는 방법
여러 이미지를 자르고 합치는 방법
이외에 Brightness, Rotate 등의 방법들이 있다.
일반적으로는 하나의 방법만 사용하지 않고 여러 방법들을 조합해서 데이터 증강을 한다.
어떤 조합이 성능을 가장 좋게 만들까?
증강 방법들의 여러 조합을 사용해보고 가장 좋은 조합을 찾아내는 방법으로 최근에 많이 사용되는 방법이다.
BoostCamp AI Tech