
기존 데이터셋을 변형하여 추가적인 학습 데이터를 생성하는 기법
데이터에 약간의 노이즈 를 추가하거나, 데이터를 회전, 확대/축소, 반전 등의 방법으로 원본 데이터와는 조금 다른 새로운 데이터를 만드는 것을 말한다.
데이터 부족 문제 해결 : 딥러닝과 같은 복잡한 모델을 학습시킬 때 충분한 양의 학습 데이터가 필요. 추가적인 데이터를 수집하지 않고도 학습 데이터를 확장할 수 있다.
오버피팅 방지 : 다양한 변형을 가진 데이터로 학습을 시키면 모델이 더 일반적인 특징을 학습하게 된다.
데이터 다양성 증가 : 현업의 데이터는 항상 예측할 수 있는 다양성을 가지고 있다. Data Augmentation을 통해 다양성을 재현할 수 있다.