데이터 증강(Data Augmentation)이란 무엇이며, 이미지 데이터에서 주로 사용하는 증강 기법에는 어떤 것들이 있나요?
데이터 증강(Data Augmentation)은 기존의 학습 데이터를 변형하여 새로운 학습 데이터를 만들어내는 기법이다. 딥러닝 모델은 많은 데이터를 필요로 하지만, 충분한 양의 데이터를 확보하기 어려운 경우가 많다.
데이터 증강을 활용하면 기존 데이터를 다양하게 변형하여 모델의 일반화 성능을 향상시킬 수 있다. 이를 통해 과적합(overfitting)을 방지하고, 모델이 특정 패턴에 치우치지 않도록 도움을 준다.
1) 수평/수직 뒤집기(Flip)
이미지를 좌우 또는 상하로 뒤집어 새로운 이미지를 만든다.
2) 회전(Rotation)
이미지를 랜덤한 각도로 회전시켜 다양한 각도의 이미지를 만든다.
3) 이동(Translation/Shift)
이미지를 상하좌우로 일정 픽셀만큼 이동시킨다.
4) 확대/축소(Scaling/Zoom)
이미지의 크기를 확대하거나 축소한다.
1) 밝기 조절(Brightness)
이미지의 밝기를 조절한다.
2) 대비 조절(Contrast)
이미지의 명암 대비를 조절한다.
3) 채도(Saturation) & 색조(Hue) 조절
이미지 색상의 농도나 색조를 조절한다.
이미지에 랜덤한 노이즈를 추가하여, 모델이 깨끗한 데이터뿐만 아니라 노이즈가 포함된 데이터도 잘 인식할 수 있도록 학습한다.
1) Gaussian Noise
정규 분포를 따르는 랜덤한 노이즈를 추가한다.
2) Salt and Pepper Noise
랜덤한 픽셀을 흰색(소금) 또는 검은색(후추)으로 변경한다.
3) Motion Blur
카메라가 움직이는 듯한 블러 효과를 적용한다.
이러한 데이터 증강 기법들은 이미지 데이터의 다양성을 증가시키고, 모델이 보다 일반적인 특징을 학습하도록 돕는 중요한 역할을 한다.