Data Augmentation(데이터 증강)

탱구리·2026년 1월 10일

딥러닝

목록 보기

5/6

Data Augmentation(데이터 증강)은 Regularization(정규화)와 마찬가지로 overfitting 문제를 해결하는 방법이다. 다양한 유형의 학습 이미지 데이터 양을 늘리면 과적합 문제를 해결할 수 있다.

	Regularization	Data Augmentation
개입 대상	모델	데이터
방식	loss/weight에 제약	input을 변경

과하면 semantic 정보가 깨질 수 있어 (예: 숫자 6에 blur을 너무 많이 넣으면 0처럼 보일 수 있음) 강도를 조절하는 하이퍼파라미터가 중요하다.

cutout
- 이미지 일부를 사각형 모양으로 검은색을 칠해버리는 기법 (해당 영역을 0으로 채워 넣음)
- 이미지의 덜 중요한 부분까지 집중하게 유도
- 특정 부분에 의존하지 않고 전체 context를 보게 만듦
- 객체 일부가 가려져도 인식 가능하도록 유도
mixup
cutmix
- cutout + mixup
- A 이미지에서 box를 쳐서 지운 다음 그 빈 영역을 B 이미지로부터 patch를 추출하여 집어넣음
- patch의 면적의 비례하여 label을 섞어줌
augmix
- 한 장의 이미지에 여러 augmentation 기법들을 직렬/병렬로 연결한 뒤 원본과 다시 섞음

Reference

https://docs.ultralytics.com/ko/guides/yolo-data-augmentation/

https://m.blog.naver.com/phj8498/222350485491