- Data augmentation는 갖고 있는 데이터셋을 여러 가지 방법으로 augment하여 실질적인 학습 데이터셋의 규모를 키울 수 있는 방법입니다.
- 이때 새로운 데이터는 원본 데이터의 특성을 잘 반영하고 있어야 합니다.
- 데이터에 대한 접근이 쉬워졌음에도 일부 데이터는 여전히 구하기 어렵기 때문입니다.
- 적은 훈련 세트에 대해 학습을 시키면 훈련 세트에 대해 과하게 학습되어
테스트 세트에서의 정확도가 떨어질 수 있습니다.- 특정 클래스에 대한 훈련 데이터가 적을 때 발생하는 문제입니다.
- 랜덤하게 이미지를 자르기
- 회전
- 밝기 조절
- 블러 처리
- 노이즈 삽입
- ...
import random
import numpy as np
import os
import cv2
import glob
from PIL import Image
import PIL.ImageOps
#다음 변수를 수정하여 새로 만들 이미지 갯수를 정합니다.
num_augmented_images = 50
file_path = '/set/your/directory/'
file_names = os.listdir(file_path)
total_origin_image_num = len(file_names)
augment_cnt = 1
for i in range(1, num_augmented_images):
change_picture_index = random.randrange(1, total_origin_image_num-1)
print(change_picture_index)
print(file_names[change_picture_index])
file_name = file_names[change_picture_index]
origin_image_path = '/set/your/directory/' + file_name
print(origin_image_path)
image = Image.open(origin_image_path)
random_augment = random.randrange(1,4)
if(random_augment == 1):
#이미지 좌우 반전
print("invert")
inverted_image = image.transpose(Image.FLIP_LEFT_RIGHT)
inverted_image.save(file_path + 'inverted_' + str(augment_cnt) + '.png')
elif(random_augment == 2):
#이미지 기울이기
print("rotate")
rotated_image = image.rotate(random.randrange(-20, 20))
rotated_image.save(file_path + 'rotated_' + str(augment_cnt) + '.png')
elif(random_augment == 3):
#노이즈 추가하기
img = cv2.imread(origin_image_path)
print("noise")
row,col,ch= img.shape
mean = 0
var = 0.1
sigma = var**0.5
gauss = np.random.normal(mean,sigma,(row,col,ch))
gauss = gauss.reshape(row,col,ch)
noisy_array = img + gauss
noisy_image = Image.fromarray(np.uint8(noisy_array)).convert('RGB')
noisy_image.save(file_path + 'noiseAdded_' + str(augment_cnt) + '.png')
augment_cnt += 1
https://yonsodev.tistory.com/34
https://hipolarbear.tistory.com/19#%5B%EC%BD%94%EB%93%9C%20%EB%B3%B4%EA%B8%B0%5D-1