Data augmentation

박광욱·2023년 8월 4일
0

Image Segmentation

목록 보기
5/6

📕 Data augmentation

  • Data augmentation는 갖고 있는 데이터셋을 여러 가지 방법으로 augment하여 실질적인 학습 데이터셋의 규모를 키울 수 있는 방법입니다.
  • 이때 새로운 데이터는 원본 데이터의 특성을 잘 반영하고 있어야 합니다.

📗 Why?

  • 데이터에 대한 접근이 쉬워졌음에도 일부 데이터는 여전히 구하기 어렵기 때문입니다.
  • 적은 훈련 세트에 대해 학습을 시키면 훈련 세트에 대해 과하게 학습되어
    테스트 세트에서의 정확도가 떨어질 수 있습니다.
  • 특정 클래스에 대한 훈련 데이터가 적을 때 발생하는 문제입니다.

📘 How?

  • 랜덤하게 이미지를 자르기
  • 회전
  • 밝기 조절
  • 블러 처리
  • 노이즈 삽입
  • ...

📙 Data augmentation Code

import random
import numpy as np
import os
import cv2
import glob
from PIL import Image
import PIL.ImageOps    

#다음 변수를 수정하여 새로 만들 이미지 갯수를 정합니다.
num_augmented_images = 50

file_path = '/set/your/directory/'
file_names = os.listdir(file_path)
total_origin_image_num = len(file_names)
augment_cnt = 1

for i in range(1, num_augmented_images):
    change_picture_index = random.randrange(1, total_origin_image_num-1)
    print(change_picture_index)
    print(file_names[change_picture_index])
    file_name = file_names[change_picture_index]
    
    origin_image_path = '/set/your/directory/' + file_name
    print(origin_image_path)
    image = Image.open(origin_image_path)
    random_augment = random.randrange(1,4)
    
    if(random_augment == 1):
        #이미지 좌우 반전
        print("invert")
        inverted_image = image.transpose(Image.FLIP_LEFT_RIGHT)
        inverted_image.save(file_path + 'inverted_' + str(augment_cnt) + '.png')
        
    elif(random_augment == 2):
        #이미지 기울이기
        print("rotate")
        rotated_image = image.rotate(random.randrange(-20, 20))
        rotated_image.save(file_path + 'rotated_' + str(augment_cnt) + '.png')
        
    elif(random_augment == 3):
        #노이즈 추가하기
        img = cv2.imread(origin_image_path)
        print("noise")
        row,col,ch= img.shape
        mean = 0
        var = 0.1
        sigma = var**0.5
        gauss = np.random.normal(mean,sigma,(row,col,ch))
        gauss = gauss.reshape(row,col,ch)
        noisy_array = img + gauss
        noisy_image = Image.fromarray(np.uint8(noisy_array)).convert('RGB')
        noisy_image.save(file_path + 'noiseAdded_' + str(augment_cnt) + '.png')
        
    augment_cnt += 1

Reference

https://yonsodev.tistory.com/34
https://hipolarbear.tistory.com/19#%5B%EC%BD%94%EB%93%9C%20%EB%B3%B4%EA%B8%B0%5D-1

profile
Vancouver

0개의 댓글