이미지를 모델에 입력하기 전에 리사이징(Resizing)과 정규화(Normalization)를 하는 이유는 무엇인가요?
리사이징(Resizing)과 정규화(Normalization)는 이미지를 딥러닝 모델에 입력하기 전에 수행하는 대표적인 전처리 과정이다.
 
리사이징(Resizing)은 원본 이미지의 크기를 특정한 크기로 조정하는 과정이다. 모든 입력 이미지의 크기를 통일할 때 사용한다.
딥러닝 모델은 고정된 크기의 입력을 받도록 설계되므로, 다양한 크기의 이미지를 일관된 형태로 맞춰야 한다. 예를 들어, VGG나 ResNet과 같은 사전 학습된 모델은 일반적으로 224x224 크기의 이미지를 입력으로 받는다.
같은 물체라도 크기가 다르면 모델이 일관된 특징을 추출하지 못할 가능성이 크기 때문에, 리사이징을 통해 모델이 안정적으로 패턴을 학습할 수 있도록 돕는다.
 
정규화는 이미지의 픽셀 값(보통 0~255 범위)을 일정한 범위로 조정하는 과정이다. 가장 일반적인 방법은 Min-Max normalization이다.

Min-Max normalization은 모든 데이터가 0 ~ 1 사이의 값을 가지도록 하는 정규화 방법이다. 최대값은 1, 최소값은 0으로 데이터의 범위를 조정하는 것이다. 위 공식을 한국어로 풀면 다음과 같다.

정규화를 거치면 모델이 더 안정적으로 학습할 수 있으며, 특히 기울기 소실(vanishing gradient) 문제를 완화하는 데 도움이 된다. 또한, 정규화를 통해 데이터의 분포를 일정하게 맞춰주면 모델이 특정 값 범위에 편향되지 않고 더 효과적으로 특징을 학습할 수 있다.
정리하면, 리사이징과 정규화를 거치면 모델에 일관성 있는 데이터를 입력할 수 있다. 즉, 모든 이미지를 동일한 크기와 픽셀 값 범위로 맞춰주면, 모델이 데이터의 크기나 스케일 차이에 영향을 받지 않고 일관되게 학습할 수 있는 것이다.
또한, 고정된 입력 크기로 모델의 연산 부담을 줄이고, 처리 속도를 높일 수 있다는 것도 장점이다.