입력 이미지의 가로세로 해상도를 일정한 크기로 변환하는 전처리 과정
→ 딥러닝 모델이 처리할 수 있는 고정된 입력 형태를 만듦
(이미지 크기를 늘릴 수도, 줄일 수도 있음)
딥러닝 모델(특히 CNN)은 입력 텐서의 크기가 고정되어 있어야 배치 구성이 원활하다.
이미지 크기가 다 다르면 배치 구성도 어렵고 학습도 어렵다.
학습 속도 향상과 자원 효율성 확보를 위함이다.
이미지 해상도가 클수록 연산량과 메모리 사용량이 급격히 증가하기 때문이다.
안정적으로 특징을 추출하기 위함이다.
이미지 크기를 통일해야 동일한 객체나 패턴이 일관된 스케일로 표현된다.
이미지의 픽셀 값을 일정한 범위나 분포로 변환하는 과정
보통은 0~1 사이의 값으로 조정(스케일링)한다.
픽셀 값의 스케일이 크거나 불균형하면 학습 과정에서 기울기에 불안정해질 수 있다. 정규화를 통해 값의 분포를 균일하게 만들어 학습 안정성을 향상시킬 수 있다.
어떠한 특정 값이 과도한 영향을 미치는 것을 방지할 수 있다. 이렇게 정규화는 성능 유지에도 도움이 된다.
리사이징과 정규화는 모델이 이미지를 수치적으로, 안정적으로 잘 학습할 수 있게 돕는 전처리 과정이다.
따라서 두 과정은 딥러닝 기반 이미지 모델에서 선택이 아닌 필수라고 할 수 있다.