Data Preprocessing & Augmentation

조유솔·2024년 8월 15일

ML LifeCycle

Image classification위주의 내용이다.

데이터 전처리(Data Preprocessing)

Zero-centering & Normalization

모든 입력값이 양수인 데이터에서 sigoid activation function을 사용하는 경우: upstream gradient의 부호가 바뀌지 않고 downstream gradient에 그대로 반영된다는 문제가 있음

Why Zero-centering

(1)Weight의 작은 변화에 덜 민감해진다
*출처: https://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture7.pdf

(2)효율적인 Optimization을 위해 필요하다

1.1에 제시한 상황의 경우 gradient descent가 굉장히 비효율적으로 업데이트 된다
- optimal path를 따라가지 않고 아래처럼 지글지글하게(?) 지그재그식으로 왔다갔다- 하게 됨
  *출처:https://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture6.pdf
data distribution의 center는 0이 되도록 하는 것을 권장함(zero centering)
어떻게 해결해야하는가?
: 모든 데이터포인트에서 데이터의 평균값을 빼주면 된다.

NN, Normalize는 필수
또한 NN이라는 모델 자체가 데이터의 정규성을 기본 전제로 하기에 normalize도 해주어야한다. computer vision 데이터도 예외가 아님
*출처: https://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture6.pdf