Image classification위주의 내용이다.
(1)Weight의 작은 변화에 덜 민감해진다
*출처: https://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture7.pdf
(2)효율적인 Optimization을 위해 필요하다
1.1에 제시한 상황의 경우 gradient descent가 굉장히 비효율적으로 업데이트 된다
data distribution의 center는 0이 되도록 하는 것을 권장함(zero centering)
어떻게 해결해야하는가?
: 모든 데이터포인트에서 데이터의 평균값을 빼주면 된다.
NN, Normalize는 필수
또한 NN이라는 모델 자체가 데이터의 정규성을 기본 전제로 하기에 normalize도 해주어야한다. computer vision 데이터도 예외가 아님
*출처: https://cs231n.stanford.edu/slides/2017/cs231n_2017_lecture6.pdf
*출처:https://cs231n.stanford.edu/slides/2020/lecture_8.pdf
*출처:https://cs231n.stanford.edu/slides/2020/lecture_8.pdf
Translation in Variance