넓은 범위의 데이터를 정제 시키는 것을 말한다. 러닝머신의 성능을 높이기 위한 사전 작업인 것이다.
전처리 작업으로는 정규화 Normalization 작업과 표준화 Standardization 작업이 있다.
오리지널 그래프에서
→ 데이터의 평균을 0으로 만들어주면 데이터의 중심이 0에 맞춰지게(Zero-centered) 된다.
→ 다음 표준편차를 1로 만들어 주면 데이터가 예쁘게 정규화(Normalized) 된다
이렇게 표준화를 시키게 되면 학습 속도(최저점 수렴 속도) 빠르고, Local minima(극소값)에 빠질 가능성이 적다.
두 방법 중에 한가지를 사용해서 답을 도출하면 된다.