데이터 정규화를 하는 이유는 특정 변수에 대해서 편향성을 가지지 않도록 하기 위함이다. 특정 변수 값이 단위가 10억이고, 다른 변수의 값이 0~10 이라면 학습과정에서 10억단위를 가지는 변수가 더 큰 영향을 가질수 있습니다. 이처럼 모든 변수가 동일한 영향력을 끼칠수 있도록 하는 것이 데이터 정규화라고 생각합니다.
그 방법으로는 표준 정규화와 최대 최소 정규화 방법이 있습니다.
정규화를 왜 해야할까요? 정규화의 방법은 무엇이 있나요?