Standardization
Z-score
- 딥러닝 회귀(regression) 문제에서 데이터의 최대, 최소를 알 수 없을때 표준화 방법을 사용함
- 데이터의 최대/최소를 몰라도 각 feature의 평균을 0으로 만든 후, 표준편자를 1로 만들어 데이터 범위에 상관 없이 표준화 가능
- 데이터가 정규분포를 따르는 경우에 효과적이고, 그렇지 않은 경우에는 회구문제에도 적용할 수 있음
z=σx−μ
Min-Max Normalization(최대-최소 정규화)
- 데이터의 최소/최대 값을 알고 적용해야 함. 새로운 데이터의 포인트가 기존 데이터 범위 밖에 있으면 제대로 작동하지 않을 수 있음
x′=max(x)−min(x)x−min(x)
Robust Sacler
- 최데/최소 값이 필요 없고, 이상치(outlier)에 덜 민감하기 때문에 데이터 이상치가 많은 경우에 유용함
x′=IQRx−median
IQR = interquartile range(Q3-Q1, 3분위수-1분위수)