Min-Max 정규화와 Max 정규화는 데이터의 스케일을 조정하는 방법으로, 머신 러닝 모델의 성능을 향상시키기 위해 자주 사용됩니다.
보통 Min-Max 정규화가 주로 사용되지만 어떠한 경우에 Max 정규화가 필요할까요?
Min-Max Normalization
Min-Max 정규화는 데이터를 특정 범위로 조정하는 방법입니다. 일반적으로 0과 1 사이로 조정합니다. 이 방법은 데이터의 최소값을 0으로, 최대값을 1로 맞추고 나머지 값들을 비례적으로 변환합니다.

Max Normalization
Max 정규화는 데이터의 최대값을 기준으로 데이터를 정규화하는 방법입니다. 이 방법에서는 모든 값을 데이터의 최대값으로 나누어 범위를 0과 1 사이로 맞춥니다.

차이점
범위
Min-Max 정규화는 데이터의 최소값과 최대값을 0과 1로 맞추지만, Max 정규화는 최대값을 1로 맞춥니다.
변화량
Min-Max 정규화는 모든 데이터의 범위가 동일하게 변하지만, Max 정규화는 각 값이 최대값에 대해 상대적으로 변합니다.
Max 정규화가 유리한 Case
특정 피처의 상대적인 크기만 중요할 때
- 데이터에서 각 피처의 상대적인 크기만 중요하고, 절대적인 범위가 크게 중요하지 않을 때 유용합니다. 예를 들어, 어떤 값이 전체에서 차지하는 비율이 중요할 때 사용할 수 있습니다.
스파스 데이터(sparse data)
- 데이터의 대부분 값이 0이고, 소수의 큰 값이 있는 경우 Max 정규화가 효과적일 수 있습니다. 이러한 경우 Min-Max 정규화는 극단적인 값들에 의해 왜곡될 수 있습니다.
빠르게 변화하는 데이터
- 데이터가 지속적으로 빠르게 변화하는 환경에서 최대값에 대해 상대적으로 정규화하는 것이 더 유용할 수 있습니다. 예를 들어, 실시간으로 변하는 센서 데이터나 주식 가격 등에서 사용할 수 있습니다.
계산의 간소화
- Max 정규화는 계산이 간단하여 빠르게 처리할 수 있습니다. 따라서 계산 자원이 제한된 환경에서 유리할 수 있습니다.