Data Normalization이란?

Junghyeon Song·2021년 12월 1일
0

Data Normalization

아래 그래프를 보면, 상대적으로 작은 범위의 Feature는 범위가 큰 쪽에 비해 변화가 잘 보이지 않습니다.
이런 경우 모델은 범위가 더 큰 Feature를 중요하게 보게 됩니다.
이 데이터의 변화에 중요한 것은 범위가 큰 Feature라고 보고 가중치가 편향되는 것입니다.

  • Data의 Feature 별 Scale(범위) 차이가 큰 경우 나타날 수 있는 문제
    (예시: 집의 방 개수 (1~20)와 지어진 시기(0~100))

각 Feature를 동일한 중요도로 판단할 수 있도록, 범위를 비슷하게 변환해주는 것이 Data Normalization입니다.

  • 각 Feature를 0~1 범위로 동일하게 Normaliztion한 결과

0개의 댓글