[AI] Normalization (concept)

JAsmine_log·2024년 9월 21일
1

Standardization

Z-score

  • 딥러닝 회귀(regression) 문제에서 데이터의 최대, 최소를 알 수 없을때 표준화 방법을 사용함
  • 데이터의 최대/최소를 몰라도 각 feature의 평균을 0으로 만든 후, 표준편자를 1로 만들어 데이터 범위에 상관 없이 표준화 가능
  • 데이터가 정규분포를 따르는 경우에 효과적이고, 그렇지 않은 경우에는 회구문제에도 적용할 수 있음
z=xμσz=\frac{x-\mu}{\sigma}

Min-Max Normalization(최대-최소 정규화)

  • 데이터의 최소/최대 값을 알고 적용해야 함. 새로운 데이터의 포인트가 기존 데이터 범위 밖에 있으면 제대로 작동하지 않을 수 있음
x=xmin(x)max(x)min(x)x\prime=\frac{x-min(x)}{max(x)-min(x)}

Robust Sacler

  • 최데/최소 값이 필요 없고, 이상치(outlier)에 덜 민감하기 때문에 데이터 이상치가 많은 경우에 유용함
x=xmedianIQRx\prime=\frac{x-median}{IQR}

IQRIQR = interquartile range(Q3-Q1, 3분위수-1분위수)

profile
Everyday Research & Development

0개의 댓글