머신러닝 전처리

HJ Koo·2022년 1월 12일
0

AI

목록 보기
4/10

전처리 Preprocessing

넓은 범위의 데이터를 정제 시키는 것을 말한다. 러닝머신의 성능을 높이기 위한 사전 작업인 것이다.

전처리 작업으로는 정규화 Normalization 작업과 표준화 Standardization 작업이 있다.

  • 정규화 Normalization 기준이 다른 데이터를 0 ~ 1 사이로 만들어 값을 비교한다. (100점 만점인 시험, 200점 만점인 시험 비교)
  • 표준화 Standardization 데이터의 분포를 정규분포로 바꿔준다. 데이터의 평균이 0이 되게 하고 표준편차를 1이 되도록 만들어 준다.

오리지널 그래프에서
→ 데이터의 평균을 0으로 만들어주면 데이터의 중심이 0에 맞춰지게(Zero-centered) 된다.
→ 다음 표준편차를 1로 만들어 주면 데이터가 예쁘게 정규화(Normalized) 된다

이렇게 표준화를 시키게 되면 학습 속도(최저점 수렴 속도) 빠르고, Local minima(극소값)에 빠질 가능성이 적다.

두 방법 중에 한가지를 사용해서 답을 도출하면 된다.

profile
날마다 꾸준히 성장하는 Software Engineer

0개의 댓글