[Data Analysis] 4. Box-Cox Transformation

Fly High!·2020년 8월 22일
0

Data Analysis

목록 보기
4/17
post-thumbnail

1. Box-Cox Transformation

  • 데이터를 정규분포에 가깝게 만들거나 데이터의 분산을 안정화하는 것

  • 정규성을 가정한 분석법을 적용하기에 앞서 데이터의 전처리에 사용

    비대칭의 분포를 대칭으로 변환

    import numpy as np
    
    data['new_variable'] = np.log10(data.variable) # Box-Cox Transformation
    data['new_variable'] = np.sqrt(data.variable) # sprt : square root
    data['new_variable'] = 1 / data.variable # inverse

    변화 정도는 log가 root에 비해 크기 때문에 통상적으로 log를 더 많이 씀

profile
Back-end, Python, Data

0개의 댓글