EDA, Feature Engineering, Data Preprocessing

chang·2021년 1월 4일
0
  • EDA

    데이터를 접했을 때 이를 다루기 위해 데이터를 살펴보는 것
    dimension 확인 ,변수별 타입 확인, 결측치 확인, 시각화를 통한 데이터 분포 확인 등 데이터에 대한 정보를 얻는 과정

  • 데이터 전처리

    분석에 도움될 수 있는 방향으로 데이터를 좀 더 가치있게 바꾸는 작업
    결측치 대치, 이상치 처리, Feature Engineering {변수 변환, 변수 범주화, 더미 변수 생성, 파생변수 생성 등} 등 데이터에 처리를 가해 분석하기에 더 나은 데이터로 바꾸는 과정

  • Feature Engineering

    데이터 전처리 기법 중 하나
    변수를 변환하거나 새로운 변수를 생성하는 등의 과정을 통해 유의미한 변수로 만들어내는 것

데이터를 만나면
EDA를 통해 데이터를 이리저리 보며 정보를 얻고
전처리를 통해 좀 더 나은 분석을 위해 데이터를 가꾸며
이 때 Feature Engineerig과 같이 변수를 더 유의미한 변수로 바꾸는 등의 작업을 거치게 된다.

0개의 댓글