EDA & Feature Engineering

Nayeon Bae·2023년 6월 26일

Data

목록 보기
1/4
  1. EDA는 무엇인가?
  • EDA는 본격적으로 분석에 들어가기에 앞서 데이터에 대해 뜯어보는 과정 -> 시각화, 통계치 활용할 수 있음

  • EDA가 왜 필요하지?
    EDA없이 바로 분석에 들어가는 것은 재료에 대해 살펴보지 않고 요리를 하는 것
    우리가 분석을 하는 이유는 데이터 안에서 유의미한 Insight를 얻기 위함인데, 데이터에 대한 이해 없이 이러한 목적을 달성할 수 없음
    +) 문제 정의 과정이나 데이터 수집 과정에서 발견하지 못했던 문제들을 발견할 수 있음 (GIGO랑 연결)

  1. Feature Engineering
    수학적인 연산과 도메인 지식을 활용하여 raw data로부터 유용한 feature를 도출해내는 과정 or 주어진 column들을 재조합하여 의미있는 feature를 만들어내는 과정
profile
데이터에 윤리를 내장하는 데이터 사이언티스트를 꿈꾸다

0개의 댓글