간단한 EDA와 시각화

HONG LEE ·2024년 6월 12일
post-thumbnail

탐색적 데이터 분석(Exploratory Data Analysis, EDA)는 데이터의 시각화, 기술통계 등의 방법을 통해 데이터를 이해하고 탐구하는 과정입니다.

아래 간단하게 EDA를 어떻게 진행하는지 시각화 방법과 함께 설명드리겠습니다.

  1. .describe (데이터 확인하기)
  2. counterplot : x축은 범주형, y축은 해당 범주의 count
  3. barplot: x축은 범주형, y축은 연속형 값 (기본값으로 평균값이 나옴)
  4. boxplot: x축은 범주형, y축은 연속형 값
  5. histplot: x축 연속형 값, y축은 count (bins = ?? 를 통해 막대 범위를 정할 수 있음)
  6. scatterplot: x, y 모두 수치형 변수
  7. pairplot: 수치형의 모든 데이터를 가지고 그래프를 그려줌.

0개의 댓글