전처리&시각화 2-2,3-1세션 (1) - 데이터 시각화의 이해

SEHEE·2025년 6월 18일
0

⭐헷갈린 개념

❤개념

  1. 데이터 시각화란
  • 숫자와 텍스트로 이루어진 데이터를 차트, 그래프, 지도 등의 시각적 요소로 표현하는 과정
  • 탐색적 데이터 분석(EDA) = 데이터 탐정 작업
    :새로운 데이터셋을 받았을때, 분석과 모델링 전 데이터에 대해 파악하는 과정
    • DA(Exploratory Data Analysis)의 주요 목표:
      • 📊 데이터의 구조와 특성 파악: "이 데이터는 무엇을 담고 있나?"
      • 🔍 숨겨진 패턴과 관계 발견: "변수들 사이에 어떤 관련성이 있나?"
      • ⚠️ 데이터 품질 문제 탐지: "결측치, 이상치, 오류는 없나?"
      • 💡 분석 방향성 설정: "어떤 분석을 해야 할까?"
    • EDA에서 시각화의 역할
      -데이터 분포 파악( 히스토그램, 박스 플롯 )
      • 변수 간의 관계 발견( 산점도, 상관관계 히트맵 )
      • 이상치 탐지
      • 결측치 패턴 확인
      • 가설 생성과 검증을 지원
    • EDA 과정의 예시
      • 만약 학급 학생들의 시험 성적 데이터를 분석한다면:
    1. 첫 번째 질문: "성적이 어떻게 분포되어 있을까?" → 히스토그램으로 확인
    2. 두 번째 질문: "수학 성적과 과학 성적 사이에 관련이 있을까?" → 산점도로 확인
    3. 세 번째 질문: "특별히 점수가 높거나 낮은 학생이 있을까?" → 박스플롯으로 이상치 탐지
    4. 네 번째 질문: "일부 학생의 성적이 누락되어 있나?" → 결측치 패턴 확인
      => 이처럼 EDA는 데이터와 친해지는 과정이며, 시각화는 이 과정에서 가장 강력한 도구입니다.
profile
안녕하세요! 마케터를 꿈꾸는 취준생입니다 :)

0개의 댓글