[내일배움캠프] 데이터 전처리 & 시각화 기초 (1)

셔닝🧸·2025년 6월 9일
0

오늘의 학습

  1. 데이터 전처리
  2. 🐼 Pandas 라이브러리

[🔥 데이터 분석을 위한 목표]
☑️ Pandas를 활용해 간단하게 데이터 전처리
☑️ Matplotlib을 활용해 데이터 시각화

⭐️ 데이터 전처리 & 시각화 배우기 전에 어떤 목적을 가지고 분석할 것인지 정의
1️⃣ 목표 설정 : 무엇을 위해 전처리 & 시각화를 하는지
2️⃣ 예산 산출물 정의 : 데이터 전처리 & 시각화 진행 후 결과물 예상
3️⃣ As-is vs To-be 생각 : 현재 문제와 상황을 인지하고 개선 방안을 생각하며 분석 방향성 설정


  1. 데이터 전처리

데이터 전처리 = 원본 데이터를 목적에 맞게 정리하고 변환하는 과정

➖ 원본 데이터가 원하는 형태로 구축되어 있지 않은 경우
➖ 데이터 전처리 전 목적과 방향성 설정 후 그 목적을 달성하기 위해 데이터 전처리


  1. 🐼 Pandas 라이브러리

⭐️ 엑셀 대신 파이썬 판다를 이용하는 이유

1️⃣ 자동화 & 프로그래밍 기능
2️⃣ 대용량 데이터 처리
3️⃣ 복잡한 데이터 처리 및 분석
4️⃣ 확장성과 유연성
5️⃣ 버전 관리 및 자동화

Pandas: 파이썬에서 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리

➖ pandas 구조

  • Series: 컬럼 하나로 이뤄진 구조
  • DataFrame: 컬럼 여러 개로 이뤄진 구조
profile
어떻게든 하겠숴여...❕

0개의 댓글