[🔥 데이터 분석을 위한 목표]
☑️ Pandas를 활용해 간단하게 데이터 전처리
☑️ Matplotlib을 활용해 데이터 시각화
⭐️ 데이터 전처리 & 시각화 배우기 전에 어떤 목적을 가지고 분석할 것인지 정의
1️⃣ 목표 설정 : 무엇을 위해 전처리 & 시각화를 하는지
2️⃣ 예산 산출물 정의 : 데이터 전처리 & 시각화 진행 후 결과물 예상
3️⃣ As-is vs To-be 생각 : 현재 문제와 상황을 인지하고 개선 방안을 생각하며 분석 방향성 설정
❓ 데이터 전처리 = 원본 데이터를 목적에 맞게 정리하고 변환하는 과정
➖ 원본 데이터가 원하는 형태로 구축되어 있지 않은 경우
➖ 데이터 전처리 전 목적과 방향성 설정 후 그 목적을 달성하기 위해 데이터 전처리
⭐️ 엑셀 대신 파이썬 판다를 이용하는 이유
1️⃣ 자동화 & 프로그래밍 기능
2️⃣ 대용량 데이터 처리
3️⃣ 복잡한 데이터 처리 및 분석
4️⃣ 확장성과 유연성
5️⃣ 버전 관리 및 자동화
❓ Pandas: 파이썬에서 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리
➖ pandas 구조
