파이썬 기초: Pandas 기초

Young Hwan Kim·2025년 11월 3일

판다스(pandas)란?

  • Pandas = Python Data Analysis Library
  • Python에서 데이터 분석과 처리를 쉽게 할 수 있게 도와주는 라이브러리
  • 표(테이블) 형태의 데이터를 다루는 데 특화된 도구
  • 엑셀처럼 행(Row)과 열(Column) 구조를 사용
  • 데이터 불러오기, 정리, 가공, 분석, 저장까지 한 번에 가능

pandas로 할 수 있는 일

기능설명엑셀과 비교
데이터 읽기CSV, 엑셀, DB 등에서 데이터 불러오기“엑셀 파일 열기”
데이터 정리결측값(NaN) 제거, 중복 제거, 필터링“필터/정렬”
데이터 가공열 추가/삭제, 계산, 그룹화“수식, 피벗테이블”
데이터 분석합계, 평균, 통계 계산“함수 SUM, AVERAGE”
데이터 내보내기엑셀, CSV, DB로 내보내기“다른 이름으로 저장”

장점

✅ 엑셀보다 빠르고 대용량 데이터 처리 가능
✅ 반복 작업을 코드로 자동화
✅ Python 생태계(NumPy, Matplotlib, scikit-learn 등)와 완벽 호환
✅ 데이터 분석, 통계, 머신러닝 기초로 필수


1. 데이터 불러오기

import pandas as pd

# CSV 파일 읽기
df = pd.read_csv("sales.csv")

# Excel 파일 읽기
df = pd.read_excel("data.xlsx", sheet_name="Sheet1")
력하세요

2. 자주 쓰는 기능

profile
Back-End DEVELOPER ☁️

0개의 댓글