판다스(Pandas)는 파이썬에서 데이터 분석을 위한 라이브러리입니다. 판다스는 다양한 데이터 구조를 제공하며, 다양한 데이터 처리 기능을 제공합니다.
import pandas as pd
판다스 라이브러리를 불러옴
pd.read_csv
pd.read_csv() 함수는 CSV 파일을 읽어 판다스 DataFrame으로 변환하는 함수입니다.
df = pd.read_csv("data.csv")
data.csv 파일을 읽어 판다스 DataFrame으로 변환합니다.
head()
tail()
head() 함수는 DataFrame의 처음 몇 개 행을 반환하는 함수입니다.
tail() 함수는 DataFrame의 마지막 몇 개 행을 반환하는 함수입니다.
info() 함수는 DataFrame의 정보를 요약하여 반환하는 함수입니다.
df.info()
DataFrame의 열 이름, 데이터 타입, null 값의 개수 등을 반환합니다.
index 속성은 DataFrame의 인덱스를 반환합니다.
df.index
DataFrame의 인덱스를 반환합니다.
columns 속성은 DataFrame의 열 이름을 반환합니다.
df.columns
DataFrame의 열 이름을 반환합니다.
rename() 메서드는 DataFrame의 열 이름을 바꾸는 메서드입니다.
Series는 1차원 배열과 유사한 데이터 구조입니다.
s = pd.Series([1, 2, 3, 4, 5])
위 코드는 1차원 배열을 Series로 변환합니다.
date_range() 함수는 날짜 범위를 생성하는 함수입니다.
pd.date_range("2023-07-01", "2023-07-31")
2023년 7월 1일부터 7월 31일까지의 날짜 범위를 생성합니다.
describe() 메서드는 DataFrame의 통계 정보를 요약하여 반환하는 메서드입니다.
df.describe()
DataFrame의 평균, 표준편차, 최솟값, 최댓값 등의 통계 정보를 반환합니다.