import pandas as pd
pd.read_csv(경로, 인코딩)
read_파일형식
을 지정하면 됨.columns
: column의 이름을 조회할 수 있음CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: "구별"}, inplace=True)
inplace
값을 True
로 주어야 함pd.read_excel(경로, header=2, usecols="B, D, G, J, N")
header
: 자료를 읽기 시작할 행usecols
: 읽어올 엑셀의 컬럼.head()
.tail()
pandas의 데이터형을 구성하는 기본은 series
a = pd.series([1, 2, 3])
날짜, 시간 이용
dates = pd.date_range("20130101", periods=6)
pandas에서 가장 많이 사용되는 데이터형은 DataFrame
이고 index와 columns를 지정
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=["A", "B", "C", "D"])
head()
.index, .columns, .values
.info()
DataFrame
의 기본정보 확인.describe()
DataFrame
의 통계적 기본정보 확인(평균, 표준편차 등등).sort_values(by=기준, ascending=True)
df["A"]
slice
로 지정 가능slice
와 달리 끝을 포함함df.loc[:, ["A", "B"]]
:
는 모든 행 또는 열을 의미df.iloc[3]
df.iloc[[1, 2, 4], [0, 2]]
: 1, 2, 4번 행 + 0, 2번 열df[조건]
df[컬럼명]
df[컬럼명] = 데이터
와 같이 데이터를 추가할 수 있음.isin(확인할 데이터)
del df["E"]
.apply(함수)