
import pandas as pdpd.read_csv(경로, 인코딩)read_파일형식을 지정하면 됨.columns: column의 이름을 조회할 수 있음CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]: "구별"}, inplace=True)inplace값을 True로 주어야 함pd.read_excel(경로, header=2, usecols="B, D, G, J, N")header: 자료를 읽기 시작할 행usecols: 읽어올 엑셀의 컬럼.head().tail()pandas의 데이터형을 구성하는 기본은 series
a = pd.series([1, 2, 3])날짜, 시간 이용
dates = pd.date_range("20130101", periods=6)pandas에서 가장 많이 사용되는 데이터형은 DataFrame이고 index와 columns를 지정
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=["A", "B", "C", "D"])head()
.index, .columns, .values
.info()
DataFrame의 기본정보 확인.describe()
DataFrame의 통계적 기본정보 확인(평균, 표준편차 등등).sort_values(by=기준, ascending=True)
df["A"]
slice로 지정 가능slice와 달리 끝을 포함함df.loc[:, ["A", "B"]]
:는 모든 행 또는 열을 의미df.iloc[3]
df.iloc[[1, 2, 4], [0, 2]]: 1, 2, 4번 행 + 0, 2번 열df[조건]
df[컬럼명]
df[컬럼명] = 데이터와 같이 데이터를 추가할 수 있음.isin(확인할 데이터)
del df["E"]
.apply(함수)