pandas
import pandas as pd
CCTV_Seoul = pd.read_csv("./data/01. Seoul_CCTV.csv", encoding="utf-8")
CCTV_Seoul.rename(columns={CCTV_Seoul.columns[0]:"구별"}, inplace=True)
pop_Seoul = pd.read_excel("./data/01. Seoul_Population.xls", header=2, usecols="B, D, G, J, N")
pop_Seoul.head()
pop_Seoul.tail()
pandas basic
s = pd.Series([1, 3, 5, np.nan, 6, 8])
dates = pd.date_range("20130101", periods = 6)
df.info()
df.describe()
df.sort_values(by="B", ascending=False)
sort_values()는 데이터를 정렬한다.
ascending=False 이면 내림차순, True 이면 올림차순으로 정렬한다.
df.loc 로는 행 열의 이름으로 슬라이스,
df.iloc 로는 숫자로 슬라이스를 할 수 있다.
isin() : 특정 요소가 있는 행만 선택
del df["E"] : 특정 컬럼 제거
df.apply(np.cumsum) : 각 컬럼 누적합 (apply : 함수를 적용)
pd.merge(left, right, on="key")
pd.merge(left, right, how='left', on="key")
pd.merge(left, right, how='outer', on="key")
data_result.corr()