chap1. orientation
(* 앞으로 대부분 노트 필기는 jupyter로 가정하고 작성됨)
CCTV_Seoul = pd.read_csv("../data/01. Seoul_CCTV.csv", encoding="utf-8")
자료 중 앞부분 5개만 볼 수 있도록 하는 명령어
ex/ CCTV_Seoul.head()

: column 내의 이름 모두 조회
(ex/ 데이터명.column[0] : 0번째 column명 조회)
: 컬럼 이름 바꾸기
: 바꾸고 나서 데이터를 업데이터 해 주어야 반영이 된다. 그때의 명령어. (디폴트 값은 False)
CCTV_Seoul.rename(colums={CCTV_Seoul.columns[0]: "구별"}, inplace=True)

pop_Seoul = pd.read_excel("../data/01. Seoul_Popoluation.xls")
: 하지만 엑셀파일에서 병합되어 있던 셀이 pandas에서는 병합 기능이 없어 깨끗하지 못한 모양으로 읽혀지게 된다.

pop_Seoul = pd.read_excel("../data/01. Seoul_Popoluation.xls", header=2, usecols="B, D, G, J, N")
: 자료를 읽기 시작할 행(header) 지정
: 읽어올 엑셀의 컬럼 지정(usecols)

pop_Seoul.rename(
columns={
pop_Seoul.columns[0]: "구별",
pop_Seoul.columns[1]: "인구수",
pop_Seoul.columns[2]: "한국인",
pop_Seoul.columns[3]: "외국인",
pop_Seoul.columns[4]: "고령자",
},
inplace=True,
)
pop_Seoul.head()
: 컬럼 이름 바꾸기
CCTV_Seoul = pd.read_csv("../data/01. Seoul_CCTV.csv", encoding="utf-8")
: 터미널에서 폴더를 이동할 떄 쓰는 명령어. (의미: 현재 폴더에서 상위 폴더로 이동하라. 현재 속한 source_code 폴더에서 한 단계 위로 올라가서 data~ 위치로 이동하여 열어라.)
Last login: ~~
(base) da~@Da~ui-MacBook-Pro ~ % conda activate ds_study
(ds_study) da~@Da~ui-MacBook-Pro ~ % cd Documents
(ds_study) da~@Da~ui-MacBook-Pro ~/Documents % ls
# 이 자리에 Document 내 파일 리스트가 나온다.
(ds_study) da~@Da~ui-MacBook-Pro ~/Documents % cd ds_study
(ds_study) da~@Da~ui-MacBook-Pro ~/Documents/ds_study % jupyter notebook
jupyter가 아닌 visual studio code를 통해 작업하기
1) terminal을 연다
2) 아래 입력
Last login: ~~
(base) da~@Da~ui-MacBook-Pro ~ % cd Documents/ds_study
(base) da~@Da~ui-MacBook-Pro ds_study % cd ..
(base) da~@Da~ui-MacBook-Pro Documents % cd ds_study
(base) da~@Da~ui-MacBook-Pro ds_study % code .
(base) da~@Da~ui-MacBook-Pro ds_study %
dates = pd.date_range("20130101", periods=6)
dates
: 2013.01.01부터 6일간
df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=["A", "B", "C", "D"])
df
: numpy가 제공하는 random함수를 이용해 6행 4열의 랜덤 변수를 생성하고, index는 아까 설정했던 6일의 dates로, columns는 ABCD로 이름을 지정하라.

df. head() # 데이터 앞부분 5개만 조회
df.index # index만 조회
df. columns # columns만 조회
df.values # values만 조회
: pandas DataFrame의 요약 정리를 보여준다. columns와 index는 뭐가 있고, 데이터는 몇개가 있으며 데이터의 타입은 어떤 것이다.
: 각 칼럼의 크기와 데이터 형태를 확인하는 경우가 많다.
: DataFrame의 통계적 기본 정보를 확인할 수 있다.
df.sort_values(by="B", ascending=False)
: 데이터 정렬. (B컬럼을 기준으로 내림차순 정렬을 보여준다.)


jupyter에서 코멘트 기록하기
기능 살펴보기
보고싶은 메서드의 괄호 안에서 shift+tab을 누르면 관련 설명이 나온다.
실선 긋기
'---' 기입 + esc + m + (shift+enter)
칸 위 아래 추가
파란테두리 + a : 위
파란테두리 + b : 아래
이거 대체 정리를 어떻게 해야하는거냐?
: 파이썬의 대표 시각화 도구