- 이런 분석을 하기 위해서!!
- 데이터 다운로드
- 문서 -> ds_study -> data 폴더에 저장
- Python에서 R 만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈
- 단일 프로세스에서는 최대 효율
- 코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨
- 누군가 스테로이드를 맞은 엑셀로 표현함
- 자료 가져오기
-> import pandas as pd
-> CCTV_Seoul = pd.read_csv('../data/01. Seoul_CCTV.csv')
-> CCTV_head()
- 컬럼 가져오기, 특정 컬럼 수정하기
- import pandas as pd
- import numpy as np
- pandas는 통산 pd
- numpy는 통산 np
ex.
1. pd.Series([1,2,3,4]) -> 데이터 타입: int
2. pd.Series([1, 2, 3, 4], dtype=np.float64) -> 데이터 타입 float
3. pd.Series([1, 2, 3, 4], dtype=str) -> 데이터 타입 object (문자)
- 문자열이 하나라도 들어가면 데이터 타입이 object로 나온다.
- pd.Series([1, 2, 3, 4, '5'])
- 날짜 데이터 구하기 (특정 날짜부터)