[0118] EDA 기초

이아연·2024년 1월 19일
0

코드를 외우려고 하기보다는 큰 틀에서 어떤 기능들이 있고, 기능들을 어떻게 활용할 수 있을지에 집중하기

01. 데이터 읽기

import pandas as pd
CCTV_Seoul = pd.read_csv("../data/Seoul_CCTV.csv", encoding="utf-8")

파일 읽기 pd.read_csv(path, encoding=utf-8')
name.head() : 앞의 다섯 줄 보여줌
name.tail() : 끝의 다섯 줄 모여줌
name.columns() : 인덱스 보여줌

판다스 기초

  • Series
    -index와 value로 이루어져 있다.
    -한가지 데이터 타입만 가질 수 있다.

  • python에서 R만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈

  • 단일 프로세스에서는 최대효율

  • 코딩 가능하고 응용 가능한 엑셀로 받아들여도 됨

  • 누군가 스테로이드를 맞은 엑셀로 표현함

-딕셔너리, 정수, 실수, 문자열 등으로 표현할 수 있다.

날짜 데이터

pd.date_range('20210101', period = 6)

결과
DatetimeIndex(['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04',
'2021-01-05', '2021-01-06'],
dtype='datetime64[ns]', freq='D')

profile
Hi Welcome

0개의 댓글