22.10.25 - 데이터분석(데이터 적재)

LaMelo·2022년 10월 24일

jupyter

목록 보기

24/29

pd.read_csv()
- 컬럼명이 존재하는 데이터
- 컬럼명이 없는 데이터
- 구분자 설정
data/ex1.csv 파일 읽기(컬럼명이 존재하는 csv파일)
- read_csv 기본동작 : 첫 행 데이터를 컬럼으로 사용
- 절대 경로 :
  - 파이썬 파일 경로
    C:\Users\Playdata\python_basic\python_da~~.ipynb
  - csv 파일 경로
    C:\Users\Playdata\python_basic\python_da\data\ex1.csv
- 파이썬 주피터노트북 파일과 같은 폴더에 있기 때문에 상대 경로만 써도 된다.
  - 위 경로에서 겹치는 부분을 제하고 달라지는 분기점부터 입력하면된다.
  - csv파일 상 출력 vs 판다스 출력
header = None
- 컬럼, 로우명 없이 데이터만 있는 자료들을 처리할 때 사용
  - 컬럼명 a, b, c, d, e 를 data 변수에 부여해보세요.
기본 구분자가 맞지 않아 자료 구분이 제대로 되어 있지 않은 경우
- 기본 구분자 = ,
- read_csv() : sep 파라미터 : \s+로 전부 구분자 처리 가능
주석 처리

기본적으로 첫번째 시트에 있는 데이터를 읽어와서 데이터프레임으로 저장
모든 시트를 읽기 위해서는 sheetname 인자를 None으로 설정
- 모든 시트의 데이터를 읽어서 사전 형태로 저장
- key = 시트의 이름, value = 각 시트에 있는 데이터들을 저장한 데이터프레임
특정 시트만 읽기 위해서는 sheetname 인자에 '시트명' 설정