[python][pandas] pd.read_excel()

silver0·2022년 7월 13일

Python

목록 보기

2/6

pd.read_excel()

import pandas as pd

# 읽어올 엑셀 파일 지정
filename = 'data/test.xlsx'

# 엑셀 파일 읽어 오기
df = pd.read_excel(filename)
print(df)

엑셀파일을 pandas Dataframe 으로 읽어들인다.
- xlsx, xls, xlsm, xlsb, odf, ods, odt 파일
filename = '경로/파일명.파일형식'

매개변수(argument)

sheet_name

읽어오는 시트 지정

str, int, list, None 입력할 수 있다.(None은 모든 시트)
기본값 0 (0번부터 시작, 3번째 시트일 경우 2이다.)
list로 읽을 경우 dict형태로 저장된다.

df = pd.read_excel(filename, sheet_name = 2)
df = pd.read_excel(filename, sheet_name = 'sheet2')
df = pd.read_excel(filename, sheet_name = [1, 3, 7])
df = pd.read_excel(filename, sheet_name = ["sheet4", "sheet5", "sheet8"])

헤더로 시작하는 행 번호 지정 (0부터 시작된다. 10행일 경우 9)

첫번째 행은 일반적으로 헤더로 지정
기본값은 0
헤더가 없으면 None으로 설정

df = pd.read_excel(filename, header = 9)

index_col

인덱스로 설정할 column 지정

"열 이름" 또는 열번호 (0번부터 시작)

df = pd.read_excel(filename, index_col = "순위")
df = pd.read_excel(filename, index_col = 0)

usecols

읽어오는 열 수동 지정

읽어오고 싶은 열만 지정해서 읽어올 수 있다.
시트 열의 알파벳 기준 or 열 번호
- ex) "A,B,C" or [0, 1, 4] or "C:F"

df = pd.read_excel(filename, usecols = "A,B,C")
df = pd.read_excel(filename, usecols = [0, 1, 4])
df = pd.read_excel(filename, usecols = "A:F")

names

열 이름 지정

데이터를 불러오는 단계에서 열 이름 지정 혹은 변경
열이름 리스트의 원소 개수와 열의 이름 개수가 일치해야 된다.

df = pd.read_excel(filename, names = ['이름1', '이름2', ... ])

engine

파일형식이 구버전(xls, odf 등)일 때 지정

skiprows

앞에서 생략하고 싶은 n개 행 지정

skipfooter

뒤에서 생략하고 싶은 n개 행 지정

nrow

몇 행을 읽어올지 지정 (처음 ~ n번째)

pd.read_excel('파일명.xlsx', nrows = n)

na_vlaues

결측값으로 취급할 문자열 지정 ("nan")

기본적으로 인식되는 결측값

'# N / A', '# N / AN / A', '#NA', '-1. # IND', '-1. # QNAN', '-NaN', '-nan', '1. # IND', '1. # QNAN', '', 'N / A', 'NA', 'NULL', 'NaN', 'n / a ','nan ','null '
예시로, '-', '~' 등 입력된 값을 결측값으로 인식시킬 수 있음

keep_default_na

False로 지정할 경우 결측치에 NaN이 아닌 빈 칸으로 남아있음

dtype

데이터 타입을 미리 지정해주고 싶은 column이 있으면 딕셔너리 형태로 지정

thousands

숫자의 천단위 쉼표(,)로 구분된 문자를 변환하기 위해 천단위 구분자가 무엇인지 지정

pd.to_excel()

엑셀파일 내보내기

silver0

작은 일이라도 꾸준히 노력하면 큰 뜻을 이룰 수 있다

이전 포스트

[python] sys.stdin.readline() 과 input() 차이점

다음 포스트