import pandas as pd
# 읽어올 엑셀 파일 지정
filename = 'data/test.xlsx'
# 엑셀 파일 읽어 오기
df = pd.read_excel(filename)
print(df)
filename = '경로/파일명.파일형식'읽어오는 시트 지정
df = pd.read_excel(filename, sheet_name = 2)
df = pd.read_excel(filename, sheet_name = 'sheet2')
df = pd.read_excel(filename, sheet_name = [1, 3, 7])
df = pd.read_excel(filename, sheet_name = ["sheet4", "sheet5", "sheet8"])
헤더로 시작하는 행 번호 지정 (0부터 시작된다. 10행일 경우 9)
df = pd.read_excel(filename, header = 9)
인덱스로 설정할 column 지정
df = pd.read_excel(filename, index_col = "순위")
df = pd.read_excel(filename, index_col = 0)
읽어오는 열 수동 지정
df = pd.read_excel(filename, usecols = "A,B,C")
df = pd.read_excel(filename, usecols = [0, 1, 4])
df = pd.read_excel(filename, usecols = "A:F")
열 이름 지정
df = pd.read_excel(filename, names = ['이름1', '이름2', ... ])
파일형식이 구버전(xls, odf 등)일 때 지정
앞에서 생략하고 싶은 n개 행 지정
뒤에서 생략하고 싶은 n개 행 지정
몇 행을 읽어올지 지정 (처음 ~ n번째)
pd.read_excel('파일명.xlsx', nrows = n)
결측값으로 취급할 문자열 지정 ("nan")
기본적으로 인식되는 결측값
'# N / A', '# N / AN / A', '#NA', '-1. # IND', '-1. # QNAN', '-NaN', '-nan', '1. # IND', '1. # QNAN', '', 'N / A', 'NA', 'NULL', 'NaN', 'n / a ','nan ','null '
예시로, '-', '~' 등 입력된 값을 결측값으로 인식시킬 수 있음
False로 지정할 경우 결측치에 NaN이 아닌 빈 칸으로 남아있음
데이터 타입을 미리 지정해주고 싶은 column이 있으면 딕셔너리 형태로 지정
숫자의 천단위 쉼표(,)로 구분된 문자를 변환하기 위해 천단위 구분자가 무엇인지 지정