실무 프로그래밍을 하다보면 엑셀을 편집하거나, 불러와야 할 경우가 많이 생깁니다.
데이터 가공에 유용한 Python 의 openpyxl 을 살펴보도록 합니다.
openpyxl 은 파이썬(Python)에서 사용되는 라이브러리 중 하나입니다.
엑셀(Excel) 파일의 xlsx / xlsm / xltx / xltm 형식들을 지원하며,
엑셀의 데이터를 읽고 쓰는데 사용됩니다.
터미널에 아래 명령어를 입력하여 라이브러리를 설치해줍니다.
pip install openpyxl
코딩할 파이썬 파일 상단에 openpyxl 을 import 하면 사용할 준비가 되었습니다.
openpyxl 을 사용하여 엑셀을 불러와보겠습니다.
단, 한가지 이해하고 넘어가셔야 할 점은
엑셀 파일 자체는 워크북, 그 안에 여러개의 워크시트, 그리고 워크시트 안에 셀들이 있다는 점입니다.
import openpyxl
# openpyxl import
wb = openpyxl.Workbook()
# 워크북을 생성하면 그 안에 워크시트 1개가 자동으로 생성
ws = wb.active
# 활성화 된 워크시트를 가리킴
wb = openpyxl.load_workbook(filename='filename.xlsx')
# 기존 엑셀 파일 호출
ws = wb.active
# 현재 활성화된 워크시트를 가리킴
ws = wb['Sheet3']
# 특정 시트를 가리킴
openpyxl.load_workbook()
에서 data_only=True
옵션을 주면print(ws['A1']) # A1 셀을 확인
print(ws['A1'].value) # A1 셀의 값을 확인
print(ws['A']) # A 열의 모든 셀을 확인
print cell in ws['A']: # A 열의 모든 셀 값을 확인
print(cell.value)
#또 다른 셀 접근방법
ws.cell(row = 3, column = 2)
# 세로방향(row)으로 3번째, 가로방향(column)으로 2번째 셀
# 저장
wb.save(filename='filename.xlsx')
# 닫기
wb.close()
여기에는 아주 간단한 사용법만이 적혀있으며,
자세한 사용 방법은 아래 링크들을 참고하시면 더욱 정리가 잘 되어있습니다.