서론) 직장에서 일을 하던 나는... 두가지 excel 파일을 합쳐야 하는 상황이 되었다.
데이터 값이 많아서 수작업으로 하면 바보가 될 거 같은 이런 느낌.
그래서 공대동생에게 help 요청~ pandas 라이브러리를 추천받았다.
두가지 엑셀 파일 합치기. 이보다 쉬울 순 없다.
딱 5줄이면 됨.
# pandas와 openpyxl 라이브러리 다운로드 후, import 해준다.
import pandas as pd
# 원하는 엑셀 파일을 pd.read_excel('') 함수를 이용해 데이터프레임으로 만들어준다.
df1 = pd.read_excel('파일명1.xlsx')
df2 = pd.read_excel('파일명2.xlsx')
# merge 함수를 이용해 합쳐준다. left는 df1 기준으로 df2가 붙는다는 뜻.
df3 = pd.merge(df1, df2, on="식별자", how="left")
# 해당 데이터프레임을 엑셀로 저장해준다.
df3.to_excel('test_save.xlsx', index=False)
참고한 블로그 사이트
1. 원하는 엑셀 파일을 데이터 프레임으로 만들기
https://hogni.tistory.com/93
2. merge 함수 사용하기
https://nittaku.tistory.com/121
3. 데이터프레임을 엑셀로 저장하기
https://ybworld.tistory.com/42