파이썬으로 PDF병합하기

Hi, Mango·2020년 7월 16일
2
post-thumbnail

매주 학원에서 알바를 하는데, 가장 귀찮은 일이 학생별로 주어진 약 4개의 PDF파일을 하나로 병합시키는 업무였다. 학생수가 약 25명쯤 되는데, PDF프로그램을 켜고, 4개의 파일을 골라 순서를 맞춘 뒤 병합버튼을 누르고...기다리고...저장하고..끄고..또 새로운 파일 켜는 짓을 학생 수 대로 반복해야했다.

결국 극도의 귀찮음이 PyCharm을 켜게 했다! PyPDF2를 사용해 PDF자동병합툴을 만들어보자🧐

내 입맛대로 만드는 PDF툴

PyPDF2는 python으로 PDF를 다루는 가장 대표적인 모듈이다 (PyPDF2 홈페이지)

pip install PyPDF2

간단하게 PyPDF2를 설치해주고 시작😎

나는 폴더 내의 모든 PDF를 읽어, 파일명으로 분류해 자동 병합해주는 기능을 원했다.
ex)(김망고1 김망고2->김망고.pdf), (한수박1 한수박2->한수박.pdf)

고로, 경로 내의 pdf파일을 모두 읽고 파일명으로 분류해, 병합 될 파일들끼리 list에 저장하는 작업을 우선 해주었다.

from PyPDF2 import PdfFileMerger

내가 필요한 것은 Merge 기능이다.PdfFileMerger를 import 해주도록 하자!

pdf_merger = PdfFileMerger(strict=False)
    for file in pdf_list:
    	pdf_merger.append(file)

pdf_merger.write("Merged.pdf") //파일명
pdf_merger.close()

사실 병합은 너무나 간단하다! PdfFileMerger를 생성한 뒤, 병합하고자 하는 파일들을 순서대로 append해주면 된다! 그리곤 파일을 write해주기만 하면 끝.

몇줄 되지도 않는 코드였지만 30분 걸리던 귀찮은 일의 소요시간을 1초로 줄여버리는 아주 강력한 프로그램을 만들어버렸다. 사랑해 파이썬ㅠ

1개의 댓글

comment-user-thumbnail
2021년 7월 8일

감사합니다! 덕분에 쉽게 합쳤어요 😃

답글 달기