PDF-Diff소개

Pdfminer라는 Python의 유명한 Pdf분석 Library를 활용하여
2개의 PDF파일을 분석하여 2가지 PDF의 다른점을 HTML창에 그려주는 툴을 소개한다.
주의점 : pdf내 그림은 비교하지 않고, 문자객체의 위치 > 글자 내용을 비교한다.

※ 빠른시간에 너무 날림으로 만든 툴이라 코딩 실력이 들킬까봐 겁나네요.. 로직 보완하겠습니다.

사용방법

  1. diff-pdf github프로젝트의 소스를 내려 받는다.
git clone https://github.com/jjunghyup/diff-pdf.git

image.png

  1. pdfminer를 설치한다.
pip install pdfminer
  1. python으로 diff-pdf.py를 실행하며 비교할 파일 2개를 입력한다.
python diff-pdf.py before.pdf after.pdf

image.png

  1. 결과 파일(output.html)을 확인한다.
    image.png
profile
안녕하세요~ :)

0개의 댓글