Pdfminer라는 Python의 유명한 Pdf분석 Library를 활용하여
2개의 PDF파일을 분석하여 2가지 PDF의 다른점을 HTML창에 그려주는 툴을 소개한다.
주의점 : pdf내 그림은 비교하지 않고, 문자객체의 위치 > 글자 내용
을 비교한다.
※ 빠른시간에 너무 날림으로 만든 툴이라 코딩 실력이 들킬까봐 겁나네요.. 로직 보완하겠습니다.
git clone https://github.com/jjunghyup/diff-pdf.git
pip install pdfminer
python diff-pdf.py before.pdf after.pdf