[ETC] PDFMathTranslate로 쉽게 논문 번역본을 얻어보자!

es.Seong·2025년 1월 3일
5

논문 읽으려면 매번 GPT에 파일 넣고 한국어 번역요청을 해야한다.
그런데 GPT는 제대로 번역을 해줄 때도 있지만,,,갑자기 소제목을 넣어버리거나 과한 의역으로 논문을 소설로 바꿔버리는 대참사를 유발하기도한다...

그래서 매번 조건 다 말해주면서 GPT 훈계하기도 귀찮았는데 꽤 괜찮은 깃허브 레포를 발견했다.

PDFMathTranslate

https://github.com/Byaidu/PDFMathTranslate?tab=readme-ov-file

깃허브 URL은 위 주소로 접속하면된다.


source : https://github.com/Byaidu/PDFMathTranslate?tab=readme-ov-file

위 이미지처럼 논문 포맷을 갖춰서 번역을 해준다고 한다.
번역만 제대로 된다면 GPT 훈계질은 그만해도 될 것이라 생각하고 얼른 설치해보았다.

사용 방법

pip install pdf2zh

설치방법이 정말 간단하다.
파이썬이 설치된 환경에 pip로 설치해주면 사전작업은 끝이다.

이제 pdf2zh라는 라이브러리를 사용해보자.

pdf2zh 논문.pdf -li en -lo ko

깃허브에 나온 튜토리얼이랑 실행코드가 살짝 다르다. 추가 파라미터를 좀 더 넣었는데
li는 논문 원본의 언어이다. lo는 번역할 언어이다.
기본값이 중국어로 되어있어서 lo 파라미터 없이 실행하면 당황할 수 있다.

명령어를 실행할 때는 당연하겠지만 실행경로에 pdf 파일이 존재해야 위와같이 정상적으로 번역이 진행된다.

결과

코드가 정상적으로 실행이 되었다면 -dual-mono가 더 붙어있는 pdf 파일이 생성될 것이다.

우선 mono부터 열어보자.

한국어로 잘 번역된 것을 확인할 수 있다.

다음으로 -dual 파일도 열어보자.

dual 파일은 원문과 번역본이 같이 저장되어 있다. dual파일이 원문과 비교하며 읽기가 편해서 이 파일을 더 자주 사용할 것 같다.

Parameters

파라미터는 설명은 위 이미지와 같다.
GUI환경도 지원하는 것 같고, 개인적으로 사용하는 API가 있다면 커스텀도 가능해보인다.
번역도 생각보다 깔끔하게 되어서 꽤 유용하게 사용할 것 같은 툴이다.

profile
Graduate student at Pusan National University, majoring in Artificial Intelligence

0개의 댓글

관련 채용 정보