PDF 표 데이터 DB에 저장하기

김민재·2025년 8월 5일

개인프로젝트에서 공연장의 위치 정보를 네이버 지도 api를 통해 받아오기 위하여 pdf 파일에 있는 공연장 코드를 db에 저장하고자 했다.

나는 pdf 데이터를 원하는 형식으로 변환해주는 툴인 tabula 를 사용했다.

pdf 에 있는 표 데이터를 csv로 변환한 후 db에 저장하는 과정은 다음과 같다.


1. tabula 다운로드하기

https://tabula.technology/ 에서 자신의 운영체제에 맞는 버전을 다운로드한다.


2. 원하는 pdf 파일을 찾아 import 한다.


3. 변환하기 원하는 부분을 드래그하여 선택한다.


4. 원하는 변환 파일 형식을 선택한 후 다운로드한다.


5. 파일을 양식에 맞게 수정후 저장한다.

보통 DB에 저장할 때 첫 행이 column 명과 같아야 하므로, 이에 맞게 수정한다.

Mac에서는 엑셀 대신 Numbers 앱을 사용하기 때문에 간혹 확장자가 변경되는 경우가 있는데, 이 때는 Mac 상단 메뉴바에서 파일 > 다음으로 내보내기 > CSV 를 선택하면 .csv 확장자로 저장이 가능하다.


6. csv 파일을 db에 저장한다.

Supabase의 경우 자동으로 csv 파일을 드래그 앤 드롭 하면 db 테이블로 구성해주는 기능을 제공하고 있었으므로 편리했다.

단 유의해야 할 점은, 해당 csv 파일 데이터의 컬럼명과 같은 컬럼명이 db 테이블에 존재해야 한다.

데이터가 잘 들어간 모습이다.

profile
넓이보다 깊이있게

0개의 댓글