PDF 표 데이터 DB에 저장하기

김민재·2025년 8월 5일
0

개인프로젝트에서 공연장의 위치 정보를 네이버 지도 api를 통해 받아오기 위하여 pdf 파일에 있는 공연장 코드를 db에 저장하고자 했다.

나는 pdf 데이터를 원하는 형식으로 변환해주는 툴인 tabula 를 사용했다.

pdf 에 있는 표 데이터를 csv로 변환한 후 db에 저장하는 과정은 다음과 같다.


1. tabula 다운로드하기

https://tabula.technology/ 에서 자신의 운영체제에 맞는 버전을 다운로드한다.


2. 원하는 pdf 파일을 찾아 import 한다.


3. 변환하기 원하는 부분을 드래그하여 선택한다.


4. 원하는 변환 파일 형식을 선택한 후 다운로드한다.


5. 파일을 양식에 맞게 수정후 저장한다.

보통 DB에 저장할 때 첫 행이 column 명과 같아야 하므로, 이에 맞게 수정한다.

Mac에서는 엑셀 대신 Numbers 앱을 사용하기 때문에 간혹 확장자가 변경되는 경우가 있는데, 이 때는 Mac 상단 메뉴바에서 파일 > 다음으로 내보내기 > CSV 를 선택하면 .csv 확장자로 저장이 가능하다.


6. csv 파일을 db에 저장한다.

Supabase의 경우 자동으로 csv 파일을 드래그 앤 드롭 하면 db 테이블로 구성해주는 기능을 제공하고 있었으므로 편리했다.

단 유의해야 할 점은, 해당 csv 파일 데이터의 컬럼명과 같은 컬럼명이 db 테이블에 존재해야 한다.

데이터가 잘 들어간 모습이다.

profile
넓이보단 깊이있게

0개의 댓글