TIL | 문서 테이블을 DB에 저장하는게 가능할까?

Yeseul Han·2024년 9월 26일
0

🌞 시작하는 글

실질적으로 프로젝트 작업 시작하는 날이다.
오늘 잘 돌아가면 앞으로 1주일 문제 없을 예정 :)
완성도 있게 끝낼 수 있도록 하자!

🎯 오늘의 TODO LIST

[ ] 왼쪽 컴퓨터 터미널 돌아가게 세팅
[✔️] 추출 필요한 35개 키 밸류 및 문서 정리
[✔️] 최소 2개 파일 70% 이상 돌아가게 세팅

⚗️ 오늘의 실험

...으아아 문서화 작업 시러요ㅠ0ㅠ

문서에서 xml로 테이블 뽑아서 DB에 저장후 추후 뽑아서 다시 docx 문서화

성공!

from lxml import etree
from docx.oxml import parse_xml

# 테이블 XML을 추출하는 함수
def extract_table_as_xml(table):
    # 이미 table 객체는 CT_Tbl이므로 바로 XML로 변환
    return etree.tostring(table, encoding='unicode')
    
for child in input_doc.element.body.xpath('w:tbl'):
    table_xml = extract_table_as_xml(child)
    save_table_to_db(table_xml)
    
####################################
# 테이블 XML을 새 문서에 추가하는 함수
def add_table_from_xml(doc, table_xml):
    # XML 문자열을 파싱하여 DOCX의 XML 요소로 변환
    table_element = parse_xml(table_xml)
    # 새 문서에 테이블 추가
    doc._element.body.append(table_element)

🤔 고민 사항

  1. DB 구조
  2. docx등 문서의 table을 DB에 저장하고 그걸 뽑아서 다시 docx 문서에 넣기 TEST 필요
profile
코딩 잘하고 싶다

0개의 댓글