[Spring Boot] Aspose 라이브러리로 CAD 파일 내 텍스트 추출하기

고리·2023년 1월 2일
0

Server

목록 보기
3/12
post-thumbnail

지난 게시글에서 캐드 파일 내의 텍스트 데이터를 매크로를 사용해 추출했다.

하지만 추출해야할 파일은 수백, 수천개인데 10개만 연속으로 추출해도 아래와 같은 오류로 추출이 불가능 했다.

그러나 의아한점은 매크로 프로그램을 돌리지 않은 서버에서 추출을 직접 손으로 진행하면 오류 없이 추출이 가능하다는 것이다. 추측하기로는 어떤 IP에서 많은 요청이 들어오면 해당 IP를 잠시 막는 것 같다.

느린 매크로 실행속도에 위의 오류를 피하기 위해 timeout까지 걸었더니 감당할 수 없을 정도로 느려져서 결국 다른 방법을 찾아보았다.

다행히 aspose에서는 java로 텍스트 추출을 진행할 수 있는 라이브러리를 제공하고 있었다. 링크

이제 이 라이브러리를 사용해 텍스트를 추출해 보자

텍스트 추출

공식 문서가 친절하게 설명해주고 있다.

  1. 예제 파일이 포함된 zip파일을 github에서 다운받는다.
  2. 압축을 해제하고 원하는 IDE로 폴더를 연다. (여기서는 intellij 사용)
  3. DWGDrawings 폴더에 SearchTextInDWGAutoCADFile.java파일을 찾아 실행한다. 20번줄의 주석 참고
  4. 아래와 같은 오류가 뜬다면 Utils.java 파일을 수정한다.
    Exception in thread "main" com.aspose.cad.internal.ms.System.IO.FileNotFoundException: Can't find file:

    com/aspose/cad/examples/Utils/Utils.java 경로의 현재 프로젝트의 경로에 맞게 수정한다. 여기서는 Examples 디렉토리가 포함이 되지 않아 아래처럼 수정했다.

되게 간단한 과정이다. 바로 다음 게시글에서 라이브러리 내 메서드를 자세히 알아보고 기능을 고도화해 프로젝트에 적용하는 방법을 알아보자

profile
Back-End Developer

0개의 댓글