이미지에서 문자 추출 OCR

💦💦💦💦·2022년 10월 17일
0

검토

목록 보기
4/5

전기사용량 지로 영수증의 데이터를 쌓을일이 있어서 검토

간편하게 nodejs 사용

  1. 지로영수증.pdf > png로 변환 (pdf인식X)

  2. 지로영수증이 길어서 4개의 이미지 파일 생성됨

  3. tesseract 실행!

  4. 실패!
    지로영수증이 너무 알록달록(?) 하고 표가 많이 들어있어서 인식률이 떨어졌다.

재시도 (tesseract 인식률 올리기)

  1. pdf > png 변환

  2. 필요한 영역만 확대 > crop

  3. tesseract 실행!

  4. 성공!

간혹 숫자 인식이 틀릴것 같은 불안함이 생겼다

검색 하니 API 제공하고 있었다.

한국전력 에너지마켓플레이스

회원가입후 key 발급 시도 했지만 에러출력에 작업불가!

에너지마켓플레이스가 정상화 되면 그때 다시 시도해봐야 겠다.

tesseract.js

profile
속도보다 방향

0개의 댓글