# Text recognition

3개의 포스트

[졸업 프로젝트-1] Korean Receipt 문자 인식을 위한 OCR 모델 개발, 그리고 predict API 만들기

(0) 텐센트 클라우드 연결 --> OCR 모델을 개발하기 위해서 💡 중요한 것은 그냥 ssh원격 접속을 해서 저장을 하게 되면 permission없다는 에러 메세지가 뜨게 된다는 것이다. 그렇게 때문에 무조건 가상 머신의 서버 내에서 편집이나 파일 추가 등을 하기 위해 root로 지정되어 있는 소유자를 chown명령으로 바꾸어 주어야 한다. 우리의 경우 ssh 계정이 ubuntu이기 때문에 sudo chown -R ubuntu * 로 권한을 받는다. Tencent Cloud 사용과 가상머신에 대하여 원래 처음에는 이메일 주소를 사용해서 로그인을 하라고 했지만 지금은 개인 사용자로서 가입을 하는게 아니기 때문에 CAM User login을 한다. 학교에서 알려준 Root account id - ID - PW 순서대로 입력을 하면 된다. 로그인이 되고 원래 비밀번호에서 변경을 하라고 해서 Asdf1234!로 변경

2022년 12월 23일
·
0개의 댓글
·
post-thumbnail

OCR(Optical Character Recognition)

OCR이란 무엇인가? AWS의 정의에 따르면, 광학 문자 인식(OCR)은 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷으로 변환하는 과정. 예를 들어, 양식이나 영수증의 스캔본 또는 사진 파일이 있을 때, 단순히 이미지 파일로는 텍스트 문서로 변환하여 편집할 수 없지만, OCR을 활용한다면 이를 가능하게 한다. 그렇다면 OCR의 원리는 어떻게 되는가? OCR을 아주 대략적으로 큰 범주로 나눈 단계로 본다면, Text Detection과 Text Recognition 두 단계가 존재한다. Text Detection Text Detection은 분류적으로는 object detection의 하위로 포함되기도 한다. Text를 Detection하는 방법론으로는 여러 가지 방법론이 있는데 그 중에 대표적인 방법론은 다음과 같다. object detection을 활용한 방법론 Sub-Text Compon

2022년 11월 8일
·
0개의 댓글
·

[paper-review] Sequence-to-Sequence Domain Adaptation Network for Robust Text Image Recognition

Zhang, Yaping, et al. "Sequence-to-sequence domain adaptation network for robust text image recognition." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019. Abstract 기존 Domain Adatation 문제에서 Visual 데이터 영역에 대한 발전은 이미지를 전체적으로(global) 바라보는 방향으로 발전해왔으며, 다양한 문자의 형태에 대한 sequential한 텍스트 이미지 분야에는 맞지 않는 방향이었다. Sequence-to-Sequence domain adaptation network (SSDAN)의 제안. Gated Attention Similarity (GAS) unit을 도입하여 이미지 전체에 대한 분석보다 character-level의 특징 공간

2021년 2월 15일
·
0개의 댓글
·