4. 데이터 소개

Data Collection 데이터를 모으는 방법은 크게 두 가지로 나눌 수 있다. Public Dataset 이미 공개된 데이터셋 중에서 목적에 맞는 데이터셋이 있다면 활용하는 것 손쉽게 라벨링된 실제 이미지를 확보 가능하기 때문에 데이터 수집 시 제일 먼저 하는 활동 하지만 원하는 데이터가 없을 수 있으며 보통 수량이 작다. 공개 데이터 탐색 방법 대회 kaggle, RRC 와 같은 대회에서 공개되는 데이터 사용 논문 Arixv , cvpr, iccv, aaai, icdar (OCR 전문 학회)에서 OCR 데이터셋과 관련된 논문 확인 전문사이트 Google Datasearch, Zenodo.org, Datatang(유료 구매) 와 같은 사이트 활용하기 이후, 공개

2022년 5월 13일
·
0개의 댓글
·

Text Detection

일반 객체 영역 검출 vs 글자 영역 검출 예측하고자 하는 정보 일반 객체 검출 : 해당 객체의 클래스와 위치를 예측하는 문제 글자 검출 : Text 라는 단일 클래스이기 때문에 객체 위치만 예측하는 문제 객체의 특징 일반 객체 검출 : 비교적 낮은 밀도 글자 검출 : 매우 높은 밀도, 극단적 종횡비, 특이 모양(구겨짐, 휘어짐, 세로 쓰기), 모호한 객체 영역, 크기 편차 사각형 종류들 직사각형 (좌상단 위치, h,w ) 또는 (좌상단 위치, 우하단 위치) 직사각형 + 각도 사각형 ![](https://velog.v

2022년 5월 13일
·
0개의 댓글
·

OCR Technology & Services

OCR Optical Character Recognition 사람이 글자를 읽을 때 먼저 글자를 찾고 찾을 글자를 인식한다. 따라서, OCR도 글자를 찾는 모듈과 글자를 인식하는 모듈로 이루어져 있다. 글자를 읽는다 = 글자 영역 찾기 + 영역 내 글자 인식 = OCR Offline Handwriting 이미지를 입력하고 글자값 출력 Online Handwriting 좌표 시퀀스를 입력하고 글자값 출력 Text Detector 단일 객체 검출 이미지에 하나의 객체가 있는데, 이 객체가 어떤 class에 속하는지, 또 어떤 위치에 있는지를 예측하는 task 다중 객체 검출

2022년 5월 13일
·
0개의 댓글
·

1. 데이터 제작의 중요성

보통 수업/학교/연구에서는 정해진 데이터셋/평가 방식에서 더 좋은 모델을 찾는 일을 한다. 정해진 데이터셋에서 모델 구조 또는 학습 방법을 바꿔가면서 성능이 최대가 되는 모델을 찾아가는 방법 하지만, 서비스 개발 시에는 데이터셋이 준비되어 있지 않고, 오로지 요구사항만 존재한다. 데이터 셋이 준비되어 있지 않거나 있더라도 불완전한 경우가 많다. → 개발 업무의 반 이상이 데이터 셋을 준비하는 작업과 관련되어 있다. 서비스향 AI 모델 개발 과정 ![](htt

2022년 5월 13일
·
0개의 댓글
·