Experimental Results
딥러닝 기반 모델의 큰 성공텍스트 탐지/인식 능력 향상실제 응용에서의 한계 존재OCR의 후속 태스크로서의 중요성다양한 실제 사용 시나리오복잡한 특징 활용 필요성텍스트 특징시각적 특징레이아웃 정보그래프 학습 도입그래프 합성곱 연산풍부한 의미적 표현복잡한 문서 레이아웃 처
텍스트, 이미지, 레이아웃 모달리티 통합문서 이해와 생성 태스크 통합공간적 상관관계 활용Vision-Text-Layout 트랜스포머프롬프트 기반 시퀀스 생성 방식통합된 표현 학습대규모 비라벨링 문서 사전학습다양한 라벨링 데이터 활용혁신적 자기지도 학습 목표문서 이해내용
기존 언어 모델의 한계텍스트 중심 표현에만 집중셀 레벨 레이아웃 정보 간과문서 폼 이해에 중요한 구조적 정보 필요성셀과 레이아웃 정보 통합적 활용스캔된 문서의 구조적 특성 반영셀 단위 의미 처리각 셀을 하나의 의미 단위로 취급구조적 정보 보존셀 위치 분류공간적 관계 학
VDU(Visual Document Understanding) 문제 해결다양한 형식과 레이아웃의 문서 이해멀티모달 상호작용을 활용한 효율적 학습텍스트, 비전, 공간 특징 통합새로운 멀티모달 셀프-어텐션 레이어모달리티 간 공간 임베딩 공유비지도 학습 방식멀티모달 상호작용
문서 이미지에서 키 정보 추출(KIE)을 위해서는 2D 공간의 문맥적, 공간적 의미 이해 필요기존 연구들: 시각적 특징과 텍스트, 레이아웃 결합에 중점BROS: 기본으로 돌아가 텍스트와 레이아웃의 효과적 결합에 집중2D 공간에서 텍스트의 상대적 위치 인코딩시각적 특징
Abstract > "기존 STR(Scene Text Recognition) 모델들의 공정한 비교가 어려웠던 이유와 이를 해결하기 위한 통합된 프레임워크를 제시한 논문" 📌 연구 배경 최근 많은 STR 모델들이 제안되고 있음 각 모델들은 성능 향상을 주장하지만,
신경망 기반의 장면 텍스트 감지 방법이 주목받고 있지만, 기존의 단어 단위 접근 방식으로는 다양한 형태의 텍스트를 정확히 감지하기 어려웠습니다.문자 단위 감지문자 간 친화도 분석하이브리드 학습 전략합성 이미지문자 수준 주석 활용정확한 ground-truth 확보실제 이
문서 레이아웃 분석은 실제 문서 이해 시스템에서 매우 중요하지만, 속도와 정확도 사이에서 어려운 절충점이 존재합니다:텍스트와 시각 특징을 모두 활용하는 멀티모달 방법은 높은 정확도를 보이지만 상당한 지연시간이 발생시각 특징만을 사용하는 단일모달 방법은 빠른 처리 속도를
자기지도 사전학습 기술은 문서 AI 분야에서 주목할 만한 발전을 이루었습니다. 대부분의 멀티모달 사전학습 모델들은 텍스트 양식에서 양방향 표현을 학습하기 위해 마스크 언어 모델링 목표를 사용하지만, 이미지 양식에 대해서는 서로 다른 사전학습 목표를 사용합니다. 이러한
이번 마인드 골 프로젝트의 인원 모집이 마무리되고 본격적인 개발 단계에 접어들었습니다. 특히 인원 구성을 마무리하는 과정에서 각 팀원의 강점과 역할을 명확히 파악하고 조율하면서 커뮤니케이션의 중요성을 재확인할 수 있었습니다. 또한, 프로젝트의 목표와 기획 의도를 팀원들
2024 OSSCA \[참여형] 활동기간: 약 13주 2024. 7. 13 (토) - 2024. 11. 2 (토) \[Challenges: 4주] 2024. 7. 13 (토) - 2024. 8. 9 (금) \[Masters: 9주] 2024. 8. 10 (토) - 20
드래프트 PR(Pull Request)은 GitHub에서 제공하는 기능으로, 아직 작업이 완전히 완료되지 않았거나 검토가 필요할 때 사용하는 PR입니다. 이 기능을 통해 프로젝트에 작업 중인 상태를 공유하면서도 "정식으로 병합"되지 않도록 할 수 있습니다. 드래프트 P
기능: 주어진 key에 해당하는 값을 저장하거나 업데이트.현재 상태: PUT /store/{key}/{value}로 잘못된 RESTful 설계를 사용하고 있음.적절한 수정: value는 요청 본문(body)에 포함하고, key만 URL 경로에 포함시켜야 함.기능: 주어
오픈소스 프로젝트에 기여하거나 협업할 때, GitHub에서 리포지토리를 포크(Fork)한 후에도 원본 리포지토리의 변경 사항을 반영하고 동기화하는 과정이 필요합니다. 이 글에서는 포크한 리포지토리를 원본과 최신 상태로 유지하면서, 새로운 작업 브랜치를 생성해 작업을 진
Rust 프로젝트에서 Raft 관련 코드 실행 중 Result::unwrap() 호출 시 Err로 인해 패닉이 발생했습니다. 오류는 아래와 같은 메시지를 나타냅니다.백트레이스(Backtrace)는 프로그램이 패닉이나 예외 상황에서 중단되었을 때, 그 중단 시점까지의 함
Raft 기반 분산 시스템을 개발하던 중, memstore-static-members 실행 시 Raft 노드를 부팅하는 과정에서 다음과 같은 오류 메시지가 발생했습니다.로그에 기록된 정보는 다음과 같습니다:이 오류는 스냅샷과 관련된 문제로 보였으며 이를 해결하기 위한
개발을 하다 보면 예상치 못한 에러를 만나는 일이 자주 있습니다. 이번 프로젝트에서도 몇 가지 에러가 발생했고, 이를 해결하는 과정에서 많은 것을 배우게 되었습니다. 이 글에서는 코드 작성 중에 직면했던 에러들과 그 해결 과정을 공유하려고 합니다.에러를 처음 마주쳤을
1. 필요한 라이브러리 및 모듈 임포트 rocksdb::{DB, Options}: RocksDB를 사용하기 위한 필요한 객체들 (DB와 Options)을 임포트합니다. crate::{StableStorage, Result, Entry}: 프로젝트 내에서 정의된 Sta
조인어스월드 동아리 5기에 합격을 했습니다. 앞으로 다양한 사람들과 소통하며 글로벌한 시야를 넓힐 수 있는 기회를 기대하고 있습니다. 새로운 언어와 문화를 배우고 이를 통해 더 넓은 세계를 경험할 수 있을 것이라는 기대감이 큽니다. 동아리 활동이 시작되면 그동안 기대했