A Bidirectional Multi-paragraph Reading Model for Zero-shot Entity Linking 제2부

이준석·2023년 3월 6일

Bidirectional Muti-paragraph Reading

Although the Uni-MPR model can promote performance by reading more paragraphs in the entity documents, its performance is still constrained. For the case in Figure 1(b), Uni-MPR model still cannot get a correct result because the key information exists in other paragraphs in the mention document other than the mention context that the model can read. Therefore, a desirable model should read across multiple paragraphs in both mention and entity documents.
Uni-MPR 모델은 기업 문서의 더 많은 문단을 읽음으로써 성과를 촉진할 수 있지만, 그 성과는 여전히 제약을 받는다. 그림 1(b)의 경우 모델이 읽을 수 있는 언급 컨텍스트 이외의 언급 문서의 다른 문단에 핵심 정보가 존재하기 때문에 Uni-MPR 모델은 여전히 정확한 결과를 얻을 수 없다. 따라서 바람직한 모형은 언급 문서와 기업 문서 모두에서 여러 문단에 걸쳐 읽어야 한다.

We need to leverage more textual information in the mention documents besides the mention context defined previously. A naive method is to take multiple paragraphs in the mention document as input directly and apply the UniMPR model once per paragraph. However, directly applying the Uni-MPR model on multiple paragraphs in the mention document needs to read each mention-entity paragraph pair which brings high time complexity. Besides, not all the paragraphs of the mention document are related to the given mention. Treating them equally may incur noises.
우리는 앞서 정의한 언급 맥락 외에도 언급 문서에서 더 많은 텍스트 정보를 활용할 필요가 있다. 단순한 방법은 언급 문서의 여러 단락을 직접 입력으로 받아들여 단락당 한 번씩 UniMPR 모델을 적용하는 것이다. 그러나 언급 문서의 여러 문단에 Uni-MPR 모델을 직접 적용하려면 각 언급-실체 문단 쌍을 읽어야 하므로 시간 복잡성이 높다. 게다가, 언급 문서의 모든 단락이 주어진 언급과 관련된 것은 아니다. 그들을 동등하게 대하면 소음이 발생할 수 있다.

profile
인공지능 전문가가 될레요

0개의 댓글