MAVE: A Product Dataset for Multi-source Attribute Value Extraction 정리

나며기·2022년 1월 3일
0

paper

목록 보기
3/3

Abstact

본 논문에서는 제품의 속성 추출에 대한 연구를 보다 용이하게 하기 위해, 새로운 데이터셋인 MAVE를 소개한다. MAVE는 Amazon의 220만 개의 제품 큐레이션으로 구성되어, 1,257개의 카테고리와 705개의 속성에 걸쳐 300만 개의 주석이 되어 있다. 이러한 MAVE에는 네 가지 주요 이점이 있다. 첫째, MAVE는 속성-값 예제 수에 따른 가장 큰 속성-값 추출 데이터셋이다. 둘째, MAVE는 제품의 multi-source 표현을 포함하며, 높은 속성 적용 범위로 전체 제품 정보를 캡처한다. 셋째, MAVE는 이전의 데이터셋보다 더 다양한 속성과 값을 다룬다. 마지막으로, MAVE는 매우 도전적인 제로샷 테스트 셋을 제공한다. 또한, 본 논문에서는 multi-source 제품 정보에서 속성-값을 효과적으로 추출하는 새로운 접근법을 제안한다. 그리고 몇 가지 베이스라인을 기준으로 실험을 수행하고 MAVE가 속성-값 추출에 효과적인 데이터셋 임을 보여준다.

Dataset





profile
PLUS ULTRA

0개의 댓글