Generation-based MRC
Pre-processing
기존 토큰 대신 자연어를 이용하여 정해진 텍스트 포맷으로 데이터 생성
실제 텍스트 생성
전체 시퀀스의 각 위치마다 모델이 아는 모든 단어들 중 하나의 단어를 맞추는 분류 문제
Model
Post-processing
Passage Retrieval
질문에 맞는 문서를 찾는 것
overview
Open-domain Question Answering
Passage Embedding Space 터 공간
TF-IDF (Term Frequency - Inverse Document Frequency)