검색이론
IR중에 하나가 검색임
IR != 검색
QA도 IR의 영역 중에 하나임
많은 문서들 중에서 관련있는 문서를 보내주는 것
사용자가 입력한걸 찾아주는 것과 의도에 맞게 찾아주는 것은 다름
Relevance를 구분하는게 IR에서는 좋다
정의하기도 평가하기도 어려움
DB는 쿼리가 한정적임
색인을 할 것을 정하는 것도 중요한 일임
모든 디스플레이되는 정보를 색인하지는 않음
신조어 같은경우는 기존에 있던 문서들에서 있는지 봐야하기 때문에 전체 색인을 하는 것
오래걸리는 작업
버티컬 검색에서는 디폴트 스코어 BM25나 TF-IDF를 쓰지 않음
가중치를 떨어뜨린다든지 해서 처리했음.
11번가는 카탈로그를 만들어주는 작업 했었음…