[TIL]Day 211

이재희·2021년 6월 29일
0

TIL

목록 보기
211/312

검색이론

IR중에 하나가 검색임

IR != 검색

QA도 IR의 영역 중에 하나임

많은 문서들 중에서 관련있는 문서를 보내주는 것

사용자가 입력한걸 찾아주는 것과 의도에 맞게 찾아주는 것은 다름

Relevance를 구분하는게 IR에서는 좋다

정의하기도 평가하기도 어려움

DB는 쿼리가 한정적임

색인을 할 것을 정하는 것도 중요한 일임

모든 디스플레이되는 정보를 색인하지는 않음

신조어 같은경우는 기존에 있던 문서들에서 있는지 봐야하기 때문에 전체 색인을 하는 것

오래걸리는 작업

버티컬 검색에서는 디폴트 스코어 BM25나 TF-IDF를 쓰지 않음

가중치를 떨어뜨린다든지 해서 처리했음.

11번가는 카탈로그를 만들어주는 작업 했었음…

profile
오늘부터 열심히 산다

0개의 댓글