Faiss로 벡터 검색 최적화
우리 회사는 SentenceTransformer를 기반으로 파인튜닝한 문장 임베딩 모델을 사용하고 있다.하지만 모델의 크기가 커질 수록 임베딩 시간은 늘어나고 많은 연산량을 요구하게된다.그렇다고 모델의 크기를 줄이면 정확도가 떨어진다.하지만 ONNX는 Inferance