팀원들과 회의를 통해 앞으로 무엇을 해야할지 정리하였고,
'평가지표, RAG 검색기능 성능향샹, WEB UI 만들기'로 크게 틀을 잡았다.
회의 전, RAG 검색기능 향상기법에 대해서 조사하는 과정을 가졌으며,
현재의 'LangChain + ChromaDB + Llama 3.1' 환경에서 고려했을시,
아래의 6가지가 있다는 것을 확인할 수 있었다.
근데 이것을 모두 적용하면 서버 뻗거나, 답변하는데 속도도 너무 느릴거라는 문제점이 있었다.
그래서 더 조사해본 결과.
현재 'CPU 서버 t3a.large'인 거 고려했을때,
'3. Hybrid Search + 5. Re-ranking'
이거 2개만 적용하는 게 제일 가성비 좋은 조합임을 확인할 수 있었다.
'4. Multi-Query와 6. Corrective RAG'는 CPU 서버에서 실행하면 시간이 너무 오래 걸리고,
'1. Parent Document Retriever'는 저장한 데이터를 싹 지우고 다시 다른 구조?로 저장해야한다는 문제가 있었다.
따라서 현재 상황에선 득보다 실이 더 큰 상황이므로, 위의 1/4/6은 배제하는 방향으로 길을 잡았다.
일단 'Hybrid Search + Re-ranking' 방식이 기존 데이터는 건드리지 않고, 코드만 수정해서 향상이 가능한 방식임을 알았고, 1순위와 2순위로 지정해놓았다.
팀원들과도 회의 끝에 각자의 역할을 분담하였고, 다음 대면회의 때까지 시간이 조금 빡빡하지만?
상호 간의 도움을 통해 위의 기법들을 로컬에서 테스트하고, 최적의 기법을 찾기로 하였다.
WEB UI 또한 완성시켜 프로젝트의 완성도를 높일 예정이다.
넘모 어려워요 ... AI분들 대단하심 ..