똑같거나 비슷한 질문이 들어왔을 때 일관성을 높이기 위해선 temperature를 0에 가깝게 설정하면 된다. from langchain.chat_models import ChatOpenAI : 채팅 답변을 타이핑하듯이 출력하여 답변이 지연되는 현상을 완화할 수 있음채
"Prompt"는 모델에 대한 입력을 의미한다. 이 입력은 여러 구성 요소로 구성되는데 "Prompt Template"은 입력의 구성을 담당해 LangChain이 프롬포트를 쉽게 구성하고 작업할 수 있도록 여러 클래스와 함수를 제공한다.Prompt Template은 크
RAG는 외부 데이터를 참조하여 LLM이 답변할 수 있도록 해주는 프레임워크이다.RAG는 파인튜닝과 함께 엮어서 설명된다. 이들은 모두 LLM이 기존에 가지고 있지 않은 지식을 포함해서 답변할 수 있도록 만들어주는 프레임워크라고 할 수 있다. 파인튜닝의 경우 LLM이
텍스트를 숫자로 변환하여 문장 간의 유사성을 비교할 수 있도록 한다.분할된 문서들을 각각의 하나의 Embedding Model로 변환비정형 데이터를 숫자로 표현해 좌표 안에 위치시킬 수 있다. 이러한 좌표 상에서 가장 가까운 벡터를 찾음으로써 유사한 문장을 찾는다.이러
RAG에 임베딩 모델을 통해 수치화된 텍스트들을 벡터 저장소에 저장하고 유사 문장을 찾아주는 것Vectorstore에는 여러 종류가 존재하지만, 대표적으로 Chroma, FAISS가 있다. Pure vector databases: DB들이 가지고 있는 툴들이 만이 들어
Retriever는 비정형 쿼리가 주어지면 문서를 반환하는 인터페이스이다. 벡터 저장소보다 더 일반적이다. Retriever는 문서를 저장할 필요 없이 단지 반환만 할 수 있다.pip install chromadb tiktoken transformers sentence