랭체인을 사용해 rdg기법으로 pdf에 포함된 정보를 기반으로 질문하는 챗봇 만들기
pymupdf 설치
python3 -m pip install pymupdf
from langchain_community.document_loaders import PyMuPDFLoader
file_path = "/Users/jeong-yuyeong/Documents/GitHub/LangChain/03_retrieval/sample.pdf"
loader = PyMuPDFLoader(file_path) # sample.pdf 로드
documents = loader.load()
print(f"문서 개수: {len(documents)}") # 문서 개수 확인
print(f"첫 번째 문서의 내용: {documents[0].page_content}") # 첫 번째 문서의 내용을 확인
print(f"첫 번째 문서의 메타데이터: {documents[0].metadata}") # 첫 번째 문서의 메타데이터를 확인