Langchain [4]

yuyeong·2024년 7월 23일
0

LangChain

목록 보기
3/4

주어진 pdf를 기반으로 답변하는 챗봇 만들기

랭체인을 사용해 rdg기법으로 pdf에 포함된 정보를 기반으로 질문하는 챗봇 만들기

pdf에서 문장 불러오기

pymupdf 설치

python3 -m pip install pymupdf

불러올 pdf 준비

코드

from langchain_community.document_loaders import PyMuPDFLoader

file_path = "/Users/jeong-yuyeong/Documents/GitHub/LangChain/03_retrieval/sample.pdf"
loader = PyMuPDFLoader(file_path) # sample.pdf 로드
documents = loader.load()

print(f"문서 개수: {len(documents)}") # 문서 개수 확인
print(f"첫 번째 문서의 내용: {documents[0].page_content}") # 첫 번째 문서의 내용을 확인
print(f"첫 번째 문서의 메타데이터: {documents[0].metadata}") # 첫 번째 문서의 메타데이터를 확인

출력 결과

문장 나누기

profile
이겨내

0개의 댓글

관련 채용 정보