
폐쇄망 환경에서 LangChain의 Token Splitter 사용 시 아래 오류 발생.
Max retries exceeded with url: gpt-2/encodings/main/vocab.bpe
(Caused by NameResolutionError: [Errno -3] Temporary failure in name resolution)
gpt-2 기반 토크나이저tiktoken을 사용tiktoken은 gpt-2 토크나이저 초기화 시 vocab.bpe 파일을 런타임에 인터넷에서 다운로드핵심 원인:
tiktoken의 lazy download 구조tiktoken의 gpt-2 인코딩 파일 사전 다운로드tiktoken 설계 특성cl100k_base 등)에서도 발생 가능https://github.com/openai/tiktoken
https://github.com/langchain-ai/langchain