
์์ธ๋ํ๊ต ํํ
ํฌ ๊ณผ์ ์ ์งํํ๋ฉด์ ๋ฅ๋ฌ๋ ํ๋ก์ ํธ๋ฅผ ์ค๋นํ๋ฉฐ ๊ต์๋์ ๊ถ์ ๋ก Chatgpt๋ฅผ ์ฌ์ฉํด๋ณด๋ผ๋ ๊ถ์ ๋ฅผ ๋ฐ์๋ค.
Chatgpt๋ฅผ ์ด๋ป๊ฒ ์ฌ์ฉํด์ ํ๋ก์ ํธ๋ฅผ ์งํํ ๊น ๊ณ ๋ฏผํ๋์ค์ ์ฌ๋ฌ ํด์ธ Youtube, Github ๋ฑ์์ Langchain์ด ํซํ ๋ถ์ผ์ธ๊ฑธ ์๊ฒ๋์ด ์ด๋ฒ ํ๋ก์ ํธ์์ ์งํํ Langchain์ ๊ธฐ๋ฅ์ ๋ฆฌ๋ทฐํ๊ณ ์์ผ๋ก ๊ณ์ ๊ณต๋ถํ๊ณ ์ ํ๋ค.
Langchain์ ๊ธฐ๋ฅ์ ์๊ณ ์ถ์ ๋ถ์ ๋ค์๊ธ ๋ถํฐ ๋ณด์๋ฉด ๋ฉ๋๋ค!
LangChain์ ๊ฐ๋ฐ์๊ฐ LLM(Large Language Model)์ ์ด์ฉํด ์๋ํฌ์๋ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ตฌ์ถํ ์ ์๋๋ก ์ค๊ณ๋ ๊ฐ๋ ฅํ ํ๋ ์์ํฌ์ ๋๋ค. LangChain์ API๋ฅผ ํตํด ์ธ์ด ๋ชจ๋ธ์ ํธ์ถํ๋ ๊ฒ ๋ฟ๋ง ์๋๋ผ, ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ธ์ํ๊ฑฐ๋ ํ ์์คํ ์ ์ํธ ์์ฉํ๋ ์ดํ๋ฆฌ์ผ์ด์ ์ ๊ฐ๋ฐํ ์ ์๋๋ก ํฉ๋๋ค.
Langchain์ ๋ํด ์์ธํ ์์๋ณด๊ธฐ์ ์ด๋ฒ ํฌ์คํ ์์๋ Langchain๊ณผ ๋๋ถ์ด ์์๋ฌ์ผ ํ ๋ช๊ฐ์ง ๊ฐ๋ ์ ๋ํด ๊ฐ๋ตํ ์ ๋ฆฌํ๋๋ก ํ๊ฒ ์ต๋๋ค.
LLM(Large Language Model)์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ๋ก, ๋ฐฉ๋ํ ์์ ํ
์คํธ๋ฅผ ํ์ตํ๊ณ ์์ฝ, ์์ธก, ์์ฑํ ์ ์์ต๋๋ค.
์ฐ๋ฆฌ๊ฐ ์์ฃผ ์ฌ์ฉํ๋ Chatgpt๋ GPT-3.5๋ผ๋ LLM๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ํํ ์ดํ๋ฆฌ์ผ์ด์
์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋ ๊ฑฐ๊ฐ์ต๋๋ค.
์๋๋ GPT๋ฅผ ํฌํจํ ํ์ฌ ํซํ๋ํ์ ์ธ LLM๋ชจ๋ธ์ ๊ฐ๋ตํ ์ค๋ช
์
๋๋ค.

LLM์ ํต์ฌ์ Vector Embedding์ด๋ผ ๋ณผ ์ ์์ต๋๋ค. Vector Embedding์ด๋ ์์ฐ์ด ๋จ์ด๋ค์ ๋ฒกํฐํ ํ๊ฒ์ ๋๋ค.(์๋ฏธ๊ฐ ์ ์ฌํ ํ ์คํธ์ Vector Embedding์ ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ๊น๋ค.)
์๋๋ Chatgpt๊ฐ ์ฌ์ฉํ๋ ๋์ผํ Vector Embedding์ ์์์
๋๋ค.
์ฐธ๊ณ ๋ก chatgpt์ Vector embedding์ ์ฐจ์์ 1536 ์
๋๋ค.

ํด๋น ์๋ฒ ๋ฉํ ์์ฐ์ด๋ฅผ ๋ฒกํฐํ์ผ๊ณผ ๋ฉํ๋ฐ์ดํผ ํ์ผ๋ก ๋ง๋ค๋ฉด https://projector.tensorflow.org ์ฌ์ดํธ๋ฅผ ํตํด ์๋ฒ ๋ฉํ ๋ฒกํฐ๋ฅผ ์๊ฐํํ์ฌ 3์ฐจ์์ผ๋ก ๋ณผ ์ ์๊ณ ์ ์ฌ๋ ๋ํ ๊ฒ์ํด ๋ณผ ์ ์์ต๋๋ค.

Vector Embedding์ ์ํํ๋ค๋ฉด ํด๋น ๋ฒกํฐ๋ฅผ ์ ์ฅํ ์ฅ์๊ฐ ํ์ํ๊ฒ ์ฃ ? ์ด๋ฅผ ์ ์ฅํ๊ธฐ ์ํ ์ ์ฅ์๋ฅผ Vector Database๋ผ๊ณ ํ๋ฉฐ ๊ณ ์ฐจ์์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅ, ๊ฒ์ ๋ฐ ๋ถ์ํ ์ ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ก, ์ ์ฌ๋ ๊ฒ์ ๋ฑ์ ์์ ์ ํนํ๋์ด ์์ต๋๋ค.
ํ์ฌ ์ ๋ช ํ ๋ฒกํฐ ๋ฐ์ดํฐ ๋ฒ ์ด์ค๋ก๋ Pinecone, chroma, faiss๋ฑ์ด ์๊ฒ ์ต๋๋ค.

ํ์ฌ Chatgpt๋ฅผ ์ฌ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ์ ์๋์ ๊ฐ์ด ๋๊ฐ์ง ์
๋๋ค.(์ ํํ๋ GTP-3.5 turbo model)

Browser๋ API์์๋ prompt์ ๊ธธ์ด๊ฐ ๊ธธ๋ฉด Chatgpt๊ฐ ์๋ํ์ง ์๊ณ ์๋ง Chatgpt๊ฐ ๋ต๋ณ์ ํ๋ค๊ฐ ๋๊ธฐ๋ ๊ฒฝ์ฐ๋ฅผ ๋ณด์ จ์ํ ๋ฐ ์ด๋ GPT-3.5 turbo model์ ํ ํฐ์ ํ ๋๋ฌธ์ ๋๋ค.
GPT 3.5 turbo ๋ชจ๋ธ์ฌ์ฉ์ 4096 ํ ํฐ์ด ์ต๋์ด๋, ๋์ผํ ์๋ฏธ์ ๋ฌธ์ฅ์ด์ฌ๋ ํ๊ธ ํ ํฐ์ ์์ด ์์ด ํ ํฐ์ ์๋ณด๋ค 4~5๋ฐฐ ๊ฐ๋ ๋์ Langchain์์ prompt๋ฅผ ์์ฑํ ๋ ํน๋ณํ ๊ฒฝ์ฐ๋ฅผ ์ ์ธํ ๋๋ถ๋ถ์ ์์ด๋ก ์งํํ๋๊ฒ ์ข์์ต๋๋ค.
์์ด์ ํ๊ธ ํ ํฐ์ ๋น๊ต๋ https://platform.openai.com/tokenizer ์์ ์ฝ๊ฒ ํ ์คํธ ํด๋ณผ ์ ์์ต๋๋ค.

๋ค์ ํฌ์คํ ๋ถํฐ๋ ๋ณธ๊ฒฉ์ ์ผ๋ก Langchain์ ๊ธฐ๋ฅ์ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค๐