๋ณธ๋ฌธ
[์ค์ต] ๋ญ์ฒด์ธ(LangChain) Document transformers(Chunking) ์์
๐ค AI/๐ ์ค์ต(Hands-on Labs) 2024. 3. 15. 11:06
๋ฐ์ํ
โ ์ค์ต ์ค๋น๋ฌผ: apikey
https://server-engineer.tistory.com/983
โ ์ฉ์ด์ค๋ช
- Chunk
- ๋ฐ์ดํฐ๋ ํ ์คํธ๋ฅผ ์์, ๊ด๋ฆฌํ๊ธฐ ์ฌ์ด ๋ถ๋ถ์ผ๋ก ๋๋ ํ๋์ ๋ฉ์ด๋ฆฌ
- Chunking
- ๋ถํ ์์ (Chunk)์ ์ํํ๋ ๊ณผ์ ์ผ๋ก, ๋ฐ์ดํฐ๋ฅผ ์๋ฏธ ์๋ ๋จ์๋ก ๋๋์ด ์ฒ๋ฆฌํ๋ ๊ธฐ์ .
- NLP(์์ฐ์ด ์ฒ๋ฆฌ)์์ chunking์ ๋ฌธ์ฅ์ ๋ช ์ฌ๊ตฌ, ๋์ฌ๊ตฌ ๊ฐ์ ์๋ฏธ ์๋ ์กฐ๊ฐ์ผ๋ก ๋ถ๋ฆฌํด ์ ๋ณด ์ถ์ถ์ด๋ ๋ฌธ์ ๋ถ์์ ์ฉ์ดํ๊ฒ ํ๋ค.
โ ์ค์ต ์๋ฃ
โ ์๋น์ค ์ค๋ช
LangChain์ ์ฌ์ฉ์๊ฐ ๋ค์ํ ์์ ์ ์ํํ ์ ์๋๋ก ๋์์ฃผ๋ ์คํ์์ค ๋๊ตฌ ๋ชจ์์ ๋๋ค.
LangChain์ ์ฌ์ฉ์๊ฐ ํ๋กฌํํธ๋ฅผ ์์ฑํ๊ณ ๊ด๋ จ๋ ๋ต๋ณ์ ์ป์ ์ ์๋ ๋ํํ ํ๋ ์์ํฌ์ธ OpenAI์ GPT-3๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํฉ๋๋ค.
์๋น์ค ํ์ฉ ๋ฐฉ์: LangChain์ ๋ค์๊ณผ ๊ฐ์ ๋ค์ํ ์์ ์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
- ์ง๋ฌธ์ ๋ตํ๊ธฐ
- ์์ฝ ์์ฑํ๊ธฐ
- ๋ฒ์ญํ๊ธฐ
- ์ฝ๋ ์์ฑํ๊ธฐ
- ๋ฐ์ดํฐ ๋ถ์ํ๊ธฐ
์ฌ์ฉ์ ์ง๋ฌธ์์ ์๋ต๊น์ง์ ๊ณผ์ :
- ์ฌ์ฉ์๊ฐ LangChain์ ์ง๋ฌธ์ ํฉ๋๋ค.
- LangChain์ ์ฌ์ฉ์์ ์ง๋ฌธ์ ๋ฒกํฐํํ์ฌ ๋ฒกํฐ์คํ ์ด์ ์ ์ฅํฉ๋๋ค.
- ๋ฒกํฐ์คํ ์ด๋ ์ฌ์ฉ์์ ์ง๋ฌธ๊ณผ ์ ์ฌํ ์ง๋ฌธ์ ์ฐพ์ต๋๋ค.
- LangChain์ ์ ์ฌํ ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ๋ฒกํฐ์คํ ์ด์์ ๊ฐ์ ธ์ต๋๋ค.
- LangChain์ GPT-3๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์์ ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ ์์ฑํฉ๋๋ค.
- LangChain์ ์ฌ์ฉ์์๊ฒ ๋ต๋ณ์ ์ ๋ฌํฉ๋๋ค.
์ฌ์ฉ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ:
- OpenAI: GPT-3 API์ ๋ํ ์ก์ธ์ค๋ฅผ ์ ๊ณตํฉ๋๋ค.
- NumPy: ๋ฒกํฐํ ๋ฐ ๊ธฐํ ์ํ์ ์ฐ์ฐ์ ์ํํฉ๋๋ค.
- LangChain: ๋ํํ ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
- VectorStore: ๋ฒกํฐ๋ฅผ ์ ์ฅํ๊ณ ๊ฒ์ํฉ๋๋ค.
๋ฐ์ํ
๋๊ธ