๋ณธ๋ฌธ

[LLM ํ•™์Šต] Fine-tuning vs RAG

๋ฐ˜์‘ํ˜•

Q. llm model ์ถ”๊ฐ€ ํ•™์Šต ๋ฐฉ๋ฒ•์—๋Š” fine tuning๊ณผ rag ๋ฅผ ์ด์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•, ํฌ๊ฒŒ ์ด ๋‘๊ฐ€์ง€๊ฐ€ ์žˆ๋‹ค๊ณ  ์•Œ๊ณ  ์žˆ์–ด. ๋งž์•„?

๋„ค, ๋งž์Šต๋‹ˆ๋‹ค. LLM(Large Language Models)์„ ์‚ฌ์šฉํ•  ๋•Œ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์ด๋‚˜ ๋„๋ฉ”์ธ์— ๋งž๊ฒŒ ์ถ”๊ฐ€ ํ•™์Šต์‹œํ‚ค๋Š” ์ฃผ์š” ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” Fine-tuning๊ณผ RAG(Retrieval-Augmented Generation)์„ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋‘ ๋ฐฉ๋ฒ•์€ ์„œ๋กœ ๋‹ค๋ฅธ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

1. Fine-tuning: ์ด ๋ฐฉ๋ฒ•์€ ์‚ฌ์ „ ํ•™์Šต๋œ LLM์— ์ถ”๊ฐ€ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜๊ณ , ๋ชจ๋ธ์˜ ๋ชจ๋“  ๋˜๋Š” ์ผ๋ถ€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํŠน์ • ์ž‘์—…์ด๋‚˜ ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ์— ๋งž๊ฒŒ ์žฌํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค. Fine-tuning์„ ํ†ตํ•ด ๋ชจ๋ธ์€ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์…‹์˜ ํŒจํ„ด์„ ํ•™์Šตํ•˜๋ฉฐ, ์ด๋Š” ๋ชจ๋ธ์ด ํŠน์ • ์ž‘์—…์— ๋” ์ž˜ ์„ฑ๋Šฅ์„ ๋‚ด๋„๋ก ๋•์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ฒ•๋ฅ ์ด๋‚˜ ์˜๋ฃŒ ๋ถ„์•ผ์™€ ๊ฐ™์ด ํŠนํ™”๋œ ์˜์—ญ์—์„œ ๋ชจ๋ธ์˜ ์ดํ•ด๋„์™€ ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2. RAG(Retrieval-Augmented Generation): RAG๋Š” ๊ฒ€์ƒ‰์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ, ์ฃผ์–ด์ง„ ์งˆ๋ฌธ์ด๋‚˜ ์ž…๋ ฅ์— ๋Œ€ํ•ด ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ํŠนํžˆ ๋Œ€๊ทœ๋ชจ์˜ ์ •๋ณด ์ €์žฅ์†Œ์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ๋ณด๋‹ค ์ •ํ™•ํ•˜๊ณ  ์ •๋ณด์— ๊ธฐ๋ฐ˜ํ•œ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•  ๋•Œ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. RAG๋Š” ๊ฒ€์ƒ‰๋œ ์ •๋ณด๋ฅผ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ๊ณผ์ •์— ํ†ตํ•ฉํ•จ์œผ๋กœ์จ, ๋ชจ๋ธ์ด ๋” ๋„“์€ ๋ฒ”์œ„์˜ ์ง€์‹์„ ํ™œ์šฉํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

๋‘ ๋ฐฉ๋ฒ• ๋ชจ๋‘ ๊ฐ๊ฐ์˜ ์žฅ์ ์ด ์žˆ์œผ๋ฉฐ, ์‚ฌ์šฉ ์‚ฌ๋ก€๋‚˜ ๋ชฉํ‘œ์— ๋”ฐ๋ผ ์ ์ ˆํ•œ ๋ฐฉ๋ฒ•์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Fine-tuning์€ ๋ชจ๋ธ์ด ํŠน์ • ๋„๋ฉ”์ธ์˜ ์–ธ์–ด ํŒจํ„ด๊ณผ ์ง€์‹์„ ๋” ๊นŠ์ด ์ดํ•ดํ•˜๋„๋ก ๋•๋Š” ๋ฐ˜๋ฉด, RAG๋Š” ์‹ค์‹œ๊ฐ„์œผ๋กœ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋‹ต๋ณ€์˜ ์ •ํ™•๋„์™€ ๊ด€๋ จ์„ฑ์„ ๋†’์ด๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค.


Q. LLM์„ ์ถ”๊ฐ€ ํ•™์Šต ์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์—์„œ๋Š” fine tuning ๋ณด๋‹ค๋Š” rag๊ฐ€ ๋” ๋น ๋ฅด์ง€?

RAG(Retrieval-Augmented Generation)์™€ Fine-tuning ์‚ฌ์ด์—์„œ "๋น ๋ฅด๊ฒŒ" ์ถ”๊ฐ€ ํ•™์Šต์„ ์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์€ ๋ชฉํ‘œํ•˜๋Š” ๋ฐ”์™€ ๊ตฌ์ฒด์ ์ธ ์ƒํ™ฉ์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๋‘ ๋ฐฉ๋ฒ•์€ ๊ทผ๋ณธ์ ์œผ๋กœ ๋‹ค๋ฅธ ์ ‘๊ทผ๋ฒ•์„ ์‚ฌ์šฉํ•˜๋ฉฐ, ๊ฐ๊ฐ์˜ ์†๋„์™€ ํšจ์œจ์„ฑ์€ ์‚ฌ์šฉ ์‚ฌ๋ก€์™€ ํ•„์š”์— ๋”ฐ๋ผ ๋ณ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

- Fine-tuning์€ ๋ชจ๋ธ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ํŠน์ • ์ž‘์—…์ด๋‚˜ ๋ฐ์ดํ„ฐ์…‹์— ๋งž๊ฒŒ ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋ชจ๋ธ์„ ์ƒˆ๋กœ์šด ๋„๋ฉ”์ธ์ด๋‚˜ ์ž‘์—…์— ๋งž๊ฒŒ "์žฌ๊ต์œก"ํ•˜๋Š” ๊ฒƒ์„ ํฌํ•จํ•˜๋ฉฐ, ์ด ๊ณผ์ •์—์„œ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ํฌ๊ธฐ์™€ ๋ชจ๋ธ์˜ ๋ณต์žก์„ฑ์— ๋”ฐ๋ผ ํ•™์Šต ์‹œ๊ฐ„์ด ๊ฒฐ์ •๋ฉ๋‹ˆ๋‹ค. ๋Œ€์ฒด๋กœ, Fine-tuning์€ ์ ์ ˆํ•œ ์–‘์˜ ํŠน์ • ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๊ณ , ๋ชจ๋ธ์ด ํ•ด๋‹น ๋„๋ฉ”์ธ์˜ ์–ธ์–ด ํŒจํ„ด๊ณผ ์ง€์‹์„ ํ•™์Šตํ•ด์•ผ ํ•  ๋•Œ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค.

https://medium.com/neo4j/knowledge-graphs-llms-fine-tuning-vs-retrieval-augmented-generation-30e875d63a35



- RAG๋Š” ๊ธฐ์กด์˜ ๋ฌธ์„œ๋‚˜ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ, ํ•ด๋‹น ์ •๋ณด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•์€ ๋ชจ๋ธ์ด ์ง์ ‘ ํ•™์Šตํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค๋Š” ์™ธ๋ถ€ ์ •๋ณด๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๋‹ต๋ณ€์˜ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค. RAG์˜ ์†๋„์™€ ํšจ์œจ์„ฑ์€ ๋Œ€๊ทœ๋ชจ ์ •๋ณด ์ €์žฅ์†Œ์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ๊ฒ€์ƒ‰ํ•˜๊ณ  ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์— ํฌ๊ฒŒ ์˜์กดํ•ฉ๋‹ˆ๋‹ค.

 

https://neo4j.com/developer-blog/knowledge-graphs-llms-multi-hop-question-answering/

 

์ •๋ฆฌํ•˜๋ฉด, ๋‹น์žฅ์˜ "์†๋„" ์ธก๋ฉด์—์„œ ๋ณผ ๋•Œ, RAG๋Š” ๊ธฐ์กด ์ง€์‹์„ ๋ฐ”ํƒ•์œผ๋กœ ์ƒˆ๋กœ์šด ์งˆ๋ฌธ์— ๋Œ€๋‹ตํ•˜๋Š” ๋ฐฉ์‹์ด๊ธฐ ๋•Œ๋ฌธ์—, ๋ชจ๋ธ์„ ํŠน์ • ๋ฐ์ดํ„ฐ์…‹์— ๋งž๊ฒŒ ์ „์ฒด์ ์œผ๋กœ ํ•™์Šต์‹œํ‚ค๋Š” Fine-tuning ๊ณผ์ •๋ณด๋‹ค๋Š” ๋” "๋น ๋ฅธ" ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ์ด๋Š” RAG๊ฐ€ ํŠน์ • ์œ ํ˜•์˜ ์ž‘์—…(์˜ˆ: ํŠน์ • ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ์ž‘์—…)์— ๋” ์ ํ•ฉํ•  ๋•Œ ํ•ด๋‹น๋˜๋ฉฐ, ๋ชจ๋ธ ์ž์ฒด์˜ ์ดํ•ด๋„๋‚˜ ์–ธ์–ด ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๊ทผ๋ณธ์ ์œผ๋กœ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด์„œ๋Š” ์—ฌ์ „ํžˆ Fine-tuning์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ, ๋ชฉํ‘œํ•˜๋Š” ์ž‘์—…์˜ ์œ ํ˜•๊ณผ ์š”๊ตฌ ์‚ฌํ•ญ์— ๋”ฐ๋ผ ์ ์ ˆํ•œ ๋ฐฉ๋ฒ•์„ ์„ ํƒํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

 

๋ฐ˜์‘ํ˜•

๊ณต์œ 

๋Œ“๊ธ€