LongRAG: Enhancing Retrieval-Augmented Generation with Long-context LLMs
Meta info.
- Authors: Ziyan Jiang, Xueguang Ma, Wenhu Chen
- Paper: https://arxiv.org/pdf/2406.15319
TL; DR
๊ฒ์ ๋จ์๊ฐ ๊ธด ๊ฒฝ์ฐ ์ถ์ถ๋๋ ๋จ์ ์๋ฅผ ๋ํญ ์ค์ด๊ธฐ ์ํ long retriever + long reader์ ์





Problem States
์ผ๋ฐ์ ์ธ retriever setup QA์์ ์ค์ ๋ต ๋๋น document๊ธธ์ด๊ฐ ๊ธด ๋ถ์ผ์น
Suggestion
๊ธด๋ฌธ์๋ฅผ ๊ฒ์ํด์ค๊ณ , ๊ธด ๋ฌธ์์์ ๋ต์ ์ฐพ๋๋ก ํ๋ retriever/reader ์ ์
- Long Retriever Unit: ์ฐพ๋ ๋จ์๋ฌธ์์ ๊ธธ์ด๋ฅผ ๊ธธ๊ฒ ํ๊ณ (4K ์ด์ ํ ํฐ) ๋์ ๊ทธ ๊ฐ์๋ฅผ ์ค์ด๋ ํจ๊ณผ
- DPR ๋ฑ ์ ํต์ ์ธ Retriever๋ ๊ณ ์ ์๋ฐฑ๊ฐ token์ผ๋ก ๊ตฌ์ฑ๋ passage๋ฅผ ๊ฒ์ ๋จ์๋ก ํ์ฉ
- ๊ธธ์ด๊ฐ ๊ธด ๊ฒ์ ์ ๋์ ์ฅ์ : ์๋ฏธ์ ํตํฉ์ฑ + ๋ ๋ง์ ์ ๋ณด ํฌํจ (๋น์ฐ..)
- grouping algorithm ํ์ฉ ๊ฒ์ ๋จ์ ๋ฌธ์(long retriever unit) ๊ตฌ์ถ: hyperlink ๊ธฐ๋ฐ์ผ๋ก document ์ฐ๊ฒฐ => ์ฐ๊ด์๋ ๋ฌธ์๋ผ๋ฆฌ์ grouping
- Long Retriever: ์ต๋ 4~8๊ฐ ๋จ์ ์ฐพ๊ธฐ
- similarity search: ๊ธด ๋ฌธ์ ์ ์ฒด๋ฅผ 1๊ฐ์ embedding์ผ๋ก ์ธ์ฝ๋ฉํ๋๊ฒ ์ด๋ ค์ฐ๋ฏ๋ก, ๊ทผ์ฌ์น๋ก grouping ํ๊ธฐ ์ ์์ ๋ฌธ์ ๋จ์์ค ๊ฐ์ฅ ๋์ ๊ฐ์ผ๋ก ์ฌ์ฉ (๊ฝค ํจ๊ณผ์ ์ด๋ผ๊ณ ๐ค)
- ๋ฌธ์๋ ์ต๋ 100๊ฐ ์ ๋๋ก ๊ตฌ์ฑ
- ์งง์ ๋ฌธ์(1K)๋ ์ต์ ํํ๋๋ก ๊ตฌ์ฑ
- Long Reader: ์์ ์ฐพ์ ๋จ์๋ค์ ํฉ์ณ์ (์ฝ 30K ํ ํฐ) ์ ๋ต ์ฐพ๊ธฐ
- ๊ธฐ์กด ๋ฐฉ์(์งง์ ๋ฌธ์ ๊ธฐ๋ฐ)๋๋ก์ ํ๋กฌํํธ๋ก ๋ฆฌ๋๋ชจ๋ธ์ด ๊ธด ๋ฌธ์์์ ๋ต์ ์ถ์ถํ๋ฉด ์ ๋ชปํ์ง๋ง,
- ๊ธด ๋ฌธ์์ ๋ํด chat tuning๋ LLM์ผ๋ก 1์ฐจ ๋ต๋ณ ์ํจ ๋ค ๊ทธ ๋ต์์ readerํ๋ฉด ๊ฐ์ฅ ํจ๊ณผ์
Effects
- Retriever: bge-large-en-v1.5 / Reader: GPT-4o
- retriever โ grouping ํ long retrieval unit์ด ์ฑ๋ฅ ๋ฒ ์คํธย
pic4 - reader โ QA๋ก ํ์ธ์ ์ญ์ ์ ์ ๋ฐฉ๋ฒ์ด ์ฑ๋ฅ ๋ฒ ์คํธย
pic5