RAG已死,代理式檢索萬歲
香草天空
發(fā)布于 云南 2025-06-16 · 3962瀏覽 3贊

RAG已死,代理式檢索(Agentic Retrieval)崛起 —— 來自 LlamaIndex 的新一代知識助手方案

傳統(tǒng)的 RAG(Retrieval-Augmented Generation)方法,依賴簡單的“top-k向量檢索”,已經(jīng)逐漸無法滿足現(xiàn)代智能系統(tǒng)日益復雜的需求。如今,構(gòu)建一個真正智能的知識檢索系統(tǒng),需要整合多種技術(shù),如混合搜索(Hybrid Search)、自監(jiān)督RAG(Self-RAG)、深度研究(Deep Research)、多模態(tài)嵌入、CRAG、RAPTOR等。這篇博客由 LlamaIndex 團隊撰寫,介紹了如何構(gòu)建一個具備“代理能力”的智能檢索系統(tǒng),從基礎(chǔ)的檢索模式逐步升級,最終實現(xiàn)跨知識庫、多模式自適應檢索。

基礎(chǔ)回顧:傳統(tǒng) RAG 的局限

最基礎(chǔ)的檢索方式是將文檔切分為“chunk”后存入向量數(shù)據(jù)庫,通過查詢向量與其進行相似度匹配。這種方式簡單易用,但面對復雜、多樣化的問題場景時,效果有限。

LlamaIndex 在此基礎(chǔ)上進一步擴展,支持三種更細致的檢索模式:

  1. chunk 模式:默認模式,檢索文檔片段。

  2. files_via_metadata:根據(jù)文件名或路徑匹配,適用于用戶指明具體文件的查詢。

  3. files_via_content:基于文件整體內(nèi)容的語義理解,適用于通用問題。

 

進階能力:自動選擇檢索方式(Auto-routed 模式)

面對用戶提出的復雜問題,我們往往無法預先判斷應使用哪種檢索模式。為此,LlamaIndex 引入了“auto_routed”模式,通過一個輕量級代理判斷最適合的檢索路徑。這一能力大幅提升了系統(tǒng)的適應性與智能性,讓 AI 能夠根據(jù)問題自動選擇最合適的檢索方式,無需用戶干預。

 

更進一步:跨知識庫的智能檢索

實際應用中,知識庫通常由多種不同格式、不同主題的文檔組成,如財報、會議紀要、客服記錄等。LlamaIndex 提供了“Composite Retriever(復合檢索器)”,可以將多個索引整合為一個統(tǒng)一的檢索接口,并為每個子索引提供名稱和描述,從而引導代理系統(tǒng)更智能地決定在哪個索引中檢索答案。

這種方式使得系統(tǒng)不僅能檢索多來源內(nèi)容,還能基于語義理解自動判斷哪個子知識庫更相關(guān),真正實現(xiàn)“跨知識庫智能路由”。

 

最終形態(tài):全鏈路代理式檢索系統(tǒng)

在代理系統(tǒng)的頂層,LlamaIndex 的復合檢索器負責判斷應訪問哪些知識庫;在子知識庫層面,auto_routed 模式進一步?jīng)Q定使用何種檢索方式。這種兩層代理機制,形成了一個真正的“全代理式檢索”系統(tǒng),具備以下能力:

  • 多索引自動路由

  • 多檢索策略智能判斷

  • 全程使用 LLM 參與決策

  • 高適應性與可擴展性

  •  

結(jié)語:未來屬于智能代理,檢索系統(tǒng)是其基礎(chǔ)

智能代理正在成為現(xiàn)代 AI 應用的核心組成部分,而高效、精準的數(shù)據(jù)檢索能力則是其賴以生存的基石。LlamaCloud 提供了穩(wěn)定可靠的檢索基礎(chǔ)設(shè)施,使得構(gòu)建企業(yè)級、可擴展的智能問答與助手系統(tǒng)成為可能。

LlamaIndex 倡導的代理式檢索,正引領(lǐng) RAG 向更智能、更靈活的方向演進。

香草天空
浮生若夢 而陽春召我以煙景
瀏覽 3962
3
相關(guān)推薦
最新評論
贊過的人 3
評論加載中...

暫無評論,快來評論吧!