使用 RAG 的 LLM 需要訪問(wèn)高質(zhì)量的訓(xùn)練數(shù)據(jù)。然而,由于數(shù)據(jù)分散在不同部門(mén)、系統(tǒng)和格式中,確保數(shù)據(jù)的質(zhì)量和可用性往往具有挑戰(zhàn)性。
為了最大限度地發(fā)揮效果,使用 RAG 的 LLM 還需要連接到部門(mén)希望提取數(shù)據(jù)的來(lái)源 - 如客戶服務(wù)平臺(tái)、內(nèi)容管理系統(tǒng)和人力資源系統(tǒng)等。這類(lèi)集成需要豐富的技術(shù)專業(yè)知識(shí),包括數(shù)據(jù)映射和 API 管理經(jīng)驗(yàn)。
此外,當(dāng) RAG 模型大規(guī)模部署時(shí),會(huì)消耗大量計(jì)算資源并產(chǎn)生大量數(shù)據(jù)。這需要適當(dāng)?shù)幕A(chǔ)設(shè)施和部署經(jīng)驗(yàn),以及管理大型組織數(shù)據(jù)的能力。
RAGOps 是一種引起 AI 專家關(guān)注的主流化 RAG 方法,它是一種能夠以確保一致性同時(shí)降低復(fù)雜性的方式自動(dòng)化 RAG 工作流、模型和接口的方法。
RAGOps 使數(shù)據(jù)科學(xué)家和工程師能夠自動(dòng)化數(shù)據(jù)攝取和模型訓(xùn)練以及推理。它還通過(guò)提供基礎(chǔ)設(shè)施堆棧中的負(fù)載均衡和分布式計(jì)算機(jī)制來(lái)解決可擴(kuò)展性難題。在 RAG 管道的每個(gè)階段都執(zhí)行監(jiān)控和分析,以幫助持續(xù)改進(jìn)模型和運(yùn)營(yíng)。
例如,麥肯錫使用 RAGOps 幫助其 Lilli 生成式 AI 平臺(tái)篩選 10 萬(wàn)份精選文檔。Lilli 已經(jīng)回答了超過(guò) 800 萬(wàn)個(gè)由約四分之三的麥肯錫員工提出的關(guān)于運(yùn)營(yíng)洞察的問(wèn)題。
智能代理 RAG 的時(shí)代即將到來(lái)
作為組織尋求從生成式 AI 實(shí)施中獲取更多價(jià)值的運(yùn)營(yíng)模式,RAGOps 有望在已經(jīng)實(shí)踐過(guò)其他運(yùn)營(yíng)框架 (如 DevOps 或 MLOps) 的組織中得到良好應(yīng)用。
然而,一些組織可能會(huì)采取更新穎的方法,即順應(yīng)生成式 AI 行業(yè)的發(fā)展方向:將 RAG 與智能代理 AI 結(jié)合,使 LLM 能夠適應(yīng)不斷變化的環(huán)境和業(yè)務(wù)需求。
設(shè)計(jì)用于以最少人工干預(yù)執(zhí)行數(shù)字任務(wù)的代理正引起尋求將更多數(shù)字操作委托給軟件的企業(yè)的興趣。根據(jù)德勤研究,到 2025 年將有 25% 的組織實(shí)施企業(yè)代理,到 2027 年將增長(zhǎng)到 50%。
具有 RAG 的智能代理 AI 將包括多種方法和解決方案,但許多場(chǎng)景可能會(huì)共享一些共同特征。
例如,單個(gè)代理將評(píng)估和總結(jié)來(lái)自單個(gè)文檔的問(wèn)題答案,甚至比較多個(gè)文檔之間的答案。元代理將協(xié)調(diào)這個(gè)過(guò)程,管理單個(gè)代理并整合輸出以提供連貫的響應(yīng)。
最終,代理將在 RAG 框架內(nèi)工作,進(jìn)行多步分析、規(guī)劃和推理,在執(zhí)行任務(wù)時(shí)學(xué)習(xí)并根據(jù)新輸入調(diào)整其策略。這將幫助 LLM 隨著時(shí)間的推移更好地響應(yīng)更細(xì)微的提示。
至少在理論上是這樣。
總結(jié)
生成式 AI 技術(shù)的未來(lái)一片光明,它將從研究實(shí)驗(yàn)室流向企業(yè) AI 工廠,成為蓬勃發(fā)展的企業(yè) AI 領(lǐng)域的一部分。
例如,模型的占用空間將縮小,同時(shí)變得更加優(yōu)化,能夠在本地和邊緣的 AI PC 等設(shè)備上高效運(yùn)行。RAG 標(biāo)準(zhǔn)化,包括軟件庫(kù)和現(xiàn)成工具,將繼續(xù)增長(zhǎng)。
無(wú)論您的組織是采用 RAGOps 還是采用智能代理 AI,都正在出現(xiàn)解決方案來(lái)幫助組織擴(kuò)展 RAG 實(shí)施。
例如,當(dāng)應(yīng)用于醫(yī)療保健時(shí),基于 NVIDIA 的 Dell AI Factory 的智能代理 RAG 有助于協(xié)調(diào)使用結(jié)構(gòu)化數(shù)據(jù) (如患者日程和檔案) 和非結(jié)構(gòu)化數(shù)據(jù) (如醫(yī)療記錄和影像文件) 的挑戰(zhàn),同時(shí)保持對(duì) HIPAA 等要求的合規(guī)性。
這只是一個(gè)光明的選擇。更多解決方案正在涌現(xiàn),為正在進(jìn)行生成式 AI 之旅的組織指明方向。
了解更多關(guān)于基于 NVIDIA 的 Dell AI Factory 的信息。
由戴爾科技集團(tuán)為您呈現(xiàn)。