
AI 智能體的快速發展在很大程度上是由檢索增強生成(Retrieval-Augmented Generation,RAG)架構所定義的。過去幾年來,為大型語言模型(LLM)提供外部資訊存取權限的標準方法一直是向量資料庫。透過將資料轉換為高維嵌入向量(embeddings)並執行語意相似度搜尋,開發者已成功彌合了靜態 LLM 知識與動態、私有或即時資料之間的鴻溝。然而,隨著 AI 智能體變得更加自主且以任務為導向,一個關鍵的限制出現了:語意相似度並不總是足夠的。
業界開始意識到 AI 智能體——特別是那些負責軟體工程或資料分析等複雜技術工作流程的智能體——所需的不仅仅是向量資料庫所提供的語意「氛圍」而已。它們需要終端機(terminal)的精確度。直接語料庫互動(Direct Corpus Interaction,DCI)的概念正作為智能體處理資料方式的必要演進而獲得動能,這表明智能體 AI 的未來在於賦予它們對其工作環境的命令列存取權限,而不是僅僅依賴索引資料。
向量資料庫在 RAG 的普及化中發揮了關鍵作用。它們允許開發者構建能夠基於海量資料集回答自然語言問題的系統,方法是找出在數學上與查詢「接近」的資訊區塊。在許多場景中,例如客戶支援機器人或通用知識庫,這種方法運作得非常好。
然而,當 AI 智能體被指派編寫、除錯或分析程式碼庫時,「語意相似度」方法往往會引入很高的錯誤率。向量搜尋擅長意圖和上下文,但在精確性方面卻顯得吃力。如果智能體需要查找特定的函式定義、日誌檔案中的唯一錯誤代碼,或精確的配置參數,語意搜尋可能會返回幾個模糊相關的檔案,卻錯過了包含解決問題所需精確字串的那一個檔案。
這種不精確性迫使智能體進行猜測遊戲,導致模型產生幻覺,試圖推斷出檢索到的上下文中不存在的細節。當目標是技術準確性時,近似值並不是一種功能;它是一種負擔。
直接語料庫互動(DCI)代表了一種哲學上的轉變。DCI 的支持者認為,與其將資料預處理為嵌入向量並將原始檔案隱藏在抽象層之後,不如賦予智能體使用命令列介面(CLI)工具直接與原始語料庫互動的能力。
透過為 AI 智能體配備 終端機存取權限,開發者實質上是賦予了模型使用工程師數十年來用於導航目錄的「grep」、「ripgrep」或其他搜尋工具的能力。這種方法改變了智能體與資料之間的關係:
為了更好地理解為什麼業界正轉向這種混合模型,研究這兩種不同的方法如何處理資料檢索將會很有幫助。雖然向量資料庫擅長廣泛的語意探索,但終端機存取提供了技術執行所需的精確度。
| 功能 | 向量資料庫 | 終端機存取 |
|---|---|---|
| 主要搜尋 | 語意/近似 | 精確/基於字串 |
| 最適用於 | 廣泛上下文/氛圍 | 程式碼/日誌/精確度 |
| 工具 | 嵌入/索引 | Grep/Ripgrep/CLI |
| 延遲 | 檢索延遲低 | 解析延遲較高 |
| 資料要求 | 必須產生嵌入 | 可存取原始檔案 |
如上表所示,權衡取捨顯著。對於處理大規模、非結構化的自然語言資料,向量資料庫仍然不可或缺,而對於像程式碼庫儲存庫這樣的結構化和半結構化環境,終端機存取則提供了一個強大的替代方案。
對於尋求整合這些功能的開發者來說,實作的重點不在於取代現有的 RAG 技術棧,而是在於對其進行增強。不久的將來,最先進的 AI 智能體可能會採用分層檢索策略。
在這種分層模型中,向量資料庫作為初始索引層,提供語料庫的高層級概覽以縮小搜尋範圍。一旦智能體識別出相關範圍(例如特定的模組或目錄),它便會利用終端機存取工具深入挖掘並檢索所需的確切資訊。
這種「混合檢索」方法解決了這兩種方法的局限性。它既防止了智能體迷失在龐大的程式碼庫中(純終端機存取的問題),同時也防止了它基於模糊相關的語意區塊產生幻覺(純向量搜尋的問題)。
向 AI 智能體提供終端機存取權限的舉措,是一個更大趨勢的一部分:從「聊天機器人」到「智能體」的轉變。聊天機器人是被動的;它們根據被給予的資料回答問題。然而,智能體是主動的;它們使用工具來收集完成目標所需的資訊。
賦予 AI 智能體終端機存取權限是一種賦能行為。這承認了為了讓智能體在技術領域真正有用,它必須能夠針對「真理來源」(即原始資料本身,而非該資料的有損嵌入)來驗證自己的假設。
展望下一代 AI 開發,我們預計會看到更多優先考慮「工具使用」而非「上下文注入」的框架。透過允許智能體以與人類相同的方式與環境互動,我們不僅提高了它們的準確性;還使它們更可靠、更透明,並最終使其更有能力處理現實世界工作的複雜性。終端機,這個曾經屬於高階使用者的領域,正迅速成為自主智能體最關鍵的介面。