
隨著企業爭相將人工智慧(Artificial Intelligence)整合進其核心營運,淘金熱潮背後也籠罩著陰影。在 Creati.ai,我們一直強調大型語言模型(Large Language Models,LLMs)的變革潛力。然而,隨著這些系統從實驗性的聊天機器人轉變為自主的企業代理,威脅格局已發生顯著變化。提示注入(Prompt Injection) 的最新漏洞表明,曾經只是實驗性原型的麻煩,如今已轉變為現代 AI 架構中系統性的缺陷。
OWASP LLM 前十大風險將提示注入列為首要安全風險(LLM01)。然而,近期報告顯示,這些攻擊已不僅止於簡單的「越獄」。今日的漏洞利用正精確瞄準 企業 AI 複雜的連結組織,特別是針對多代理系統、檢索增強生成(Retrieval-Augmented Generation,RAG)管道以及模型路由器。
核心問題在於當前基於 LLM 的系統設計理念。為了讓 AI 更具自主性,開發者無意中賦予了這些模型過大的權限。當代理具備瀏覽網頁、查詢內部資料庫及執行程式碼的能力時,一次成功的提示注入就不再僅僅是「干擾」,而成為系統全面受損的媒介。
| 媒介類型 | 目標組件 | 受損影響 |
|---|---|---|
| 間接提示注入 | RAG 管道 | 資料竊取與未經授權的文檔索引存取 |
| 代理劫持 | LLM 代理 | 未經授權的 API 執行與企業網路內的橫向移動 |
| 路由操縱 | 模型路由器 | 將流量重新導向至惡意或未對齊的模型端點 |
檢索增強生成(RAG)是目前將 LLM 植根於專有企業資料中的業界標準。然而,對外部資料來源的依賴使 RAG 管道極易受到間接提示注入的影響。如果攻擊者能將惡意文本注入到已索引的文檔中(如 PDF、網頁抓取內容或資料庫條目),RAG 系統在查詢時會無意中檢索到該指令,從而有效地誘騙 LLM 執行攻擊者隱藏的指示。
這並非理論場景。當代理檢索資料時,它通常將該資料視為隱含指令而非單純的上下文。因此,用戶在查詢人力資源入口網站時,可能會在不知情下觸發代理將敏感的員工記錄傳送到外部伺服器,因為 RAG 管道擷取到了包含隱藏指令與控制指令的「受污染」文檔。
企業 AI 的複雜性通常需要使用「模型路由器」——即旨在將特定提示引導至最具成本效益或最適合任務模型的系統。這些路由器目前正成為攻擊目標。
對於大規模部署 AI 的組織而言,安全模型必須從外圍防禦轉向基於指令的驗證。在 Creati.ai,我們建議安全團隊實施以下防護措施:
提示注入演變為針對 RAG 管道與企業代理的攻擊,標誌著安全產業的一個成熟節點。我們正進入一個 AI 安全與傳統應用安全難以區分的時代,但增加了概率性、非確定性輸出所帶來的複雜性。
雖然這些攻擊的技術複雜度很高,但企業不應撤回由 LLM 實現的創新。相反,組織必須採用「安全設計(security-by-design)」框架。透過理解每個連接點——從 RAG 管道中的提取器到自主代理的指令集——都是潛在的開發介面,安全團隊可以主動加固其系統。
在 Creati.ai,我們認為透明度與嚴格的架構分析是打擊這些威脅的主要工具。隨著我們改進這些系統,產業界必須優先建立能區分意圖與內容的防禦性 AI 框架,確保未來的代理仍處於部署它們的企業的嚴格控制之下。