
NVIDIA 正在為 AI agent 時代提出一個新的基礎設施論點:如果系統無法足夠快速地攝取、處理並根據新鮮資料採取行動,自主性就會瓦解。該公司近期介紹 NVIDIA DAQIRI 的開發者部落格——一個用於高速儀器與感測器的資料擷取管線——與 TMForum 的更廣泛產業訊息相互呼應:AI agent 需要即時資料織網才能大規模運作。
綜合來看,這些來源指向同一個轉變。先進 AI 的瓶頸不再只是模型品質或 GPU 使用權而已。真正的關鍵在於原始訊號與即時決策之間的路徑:資料如何從感測器、裝置、企業系統與事件串流進入軟體,並在不等待傳統「先收集再儲存」工作流程的情況下進行過濾、推理與觸發動作。對 AI agent 的打造者而言,這是一個實務問題,而不是架構口號。
TMForum 的論述範圍更廣、也更偏向企業應用:AI agent 需要即時資料織網,才能在大規模下實現自主。由於來源材料中無法取得該文章全文,因此無法在此核實其精確論點與例子。不過,這個主題與市場上日益成形的趨勢一致。agent 正被定位為能觀察情境、對狀態進行推理,並跨系統採取行動的軟體。這需要對變動中的輸入有穩定、低延遲的視圖。
NVIDIA 的貢獻範圍較窄,但更具體。在其開發者部落格中,該公司將 NVIDIA DAQIRI 描述為 NVIDIA Holoscan Platform 內一個以軟體為核心、具高吞吐量的資料擷取函式庫。這項主張主要面向高頻寬環境,例如科學儀器、工業掃描器與軟體定義無線電,在這些場景中,資料到達速度太快,傳統的先收集、再儲存、再分析管線無法應付。
這不只對實驗室有意義。同樣的設計問題也出現在連接營運軟體、機器人、可觀測性工具、客服系統與製造設備的企業 AI agent 中。如果一個 agent 依據過時記錄、不完整事件串流或延遲回饋迴路來行動,那它就不可能真正自主。
根據 NVIDIA 的說法,NVIDIA DAQIRI 將資料擷取從固定功能的硬體路徑移出,轉而放入更具彈性的軟體層。該公司表示,這套軟體可將高頻寬偵測器與感測器輸出直接串流到 GPU 記憶體中進行即時處理,降低延遲與 CPU 開銷。
其中值得注意的技術主張在於傳輸路徑。NVIDIA 表示,NVIDIA DAQIRI 使用 Data Plane Development Kit(DPDK)繞過 Linux 核心,並透過零拷貝存取,將封包從 NVIDIA ConnectX NIC 直接路由到 GPU DMA 緩衝區。依照公司的描述,這讓進入的串流可直接抵達 GPU,隨即進行過濾、推理、壓縮、事件選擇與自適應控制等操作。
NVIDIA 也將 NVIDIA DAQIRI 定位為更大技術堆疊的一部分,而不是單一工具。該部落格強調其與 NVIDIA Holoscan Platform 的整合,用於即時多模態工作流程;與 TensorRT 的整合,用於低延遲推理;以及與 NVIDIA nvCOMP 的整合,用於串流壓縮。根據 NVIDIA,開發者可透過 YAML 驅動的設定,以及 C++ 和 Python 介面來建立這些管線。
這種以堆疊為單位的說法很重要。對 AI 團隊而言,重點不只是「使用這個函式庫」,而是即時智慧同樣取決於底層管線與模型本身。如果 agent 預期要持續監控狀態、呼叫工具並更新規劃,那麼模型周邊的軟體就必須支援高頻率的攝取、轉換與行動。
來源材料中最有力的使用案例來自 CERN。NVIDIA 表示,A-GHOST 專案正在使用 NVIDIA DAQIRI,將基於 FPGA 的硬體板卡連接到 GPU 處理叢集,以便研究人員分析那些原本會被標準事件選擇流程丟棄的資料串流。
背景是高亮度大型強子對撞機(High-Luminosity Large Hadron Collider)的升級。根據 NVIDIA 的部落格,HL-LHC 的亮度將比原始設計提高 10 倍。NVIDIA 表示,ATLAS 探測器升級後的選擇系統,會將第一階段後被選取事件的頻寬從 100 kHz 提升到 1 MHz,並將第二階段後送往儲存的頻寬從 1 kHz 提升到 10 kHz。即便如此,依據該公司說法,超過 99% 的碰撞仍會在線上系統中被拒絕。
這就是極端情況下的營運問題:即時資料太多,決策時間太少。NVIDIA 表示,A-GHOST 正在探索卷積自編碼器(Convolutional Auto-Encoders)、時間卷積神經網路,以及基於 transformer 的模型,是否能檢視那些原本會被丟棄的串流。
對 AI agent 開發者而言,CERN 的例子可轉化為更熟悉的教訓。大多數自主系統失敗,並不是因為缺少模型呼叫,而是因為它們無法足夠快地分流、排序、壓縮或路由湧入的訊號,來及時做出決策。換句話說,自主性取決於在基礎設施中實作的選擇性注意力。
這裡的來源組合很重要。TMForum 提供了市場框架,但由於報導筆記中無法取得文章全文,因此無法直接引用其論點或進行細部獨立評估。NVIDIA 的開發者部落格則是主要的技術來源,並且包含關於 NVIDIA DAQIRI 的設計、整合與預期使用案例最清楚的事實資訊。
但它仍然是由供應商控制的來源。這意味著本則報導中最強的主張,都是由供應商提出的。NVIDIA 表示,NVIDIA DAQIRI 能在適當的硬體與 CPU/NUMA 調校下,處理包括 UDP 與 RoCE v2 在內的乙太網路資料,且可達每秒數百 Gbps 甚至更高的線速。它也表示,這種架構能將延遲降低到幾乎等同於 PCIe 傳輸時間,讓 NIC ring buffer 直接存取 GPU tensor。這些說法在核心繞過與 GPU-direct 路徑的脈絡下是合理的,但來源材料並未包含獨立基準測試、第三方測試方法,或廣泛的生產部署證據。
同樣地,CERN 的材料描述的是一項研發工作,而不是一個完全經過驗證、已在大規模運作的商業部署。根據 NVIDIA 的說法,A-GHOST 專案涉及 CERN Openlab、University of Chicago 與 UCL 的科學家,且所描述的模型計畫會在原型硬體上測試。這代表了有價值的興趣驗證,但不等同於企業買家可直接採用的成熟生產案例。
因此,這項結論在方向與架構上是穩固的,但在普遍性效能結果或採用廣度上,仍言之過早。
對於正在打造 AI agent 的團隊而言,實際含意是:只有協調框架並不夠。無論技術堆疊使用的是事件驅動微服務、即時可觀測性資料流、工業控制迴路,還是客服互動記錄,常常缺少的是一條從即時資料到推理與行動、穩定且低延遲的路徑。
這會帶來幾項設計需求。
首先,狀態新鮮度成為產品需求。如果 agent 使用過時情境,工具使用就會變得脆弱,且自動化可能演變成錯誤傳播。因此,即時資料移動與 agent 的可靠性直接相關。
其次,若過濾能更早發生,推理經濟性就會改變。如果系統能在模型執行前先丟棄低價值事件或壓縮負載,GPU 資源就會花在真正重要的決策上。NVIDIA 對即時串流過濾與壓縮的強調,正是回應這個成本問題。
第三,部署架構會變得更分散。NVIDIA 的部落格提到從 NVIDIA DGX Spark 到 NVIDIA IGX Platform,再到機架規模伺服器的邊緣系統。更大的市場含意是,不是每一個 agent 工作流程都會在雲端應用層集中執行。有些必須靠近儀器、機器或本地事件來源運行。
第四,可互通性的重要性不亞於原始吞吐量。NVIDIA 表示,NVIDIA DAQIRI 除了 NVIDIA 軟體堆疊之外,還可以將資料串流到客製化、特定儀器的平台。對企業 AI 而言,這個原則同樣適用於 ERP、CRM、IT 系統與營運技術。只有在 agent 能存取並信任周邊系統時,即時資料織網才真正有用。
下一個值得關注的訊號,是 NVIDIA 是否會把這套訊息從科學運算延伸到更主流的企業與工業 AI agent 使用案例。如果 NVIDIA DAQIRI 或相鄰的 NVIDIA Holoscan Platform 元件開始出現在製造自動化、機器人、電信營運或安全監控中,將更能證明這不只是單一 agent 基礎設施布局,而是更廣泛的策略。
第二個訊號是第三方驗證。關於延遲、吞吐量、CPU 節省與營運複雜度的獨立基準測試,會比供應商自述的數字更有意義。買家也會希望看到更清楚的部署案例,而不只是研發合作。
第三,觀察基礎設施供應商與 agent 平台公司是否開始在狀態、事件串流與行動迴路上收斂出共同語言。如果 TMForum 的「即時資料織網」論述獲得牽引力,它可能成為跨企業 AI 與實體世界系統的一個實用市場需求簡稱。
最後,觀察模型設計本身。NVIDIA 在 CERN 的例子提到,卷積自編碼器與基於 transformer 的模型會在即時串流上運作。如果更多 agent 系統採用輕量、持續運作的模型先進行分流,再將更大的推理模型用於升級處理,即時基礎設施的重要性將變得更高。
這則報導最重要的部分,不是將 NVIDIA DAQIRI 視為單一產品,而是提醒我們:AI agent 的自主性只與其資料路徑同樣強。過去兩年,市場一直在談模型、copilot 與協調層。更難的問題,是如何將這些系統連接到即時狀態,並讓延遲夠低、可靠度夠高,以至於行動可以被信任。
對新創與企業團隊而言,這暗示競爭優勢的來源將會改變。更好的提示詞與 agent 框架可能只能帶來邊際改善,但更持久的差異化,較可能來自掌握事件管線、政策層,以及模型與營運系統之間的即時介面。NVIDIA 正從基礎設施端提出這個論點。其餘市場則需要在生產環境中證明它。