
Anthropic 的全新 Claude Science 工作台上線時,帶著一個值得注意的基礎架構合作夥伴:NVIDIA。根據 NVIDIA 的說法,Claude Science 現在整合了 NVIDIA BioNeMo Agent Toolkit,讓生命科學研究人員能夠在代理驅動的研究環境中,呼叫由 NVIDIA 支援的生物學模型、函式庫與推理服務。
其即時意義不只是又一個模型整合。NVIDIA 正在將 BioNeMo 定位為工具層,讓科學代理能真正執行貼近實驗室的運算工作,而不只是討論論文或提出假設。依照公司的說法,Claude Science 提供自然語言介面與代理編排,而 BioNeMo 則在底層提供可呼叫的科學能力,涵蓋基因組學、結構預測、分子設計與化學資訊學等任務。對 AI 建構者與企業研究團隊而言,這項公告與其說是給科學家的聊天機器人,不如說是一套將特定領域 AI 工作流程產品化的技術堆疊。
NVIDIA 表示,該工具包現已可透過其開發者資源與 GitHub 取得,同時還表示 Anthropic 的 Claude Science 正進入公開測試版。這個時點很重要。市場正在從寬泛的「AI 助理」說法,轉向能可靠選擇工具、傳遞有效輸入、解讀輸出,並在專業領域中執行迭代式工作流程的系統。生命科學正是檢驗這種代理模型能否在真實限制下運作的最清楚場域之一。
核心消息是 Claude Science 與 NVIDIA BioNeMo Agent Toolkit 之間的連結。NVIDIA 將此工具包描述為一組可供代理使用的「技能」,能將科學能力以可呼叫服務的形式暴露出來。實際上,這表示代理可以找到合適工具、理解其所需輸入與輸出、執行它,並將結果納入更長的研究循環中。
NVIDIA 表示,這個設定可讓 Claude Science 呼叫加速工作流程與模型,包括 Evo 2、Boltz-2 與 OpenFold3。更廣泛的 BioNeMo 堆疊也涵蓋基因組學與化學資訊學工具的存取路徑,例如 NVIDIA Parabricks、RAPIDS-singlecell 與 nvMolKit。依照 NVIDIA 的描述,每個技能都包含用途、輸入、預期產物與失敗模式等中繼資料,目的是減少一般用途代理常見的一個問題:它們可能知道蛋白質模型或對接模型有關聯,但不知道如何正確呼叫。
對於在受監管或高風險場景中建構 AI 代理的人來說,這一點很重要。科學工作流程常常不是因為模型不存在而失敗,而是因為周邊編排脆弱。如果代理無法可靠地選擇參數、提交格式正確的請求,或解讀如 FASTA、CIF、SDF、A3M 或 SMILES 等回傳檔案,那麼工作流程不會因為有前沿模型參與就變成可生產部署。
根據 NVIDIA 的說法,Anthropic 的角色是提供工作台,讓科學家能以自然語言描述任務,並在基因組學、蛋白質組學、單細胞分析、化學資訊學與臨床研究等領域與專業代理互動。NVIDIA 的貢獻則是加速運算層與領域工具,讓這些代理可以直接呼叫,而不必由科學家手動配置模型或軟體環境。
NVIDIA 的兩份來源都提出同樣的論點:科學代理的實用性取決於它能操作哪些工具。這聽起來很直觀,但它點出了許多當前 AI 代理示範的核心限制。程式設計代理往往能透過測試通過來證明自己完成了任務;但生物學代理則處於更混亂的環境中,正確性是機率性的,工作流程跨越多種工具,而輸出也需要科學解讀。
NVIDIA 試圖透過標準化工具介面來解決這個問題,而不是讓代理從原始 API 文件或原始碼中自行推斷一切。公司表示,BioNeMo Skills 與相關的 Model Context Protocol 包裝器會記錄模型用途、輸入需求、預期產物與失敗模式,讓代理能以更高可靠度自主發現並使用生物分子模型。
對建構者而言,這比一次性的模型發布更具影響力。若工具包如描述般運作,團隊可以在不同代理框架與部署環境中重複使用同一種技能模式。NVIDIA 明確表示 NVIDIA BioNeMo Agent Toolkit 是開放且與框架無關的,這一點很重要,因為多數企業都不希望科學工作流程被困在單一專有編排堆疊中。
這項整合也反映出企業 AI 更廣泛的設計模式:讓對話層保持彈性,同時將領域工具視為穩定服務。在此案例中,BioNeMo NIM 微服務就是生產端點層。NVIDIA 表示,這些容器化推理服務把完整的加速軟體堆疊封裝在穩定 API 之後,旨在讓團隊無論使用託管端點或本地基礎架構都能更容易部署。
這則報導中最強的主張來自 NVIDIA 自身素材,在未經獨立驗證前,應視為供應商回報。
NVIDIA 表示,前 20 大製藥公司中有 18 家使用 NVIDIA BioNeMo。這是一個吸睛的採用訊號,但公司在來源材料中並未提供客戶名稱、支出規模或使用深度。這代表的是生態系覆蓋範圍,不一定代表 BioNeMo Agent Toolkit 本身的部署程度。
公司也強調了與底層工具相關的幾項速度主張。它說 NVIDIA Parabricks 可將基因組分析從數小時縮短到數分鐘。它說由 scverse 開發的 RAPIDS-singlecell,可將 130 萬細胞的前處理與分群工作流程從 52 分鐘縮短到 25 秒。它也表示 nvMolKit 能將某些化學資訊學操作加速最多達 3,000 倍。這些都是代理架構之所以有機會在實務上可用的重要指標:更快的工具讓迭代循環成為可能。但它們仍然是產品端的效能說法,而非藥物發現端到端計畫中的獨立基準測試。
最直接的代理基準來自 NVIDIA 的開發者部落格。該公司表示,使用「GPT-5.5 fast」搭配 Codex CLI 進行的實證基準測試顯示,BioNeMo Skills 將 token 效率加倍,並把任務完成率從 57.1% 提升到 100%。這個結果值得注意,因為它暗示價值不僅來自加速,也來自更清晰的工具介面。不過,這仍是內部或由供應商控制的測試設定,所提供的證據並未包含詳細方法、任務分佈或外部複現。
簡而言之,整合是真實的,工具包可用,架構也清楚。關於可靠性提升、吞吐量與生產力的更強主張,應被視為前景可期,但尚未經獨立證實。
NVIDIA 開發者材料中的一個實用細節,是託管與本地部署之間的區分。NVIDIA 表示,BioNeMo NIM 可以作為託管端點運行以便更容易存取,也可以在本地運行,以便團隊需要更低的啟動延遲、更高的執行控制、更緊密的資料處理,或對同一模型進行重複呼叫時使用。
這很可能會影響製藥與生技領域的企業 AI 買家。研究團隊通常希望在評估階段先享有託管服務的便利,但生產型生物學工作流程可能對資料所在地、吞吐量與稽核性提出顧慮。NVIDIA 的建議本質上是一條混合路徑:先用託管存取進行廣泛實驗,再在延遲、安全性或重複迭代足以證明需要時,將部分服務移到本地。
這種混合模式也符合代理部署通常的成熟方式。早期試點通常先證明偶發呼叫的可用性;如果這些試點演變成常規的候選生成或結構預測循環,基礎架構經濟性與可靠性就會比展示品質更重要。透過讓相同的 BioNeMo 能力可經由託管或本地 NIM 端點使用,NVIDIA 正試圖降低遷移負擔。
還有一個競爭層面的考量。這項整合讓 NVIDIA 進入 Anthropic 的領域導向介面,而不是迫使客戶使用純 NVIDIA 的前端。這顯示 NVIDIA 希望 BioNeMo 成為 AI 代理的預設科學執行層,不論頂層體驗來自 Claude Science、內部平台,或其他研究工作台。
由於這則報導中的兩個來源都來自 NVIDIA,因此報導紀錄在產品意圖上很強,但在第三方驗證上較弱。我們知道 Claude Science 正進入公開測試版,這是根據 NVIDIA 部落格所述,而 Anthropic 正邀請研究人員申請更多專家與整合。我們也知道 NVIDIA BioNeMo Agent Toolkit 現已可用,且 NVIDIA 希望將其作為一組可攜式、可由代理呼叫的技能來使用。
較不清楚的是,對外部團隊而言,這些宣稱的工作流程中有多少是今天就能開箱即用。NVIDIA 列出了 OpenFold3、Boltz-2、Evo 2、DiffDock、GenMol、ProteinMPNN、RFdiffusion、MMseqs2 與 BioNeMo NIM 等模型與工具,但來源材料並未拆分哪些能力已完整封裝、哪些需要 MCP 包裝器、哪些更適合作為建構模組,而非終端用戶產品。
此外,計算加速與科學有效性之間仍有落差。更快的迭代能幫助研究人員篩選更多構想,但無法證明濕實驗結果更好。NVIDIA 以癌症標的抑制劑設計為例,說明的是工作流程的野心,而非經過驗證的治療結果。
首先,觀察 Anthropic 的 Claude Science 測試版是否會產生具名研究使用者、案例研究,或使用 NVIDIA BioNeMo Agent Toolkit 的同行評審成果。這會比發布當天的架構圖更能反映產品市場契合度。
第二,留意企業是否將 BioNeMo Skills 或 Model Context Protocol 包裝器標準化為跨多個代理的工具層,而不只是在 Claude Science 內部使用。如果這發生,NVIDIA 將能在企業 AI 中強化其地位,不再只侷限於 GPU 與推理服務。
第三,監測託管與本地 BioNeMo NIM 部署是否會成為製藥與生技團隊實際的採購選項。採用與否可能取決於公司能不能先快速上手,同時又不必在後期放棄控制權。
最後,持續關注獨立基準測試。關於 token 效率、任務完成率、Parabricks 加速、RAPIDS-singlecell 壓縮,以及 nvMolKit 加速的主張,若能被外部使用者在真實工作流程中重現,將更具意義。
這項公告之所以值得注意,是因為它顯示科學 AI 的發展方向:正從通用聊天介面,轉向由明確工具合約支撐的領域代理。真正的產品不只是 Claude Science 或 BioNeMo 其中之一,而是把推理、編排與加速執行結合成科學家無需每個專案都重新拼裝基礎架構即可使用的形式。
對建構者而言,重點在於生命科學中的代理可靠性,可能不那麼依賴更大的基礎模型,而更依賴文件完善的工具介面與可部署服務,例如 NVIDIA BioNeMo Agent Toolkit 與 BioNeMo NIM。對企業團隊而言,問題是這些堆疊能否從吸引人的示範,走向經過驗證的研究營運。如果可以,擁有工具層而不只是聊天層的供應商,便可能在科學 AI 中取得持久的位置。