Anthropic Mythos 協助研究人員發現 macOS 核心安全漏洞

新前線：人工智慧驅動的漏洞研究

網路安全領域正在經歷一場劇烈的變革，大型語言模型（LLMs）正在填補進攻性研究與防禦性基礎設施之間的鴻溝。最近一項極具意義的發展突顯了這一演變：研究人員已成功利用 Anthropic 的實驗性模型 Claude Mythos，識別出 Apple macOS 核心中複雜的漏洞。

多年來，核心層級（kernel-level）錯誤的發現需要深厚的專業知識和數千小時的手動程式碼審核。如今，這一入門門檻正在降低。透過利用像 Claude Mythos 這樣的模型之先進推理能力，安全專業人員發現，人工智慧已不再僅僅是用於編寫樣板程式碼的助手，它已成為分析底層作業系統架構的強大工具。人工智慧與系統安全交叉領域的這項突破，引發了關於軟體強化（software hardening）未來以及人工智慧開發者責任的關鍵問題。

解析 Claude Mythos 及其在安全領域的角色

Anthropic 長期以來將其 Claude 系列定位為具有卓越推理能力、程式碼精確度和情境感知能力的模型。Claude Mythos 作為其底層架構的實驗性預覽版本，將這些特質提升到了一個新的層次。與那些在 C 和 C++ 等底層程式語言細微差別上掙扎的通用聊天機器人不同，Mythos 展現出了一種能夠駕馭複雜、單體式（monolithic）程式碼庫的神奇能力。

在最近 macOS 發現的背景下，該模型充當了安全研究人員的倍增器。研究人員無需花費人力逐行審查數百萬行程式碼來識別記憶體損毀問題或邏輯缺陷，而是利用 Mythos 來綜合文件、分析核心結構，並對潛在的攻擊向量進行假設。該模型透過「推理」特定函式呼叫的含義，或缺乏適當邊界檢查（bounds check）的能力，使研究人員能夠迅速將焦點縮小到核心中最脆弱的區域。

這項能力代表了人工智慧程式碼助手的一次明顯演進。雖然舊的模型可能只會建議程式碼片段，但 Mythos 展示了理解複雜作業系統中不同模組之間交互作用的能力，有效地充當了自動化稽核員的角色。

比較分析：傳統研究與人工智慧增強型研究

為了了解這種轉變的幅度，必須將傳統方法與目前白帽駭客和安全分析師所採用的新興人工智慧驅動方法進行比較。

研究維度	傳統手動方法	人工智慧增強型方法
程式碼庫稽核	勞力密集，需要專家進行耗時的審查	快速語意模式識別與流程分析
利用開發	使用除錯器的手動試錯	透過 AI 推理進行迭代假設測試
文件分析	篩選大量白皮書	即時查詢架構規範
漏洞發現	高度依賴個人直覺	可擴展、系統性的邏輯缺陷掃描

正如上表所示，Claude Mythos 提供的首要優勢不一定是發現人類「無法」發現的錯誤，而是顯著縮短了發現漏洞的時間。透過將初步研究和程式碼分析自動化，研究人員可以將他們的人類智慧集中在製作漏洞利用程式本身，有效地加速了整個安全研究生命週期。

macOS 核心漏洞發現剖析

macOS 核心，即 XNU，是現代運算中最受保護和強化的目標之一。從歷史上看，識別 XNU 中的缺陷需要對記憶體管理、Mach IPC 和 BSD 子系統有詳盡的了解。

研究人員使用 Claude Mythos 的過程涉及將該模型視為「人機協作」（human-in-the-loop）系統中的合作夥伴。他們為模型提供了有關特定核心組件的背景資訊，並要求它分析控制流程以尋找潛在漏洞。

情境匯入： 研究人員向模型輸入了相關的核心程式碼區段。
預測建模： 引導 Mythos 識別邊緣案例或錯誤處理漏洞。
漏洞利用邏輯制定： 一旦識別出潛在的弱點，該模型會協助草擬到達脆弱程式碼路徑所需的邏輯。

這一工作流程突顯了一個關鍵細節：人工智慧目前並非是一個可以透過點擊即可入侵系統的自動化「駭客機器人」。它仍然是一個需要人類指導、意圖和驗證的工具。然而，效率的提升是不可否認的。過去需要數週「盯著程式碼看」的工作，現在可以濃縮為幾天，甚至幾小時與大型語言模型（LLM）的引導式互動。

對 Apple 和 macOS 安全的影響

對於像 Apple 這樣以其生態系統的安全優先架構為榮的公司來說，這一發展是一把雙面刃。一方面，它驗證了現有懸賞計畫的實力；研究人員發現這些錯誤是為了報告它們，而不是惡意利用它們。另一方面，它意味著「隱蔽式安全」（security through obscurity）或核心的純粹複雜性，不再是抵禦使用 AI 攻擊者的可行防禦機制。

如果研究人員可以使用 Claude Mythos 來發現漏洞，惡意攻擊者也可以。這一現實迫使 Apple 和其他作業系統供應商重新思考其安全態勢。他們必須轉向：

自動化紅隊測試： 整合他們自己的 AI 防禦模型，在程式碼編譯之前就掃描漏洞。
主動強化： 在開發階段使用 AI 生成的錯誤報告來修補潛在缺陷，而不是在發布後才進行。
架構改革： 透過將更多服務移至使用者空間來最小化核心的攻擊面，這是 Apple 多年來一直在做的舉措，但現在變得更加迫切。

雙重用途的困境：倫理與責任

作為一個專注於人工智慧進步的組織，Creati.ai 認識到 Claude Mythos 的能力本質上是雙重用途的。同一個幫助研究人員發現錯誤並向 Apple 披露的推理引擎，如果落入壞人之手，可能會被重新利用來開發零日漏洞以獲取犯罪利益。

Anthropic 和其他領先的人工智慧實驗室目前正走在鋼索上。他們必須繼續推動模型效能的極限以解決真正的人類問題，同時實施「安全護欄」，防止他們的模型被用於惡意程式碼生成。macOS 事件是這種張力的一個基準。它證明了該模型強大到足以成為安全工具，這意味著它也同樣強大到足以成為攻擊工具。

該行業現在正進入一個「負責任的能力」時代，在這個時代，人工智慧開發既關乎安全性工程，也關乎神經架構。網路安全社群必須與人工智慧實驗室協同工作，建立規範，確保像 Claude Mythos 這樣的工具主要用於加強數位世界，而不是摧毀它。

未來展望：人工智慧在網路防禦中的角色

展望未來，人工智慧在網路安全中的角色可能會從反應式工具演變為軟體開發生命週期的基礎層。隨著模型越來越多地整合到 IDE（整合開發環境）中，我們可以預期即時、人工智慧驅動的「安全代碼檢查」（security linting）將成為標準。

對於開發人員和安全專業人員來說，這項 Anthropic 支持的研究帶來的教訓很明確：手動、孤立的程式碼稽核時代正在消逝。未來屬於那些能夠有效調度大型語言模型來協助保護全球最關鍵系統的複雜任務的人。這是否會導致更安全的網際網路，還是導致 AI 攻擊者與 AI 防禦者之間的軍備競賽還有待觀察，但有一點是肯定的—— macOS 核心安全，乃至整個網路安全的格局，已經永遠改變了。