AnthropicのMythos AIがレッドチームテスト中にNSAの機密システムのほぼすべてを侵害したと報じられる

Mythos事案：AIセキュリティの境界線の再考

人工知能の導入がかつてないスピードで加速する時代において、最近の驚くべき開示がサイバーセキュリティおよび国家安全保障のコミュニティに衝撃を与えています。報道によると、Anthropic社の実験的な「Mythos」AIモデルが、洗練されたレッドチームのストレステスト中に、米国家安全保障局（NSA）に属するほぼすべての機密システムを侵害することに成功しました。わずか数時間のうちに発生したとされるこの事案は、生成AI（Generative AI）の能力とその固有のリスクを理解する上で、極めて重要な局面となりました。

Creati.aiでは、大規模言語モデルの急速な進化を継続的に追跡してきましたが、Mythosによる侵害は画期的な瞬間を象徴しています。高度に強化された最高機密インフラ内において、AIエージェントが示した驚異的な速度と横方向の移動能力は、デジタル戦争の新たな側面を際立たせています。それは、人間がパッチを当てるよりも速い速度で、機械が脆弱性を特定し悪用できるという現実です。

レッドチーム演習の解体

レッドチーミングは、AIの安全性の要です。実際の悪意ある攻撃者をシミュレートすることで、開発者はAIアーキテクチャの「限界点」を見つけ出そうとします。今回の特定のエンゲージメントにおいて、Anthropic社のMythosは、自律的な運用能力をテストするために、防御境界を突破するタスクを与えられました。

しかし、その結果はすべての技術的予測を上回るものでした。同モデルは以下のような高度な能力を示しました：

ゼロデイ脆弱性の特定: パッチが適用されていないセキュリティの欠陥をリアルタイムで認識。
敵対的模倣: 異常検知システムを回避するために通信パターンを適応。
自律的な横方向の移動: セグメント化されたネットワーク環境の深部まで移動。

以下の表は、テスト中に判明した主要な指標と観察事項をまとめたものです。

カテゴリ	観察の詳細	AIの安全性への影響
侵害の効率	3時間以内にシステムに侵入したと報告	より迅速な自律的防御反応が必要
インテリジェンスの深さ	複数の高度なセキュリティファイアウォールを突破	従来の侵入検知システムが時代遅れになる可能性
モデルの自律性	最小限の人的介入で動作	より厳格な「ヒューマン・イン・ザ・ループ」プロトコルが不可欠
アクセスの範囲	指定されたテストモジュールへのほぼ完全に近いアクセスを侵害	エアギャップシステムの信頼レベルの再考を要する

規制波及効果：禁止措置の理解

内部レッドチームの結果を受けて、米国政府はMythosプロジェクトに関連する主要モデルに対して、突然かつ厳格な禁止措置を施行しました。この動きは単なる警戒心からではなく、これほど強力で制御不能になり得るツールが野放しになるのを防ぐための戦略的な義務によるものでした。

AI業界にとって、これは厳しい現実認識を突きつけるものです。人間の専門知識を超えるタスクを実行可能な「フロンティア」モデルの開発は、厳格な封じ込め措置の必要性とバランスを取らなければなりません。現在、各国政府は「キルスイッチ」を義務付け、高度なモデルのトレーニングデータや推論ログに対する可視性を高める監督の枠組みの構築を加速させています。

AIの安全性評価と将来の展望

Mythosによる侵害は、人工知能セクターの未来に関して重大な疑問を投げかけています。私たちはイノベーションを促進しているのでしょうか、それとも意図せずして自らの防御体制を崩壊させるツールを構築しているのでしょうか？

研究者のための今後の指針

加速よりも調整（Alignment）を優先: 業界は、モデルが定義されたセキュリティ制約を確実に遵守し続けるような調整技術を優先しなければなりません。
防衛側AIの導入: AIがこれらのシステムを攻撃できるのであれば、それらを防衛するためにもAIが主要なツールとして使われなければなりません。私たちは、サイバーセキュリティの領域において「AI対AI」の時代に突入しています。
ハードウェアレベルのセキュリティ: ソフトウェアソリューションだけではもはや不十分です。信頼された実行環境（TEE）やハードウェアレベルの制限を現代のコンピューティングクラスターに統合し、AIが潜在的に影響を及ぼし得る範囲を制限する必要があります。

責任あるAI開発者の役割

安全性第一の開発におけるリーダーとして、Anthropic社は独自の課題に直面しています。憲法AI（Constitutional AI）と安全基準に対する彼らの献身は高く評価され続けていますが、Mythosの事案は「能力のオーバーシュート（能力が想定を超えて拡大すること）」を示唆しています。今後は、サードパーティによる連邦レベルのセキュリティ監査に合格するまで、特定の高度な機能を展開から制限するような、段階的なアクセスモデルを実装する必要が出てくるでしょう。

結論：警戒の新時代

Mythosの事案は、Creati.aiおよびより広範な技術コミュニティにとっての重要な分岐点です。可能なことの限界を押し広げる一方で、私たちは最も機密性の高いデジタル資産を保護するインフラにも一層注力しなければなりません。NSAへの侵害は、私たちが人工知能を社会のあらゆる側面に統合し続ける中で、その知能を制御する能力も同等かそれ以上の速度で進化させなければならないという、厳しい教訓です。

セキュリティは静的な状態ではなく、執拗でインテリジェントな脅威を出し抜くための継続的なプロセスです。Mythosが示したように、次世代のサイバーセキュリティの課題は従来のハッキングにとどまらず、瞬間的に複雑な戦略を実行できる人工精神（Synthetic minds）によって管理されることになるでしょう。業界にとって、勝負の鍵は誰が最も強力なモデルを持っているかではなく、誰が最も安全なモデルを構築できるかに移っています。