📌 概要
2026年4月、Anthropicは自社の最強AIモデル「Claude Mythos」を完成させながら、その一般公開を拒否した——このモデルが自律的に2万3,019件のゼロデイ脆弱性を発見し、90.6%の精度で悪用可能であることを証明したからだ。その代わりに始動したのが「Project Glasswing」——Amazon、Apple、Google、Microsoftなど11の主要組織と連携し、AIの攻撃力を防御のために使う画期的な取り組みである。2026年6月現在、このプロジェクトは15カ国・150以上の機関へ拡大し、1億ドルの計算クレジットを提供するなど、AIサイバーセキュリティのパラダイムシフトが始まっている。
🔒 なぜMythosは「公開されなかった」のか
Anthropicは2026年4月、Claude Mythos Previewを内部テスト完了後に一般公開しないという、現代AI業界で「ほぼ前例のない」決定を下した。その理由は、244ページに及ぶSystem Cardで詳述されている:
- ゼロデイ脆弱性の自律発見 — 全主要OS・ブラウザ・重要オープンソースコンポーネントにまたがる数千件のゼロデイを自律的に特定
- 脆弱性チェイニング — 複数の脆弱性を連鎖させ、高度な攻撃パイプラインを構築可能
- エクスプロイト生成 — ROPチェーン、JITヒープスプレー、マルチ脆弱性チェイニングなど、実動作するPoCエクスプロイトを自動生成
- セキュリティ専門知識不要 — セキュリティの正式な訓練を受けていないエンジニアでも、Mythosに一晩タスクを投げるだけで、最小限の人間の誘導で機能するエクスプロイトコードを入手可能
Anthropicが指摘するリスクは3つ:
- ゼロデイ加速 — 重要インフラへの標的攻撃のハードルを劇的に下げる
- 自動悪用 — 人間のチームがリアルタイムで防御できない規模でのAI攻撃を可能にする
- 攻撃・防御の不均衡 — 攻撃者だけがMythosクラスのツールにアクセスする状況を防ぐ
🦋 Project Glasswing——攻撃を防御に転じる
Mythosを封印したAnthropicは、その代わりに「Project Glasswing」という限定アクセスのパートナーシップを構築した。目的は明確——Mythosの攻撃能力を防御のために使うことだ。
初期参加11機関(2026年4月時点)
| 分野 | 参加機関 |
|---|---|
| クラウド | Amazon AWS、Google |
| OS・デバイス | Apple、Microsoft |
| ネットワーク | Cisco、Broadcom |
| セキュリティ | CrowdStrike、Palo Alto |
| AIインフラ | NVIDIA |
| 金融 | JPMorgan Chase |
| オープンソース | Linux Foundation |
2026年6月の拡大
- 対象 — 15カ国、150以上の機関へ拡大
- 新規参加 — EUサイバーセキュリティ機関(ENISA)など
- 計算クレジット — 1億ドル以上を参加機関に提供
- オープンソース寄付 — 400万ドルを直接オープンソースセキュリティ改善に充当
💀 衝撃の発見内容
Mythosのテストで明らかになった発見は、サイバーセキュリティ業界に衝撃を与えた:
27年間気づかれなかったOpenBSDの脆弱性
最も象徴的な発見は、OpenBSDに27年間存在し続けた脆弱性の発見である。この脆弱性は、何十年もの間、人間のコードレビューと数百万回の自動化テストを生き延びていた。
Mythos Previewは、すべての主要OSとブラウザにまたがる脆弱性を発見した。その多くは数十年にわたり存続し、人的レビューと百万回の自動テストを生き延びていた。——Anthropic System Card
既存ベンチマークの「飽和」
Mythosは、既存のサイバーセキュリティベンチマークを「飽和」させた——つまり、現在の評価フレームワークでは天井を測定できない。これは、AIのサイバーセキュリティ能力が人間の評価能力を上回り始めていることを示す。
自律タスク実行能力
80%の成功率で、Mythosは最大3時間6分間にわたり完全自律でタスクを実行可能。これは、スーパーフォーキャスターの予測(2026年後半で3〜4時間)とほぼ一致しており、AIの長時間タスク能力が専門家の予想より速く進歩していることを示している。
📊 訓練規模の概算
Microsoftが誤って漏洩したデータによると、Claude Mythosの訓練計算量は約6.1×10²⁷ FLOPsと推定されている。これは、2023年に「理性的な極限は10²⁶か」と議論されていた水準から、わずか3年で2桁上昇したことを意味する。
事前学習トークン数は約150兆と推定されており、これはGemini 3.1 Proとほぼ同等の規模である。
🌍 グローバルな文脈:AIサイバーセキュリティの新時代
ホワイトハウス大統領令(2026年6月2日)
「高度人工知能イノベーションと安全保障の促進」を題する大統領令が署名された。NSAが高リスク「フロンティアモデル」を特定するための機密ベンチマークプロトコルの作成を指示し、連邦機関に対して30日間の事前評価期間を設けることを求めている。
EUクラウド・AI開発法(2026年6月3日)
欧州委員会が、資本投資の調整、データレジデンシーの保護、主権的EUコンピューティングエコシステムの構築を目的とする法案を正式化した。
これらの政策動向は、各国政府がAIのサイバーセキュリティリスクを深刻に受け止め始めていることを示している。
🧭 Anthropicの「責任あるスケーリング」戦略
Anthropicのアプローチは、シンプルな「公開/非公開」の二項対立を超えている:
- 透明性 — 244ページのSystem Cardを公開し、モデルの能力とリスクを詳細に開示
- 政府との協力 — 米国政府関係者と直接協議
- 段階的拡大 — Glasswingを通じて、審査済みの組織のみに段階的にアクセスを提供
- 防御への転換 — 攻撃能力を「スキャンと硬化」に活用し、悪意ある攻撃者より先に脆弱性を発見・修正
🔮 今後の展望
Anthropicは、Mythosクラスのモデルが強化されたセーフガードを備えて、今後数週間以内により多くのユーザーに利用可能になる可能性を示唆している。ただし、これは以下の条件付きである:
- 十分な安全対策の実装
- デュアルユースリスクの適切な管理
- 攻撃者と防御者のバランスの維持
2026年5月末にリリースされたClaude Opus 4.8は、Mythosの技術の一部をコーディング改善として安全に統合した最初のモデルである。この「段階的還元」のアプローチが、今後のAIモデルリリースの標準になる可能性が高い。
📊 まとめ
Claude MythosとProject Glasswingの物語は、AI発展における新たなパラダイムを示している:
- 「強すぎて公開できない」AIが登場した — ゼロデイを自律発見する能力は、既存の防御体系を圧倒する
- 攻撃と防御の同時進行 — AIの攻撃能力を防御に転用するGlasswingモデルは、今後のAI安全の標準アプローチになる可能性
- 国家レベルの対応が始まった — 米国の大統領令、EUの法案、ENISAの参加は、AIサイバーセキュリティが国際的政治課題になったことを示す
2万3千のゼロデイ——その数字は、AIがサイバーセキュリティの「ゲームチェンジャー」になったことを象徴している。問題は、その力を誰が、どのように管理するかだ。
出典:Anthropic Claude Mythos System Card(2026年4月)/ ai.cc「Claude Mythos: Anthropic's Dangerous AI Zero-Day Breakthrough」(2026年6月2日)/ 36Kr「Microsoft意外泄密:Claude Mythos万亿参数」(2026年6月)/ devflokers.com「AI News June 2026」/ theaitrack.com「AI News June 2026」