📌 概要
2026年5月28日、Anthropicは旗艦モデル「Claude Opus 4.8」を正式リリースした。前世代のOpus 4.7から41日という短期間での更新となった今作は、コーディング・エージェント・推論の全領域でスコアを塗り替えると同時に、Claude Codeに「Dynamic Workflows(動的ワークフロー)」という革命的な機能を搭載した。
🔄 Opus 4.8が変えるもの
Claude Opus 4.8の主な改善点は以下の通りだ:
- コーディング性能の全面向上: CursorBenchで全エフォートレベルにわたってOpus 4.7を超過
- エージェントタスクの信頼性向上: より鋭い判断力と一貫性。Legal Agent Benchmarkで全パス基準で10%超えを記録(史上初)
- コード誠実性の飛躍: コードの欠陥を見落とす確率がOpus 4.7比で約4分の1に低下
- アライメントの改善: ユーザーの自律性支持・ユーザーの最善利益を重視する「向社会的特性」が新高水準に到達
- マルチモーダルコスト削減: Databricks/Genieテストでマルチモーダルトークンコストが61%削減
⚡ 最大の目玉:Dynamic Workflows(動的ワークフロー)
Dynamic WorkflowsはEnterprise・Team・Maxプラン向けにClaude Codeでリサーチプレビューとして提供される画期的な機能だ。
できること
一言で言えば「数百のサブエージェントを一度のセッションで並列起動・制御できる」ことだ。従来のAIコーディングツールは、ひとつのタスクをひとつのコンテキストで処理していた。しかしDynamic Workflowsでは:
- Claudeが大規模なタスクを計画し、サブタスクに分解する
- 数百のサブエージェントを並列起動して同時に作業させる
- 各エージェントの出力を検証し、結果を統合してユーザーに報告する
具体例: 数十万行に及ぶコードベースのマイグレーション——起動からマージ完了まで、Claude Code単独で自律実行する。
実用的な意義
これは「AIがソフトウェアエンジニアの役割を本格的に代替し始める」ことを示す。単なる「補助ツール」ではなく、プロジェクト全体を引き受けるエージェントとしてのClaudeが現実になった。
📊 性能ベンチマーク比較
| ベンチマーク | Opus 4.7 | Opus 4.8 | GPT-5.5 |
|---|---|---|---|
| Online-Mind2Web(ブラウザエージェント) | — | 84% | Opus 4.8以下 |
| Legal Agent Benchmark(全パス) | — | 史上初10%超 | — |
| Super-Agent Benchmark(全ケース完了) | — | 唯一の全完了 | — |
| Terminal-Bench 2.1 | — | 74.6% | 78.2%(わずかに上回る) |
| CursorBench | 基準 | 全レベル超過 | — |
| マルチモーダルコスト | 基準 | 61%削減 | — |
💰 料金体系
| モード | 入力 | 出力 |
|---|---|---|
| 通常使用 | $5 / 100万トークン | $25 / 100万トークン |
| 高速モード(2.5倍速) | $10 / 100万トークン | $50 / 100万トークン |
重要: 通常価格はOpus 4.7と変わらず、高速モードは旧版より3倍安くなった。
🆕 同時リリース:2つの新機能
1. エフォートコントロール(全プラン対応)
claude.aiとCoworkで、Claudeが各タスクにどれだけの「努力」を投じるかをユーザーが制御できるようになった。
- Lower effort: 高速レスポンス、レート制限消費を節約
- High effort(デフォルト): 品質とUXの最適バランス
- Extra / xhigh(Claude Code): 困難なタスクや長時間の非同期ワークフローに推奨
- Max: 最高品質・最大トークン消費
2. Messages API:タスク途中でのシステムエントリ挿入
開発者向けの機能として、エージェント実行中にプロンプトキャッシュを壊さずにシステムエントリを挿入できるようになった。これによりパーミッション設定の動的更新、トークンバジェットのリアルタイム調整、環境コンテキストの途中変更が可能になる。長時間自律タスクの制御性が大幅に向上する。
🔮 次世代:Mythos(コードネーム: Glasswing)
Anthropicは次世代高知能モデルクラス「Mythos」の開発を進めており、すでにサイバーセキュリティ分野での限定プレビューが始まっている。完全リリースは「数週間以内」とのこと。Opus 4.8のアライメントスコアはすでにMythos Previewと同等に達しており、性能と安全性の両立という点で新たな基準を示した。
🔑 結論——AIコーディングの「エポック」が変わった
Claude Opus 4.8の最大の意義は、単純なベンチマーク向上ではなく「AIが複雑なソフトウェアプロジェクトを自律的に推進できるエポック」に入ったことを示したことだ。Dynamic Workflowsによる数百エージェント並列、エフォートコントロールによる細粒度の制御、4倍のコード誠実性——これらが組み合わさることで、開発者とAIの協力関係は新次元に突入する。
価格据え置きで性能が向上し、高速モードが3倍安くなった今、Opus 4.8への移行を検討しない理由はない。