AIがゼロデイ脆弱性を「見つけて、実証する」まで人間の介入なしに完結する——その能力がついに実験室の外で具体的な成果として示された。Anthropicが技術レポートを公開し、新モデル「Claude Mythos Preview」が主要OS・ブラウザを横断して数千件の高・致命的脆弱性を自律発見し、複数で動作する悪用コード(PoC)を生成したことが明らかになった。セキュリティ業界に長年あった「脆弱性の発見と実証の間のギャップ」が、AIによって急速に縮まっている。

何がここまで衝撃的なのか

先代モデルとの差は「量的な改善」ではなく「質的な跳躍」に近い。内部ベンチマークでは、Firefoxの脆弱性に対して先代モデルが数百回試行中2回しか有効なエクスプロイトを生成できなかったのに対し、Mythos Previewは181回成功している。約90倍の差だ。

発見された脆弱性の内訳が、さらに驚きをもたらす:

  • OpenBSD(27年前の欠陥): TCPのSACK実装に潜むDoS脆弱性。リモートからOpenBSDホストをクラッシュさせることができる。約1,000回のスキャン実行・コスト$20,000未満で発見。
  • FFmpeg(16年前の欠陥): 2003年に混入し、2010年のリファクタリングで顕在化した整数オーバーフロー。以降のすべてのファザーと人間レビュアーが見逃してきた。
  • FreeBSD(17年前のRCE): NFSサーバーに潜む認証不要のroot権限奪取脆弱性(CVE-2026-4747)。初期プロンプト後、一切の人間介入なしに発見・実証を完了。

外部の専門セキュリティコントラクターが198件を手動レビューした結果、89%でモデルの深刻度評価と一致し、98%は1段階以内の差に収まった。人間の専門家に迫る精度だ。

「意図せず生まれた」能力が示す構造的問題

Anthropicの研究者はレポートに重要な一文を記している。「これらの能力はMythos Previewに特化してトレーニングしたわけではない。コーディング・推論・自律性の汎用的な改善の副産物として自然発生した」。

ここが本質だ。脆弱性を修正する能力が高まるほど、脆弱性を発見・悪用する能力も同時に高まる。攻撃と防御の両方の能力を同一モデルが担う構造は、AIセキュリティツールの倫理的・実務的な枠組みを根底から問い直す。

この認識のもと、Anthropicは同研究を「Project Glasswing」と命名し、クリティカルな産業パートナーとオープンソース開発者への限定公開にとどめている。AWS・Apple・Googleなどと連携し、発見済み脆弱性の修正を先行して推進中だ。

実務への影響

「古いコードは安全」という前提を捨てよ

これまで「長く実績のあるコードベースは安全」という経験則が現場で通用する場面があった。今回の発見は、10年・20年単位で見逃されてきた欠陥がAIによって系統的に掘り出せることを示した。レガシーシステムを多く抱える日本のエンタープライズは、この前提を今すぐ見直すべきだ。

攻撃の「民主化」リスクを直視する

PoC生成の自動化は、高度なスキルを持たない攻撃者でも深刻な脆弱性を実際に悪用できるハードルを下げる。SOCやCSIRTの検知・対応速度を上げる投資が急務になっている。パッチ適用サイクルの短縮と、攻撃インテリジェンスの取得強化を並行して進めたい。

防御側へのチャンスでもある

同じ能力を責任ある形で活用すれば、内部の脆弱性スキャンのコストと精度を大幅に改善できる。OSS依存ライブラリの系統的なリスク評価、Bug Bountyプログラムの補完、レッドチーム演習の効率化——セキュリティチームが「AIを攻撃シミュレーターとして使う」未来は、すでに現実の入口に立っている。

筆者の見解

AIエージェントが「指示待ちの副操縦士」から「目的を与えれば自律遂行する実行者」へと進化する流れは以前から見えていたが、セキュリティドメインでここまで具体的に実証されたことは大きな節目だ。プロンプト1つで17年間人間が見逃した脆弱性を発見し、実証コードまで完成させる——これはもはや「研究の話」ではない。

注目したいのは、責任ある公開(Project Glasswing)という判断だ。能力があるからといって即座に広く展開するのではなく、影響範囲を見極めて段階的に進める姿勢は、技術の成熟度と組織の誠実さを示す。こうしたアプローチが業界標準になっていくことを期待したい。

そして日本のIT組織に問いかけたい。「古いシステムだから実績がある」「専門家が見てきたから大丈夫」という安心感を今日もまだ持っているなら、それは再検討の余地がある。脆弱性の探索コストが劇的に下がった世界では、攻撃者もAIを活用する。防御側が活用しない理由はない。AIをセキュリティプロセスに組み込む議論を、今すぐ社内で始めてほしい。


出典: この記事は Anthropic’s new AI model finds and exploits zero-days across every major OS and browser の内容をもとに、筆者の見解を加えて独自に執筆したものです。