データ漏洩で明らかになった「ステップチェンジ」モデル

AIスタートアップのAnthropicが、これまでリリースしたどのモデルよりも強力な新世代AIモデルを開発・テスト中であることが明らかになった。同社の設定ミスにより、未公開の草稿ブログ記事が一般公開状態のデータキャッシュに保存されていたことを、米経済誌Fortuneが報じた。

Anthropicのスポークスパーソンは「このモデルはAI性能における**ステップチェンジ(段階的な飛躍)**を表しており、これまで構築した中で最も高性能なモデルだ」と認めた。現在は「アーリーアクセス顧客」と呼ばれる限られたグループを対象にトライアルが進められているという。

新モデルの正体——「Capybara」と「Mythos」

漏洩した草稿によると、新モデルには**「Capybara(カピバラ)」という新しいモデル階層名と、「Claude Mythos(ミトス)」**というコードネームが付けられていることが判明した。

Anthropicは現在、モデルを3つのサイズで展開している:

  • Opus(最大・最高性能)
  • Sonnet(中程度の速度と性能)
  • Haiku(最小・最速・最安価)

草稿ブログによれば、「Capybara」はこれらの上に位置するまったく新しい階層であり、現在最上位のOpusよりもさらに大規模で高性能——その分コストも高い——とされている。

「従来の最高モデルであるClaude Opus 4.6と比較して、Capybaraはソフトウェアコーディング、学術的推論、サイバーセキュリティなどのテストで大幅に高いスコアを記録している」 同文書には「Claude Mythosのトレーニングが完了した」とも記されており、「これまで開発した中で圧倒的に最も強力なAIモデル」と表現されている。

「前例のないサイバーセキュリティリスク」という異例の警告

注目すべきは、Anthropic自身が草稿の中でこのモデルについて「前例のないサイバーセキュリティリスクをもたらす」と記述していた点だ。これはAI企業が自社モデルの危険性を自ら認めた異例の表現であり、能力と安全性のバランスをめぐる業界全体の緊張を反映している。

漏洩の経緯と対応

この漏洩を発見・検証したのは、セキュリティ企業LayerX SecurityのシニアAIセキュリティリサーチャーであるRoy Paz氏と、ケンブリッジ大学のサイバーセキュリティ研究者Alexandre Pauwels氏。Pauwels氏によれば、未公開の資産は約3,000件にのぼり、いずれもAnthropicのブログに関連するものだった。

Fortuneからの連絡を受けたAnthropicは即座にデータストアへの公開アクセスを遮断。「コンテンツ管理システムの設定における人的ミスが原因で、公開すべきでない草稿が閲覧可能な状態になっていた」と認めた。

国内への影響と今後の展望

AnthropicのClaudeシリーズはAmazon BedrockやGCP Vertex AIを通じて国内企業でも広く活用されている。Claude Mythosが正式にリリースされれば、コーディング支援や業務自動化の領域で既存モデルを大きく上回る性能が期待できる。一方で「前例のないサイバーセキュリティリスク」という表現が示すように、安全審査のプロセスも通常より慎重になるとみられる。正式発表の時期や価格体系など、詳細は今後の公式アナウンスを待つ必要がある。


元記事: Exclusive: Anthropic ‘Mythos’ AI model representing ‘step change’ in power revealed in data leak