2026年4月、生成AIの競争は新たなフェーズに入った。わずか3ヶ月でフロンティアが何度も塗り替えられ、今月だけでも業界の勢力図を変えかねない出来事が連続して発生している。OpenAIが年換算売上高(ARR)250億ドルを突破しIPO検討に入ったというビジネス面での激変と並行して、モデル性能の競争も前例のない激しさを見せている。

業界を揺るがした「Claude Mythosリーク」

今月最大のニュースは、3月26日に発生したAnthropicの内部文書流出だ。設定ミスのあったデータストアから約3,000件の内部ファイルが一時的に公開状態になり、その中に「Claude Mythos(内部コードネーム:Capybara)」の詳細な製品ドキュメントが含まれていた。

Anthropicは存在を否定せず、「推論・コーディング・サイバーセキュリティにおいて意味のある進歩を遂げた汎用モデルを開発中。能力の強さを鑑み、リリース方法を慎重に検討している。これは当社史上最高性能のモデルで、ステップチェンジと位置づけている」と公式に認めた。

リークされた文書によれば、ClaybearはClaude Opus 4.6を「劇的に」上回るプログラミング性能を持つとされ、現在はサイバーセキュリティパートナー限定の早期アクセス段階にある。公開日は未定だが、市場は4月中の発表可能性を約25%と見積もっている。

現時点のモデル勢力図

総合性能:Gemini 3.1 Pro が首位

16の主要ベンチマーク中13で首位を獲得しているGemini 3.1 Proは、Artificial Analysis Intelligence IndexでGPT-5.4 Proと同率ながら、APIコストは約3分の1という破壊的なコストパフォーマンスを誇る。エンタープライズ採用において価格は重要な変数であり、この差は見逃せない。

コーディング:Claude Sonnet 4.6 が実務首位

実際の専門家レベル作業を評価するGDPval-AA Eloベンチマークでは、Claude Sonnet 4.6がトップに立つ。GitHub CopilotのCodingエージェントがこのモデルで動作していることからも、コード生成の実用性では一歩抜け出した存在だ。

オープンソース:Meta Llama 4 Mavericが台頭

4,000億パラメータ・1,000万トークンのコンテキストウィンドウを持つLlama 4 Mavericは、独自インフラで無償運用できるオープンウェイトモデルとして最強クラスに達した。クローズドモデルとの性能差が急速に縮まっている。

価格破壊:DeepSeek V3.2

DeepSeek V3.2は入力100万トークンあたり約0.28ドルという価格を実現。欧米フラッグシップモデルの2ドル以上と比較すると約7分の1以下であり、コスト重視のユースケースでは無視できない選択肢だ。

実務への影響——日本のエンジニア・IT管理者にとっての意味

すぐに動けるアクション:

GitHub Copilotを使っているなら今すぐ確認:Claude Sonnet 4.6ベースのCodingエージェントが実務コーディングで最高評価を得ている。エージェントモードが有効になっているか設定を確認し、複雑なリファクタリングや単体テスト生成に積極的に活用したい。

Gemini 3.1 Proのコスパを試算する:Google CloudやVertex AI経由でのAPI利用コストを、現在使っているGPT-4系と比較してほしい。同等性能で3分の1のコストになるなら、高スループットな社内ツールのバックエンドを切り替える価値がある。

オンプレミス・プライベート環境を検討しているなら Llama 4:情報漏洩リスクの観点から外部APIに送れないデータを扱う企業にとって、Llama 4 Mavericは現実的な選択肢になった。ローカルLLM運用のPoC着手タイミングとして今が適切だ。

Claude Mythosの動向を追う:サイバーセキュリティ分野で特段の強みを持つとされており、SOC自動化やペネトレーションテスト支援への活用が期待される。早期アクセス申請の窓口が開いた際は優先的に検討したい。

筆者の見解

2026年の生成AI競争を一言で表すなら「コモディティ化の加速」だ。

Gemini 3.1 ProがGPT-5.4と同等の性能を3分の1のコストで提供し、Llama 4がクローズドモデルの背中を追うこの状況は、「どのモデルを使うか」ではなく「いかに素早く使いこなすか」が企業の競争優位を決める時代が来たことを示している。

Claude Mythosのリークが特に興味深いのは、Anthropicが「サイバーセキュリティ」を特筆した点だ。セキュリティ特化のモデルが登場することで、これまで人手に依存していたインシデント対応や脆弱性評価の自動化が一気に現実解になりうる。日本でもCSIRTやSOCの人材不足は深刻であり、このモデルの公開は国内のセキュリティ運用に大きなインパクトを与えると予想する。

OpenAIのIPO観測が示すように、生成AIはもはや研究フェーズを完全に卒業した。モデル選定はベンダーロックインリスク・コスト・コンプライアンス・性能のバランスで評価する「調達判断」になっている。IT管理者にとっては、クラウドサービスの選定と同じ視点でAIモデルを評価するフレームを今すぐ整備すべき時期に来ている。


出典: この記事は OpenAI Surpasses $25B ARR, Explores IPO as Early as Late 2026 の内容をもとに、筆者の見解を加えて独自に執筆したものです。