「Claude Opusを超えるかも」——xAIがGrok 4.5をプライベートベータ公開、Cursorデータ追加学習でコーディング性能を強化

イーロン・マスク氏は2026年6月28日（米国時間）、xAIが開発する次期AI「Grok 4.5」をX（旧Twitter）上で予告した。PC Watchの報道によると、SpaceXおよびTeslaを対象としたプライベートベータが開始されており、内部の初期評価では競合のClaude Opusに近い、あるいはそれを上回る結果が確認されたという。

1.5T V9基盤モデルとCursorデータの統合

Grok 4.5は「1.5T V9」と呼ばれる基盤モデルをベースに構築されている。注目すべきはコーディング支援ツール「Cursor」のデータを補完トレーニングに活用している点だ。Cursorは開発者の間で広く普及しているAIコードエディタであり、そのユーザーデータを学習に取り込むことでプログラミング関連タスクへの対応力を高める設計となっている。

マスク氏はX上の投稿で「RL（強化学習）が引き続きモデルを大幅に改善している」と述べており、リリース後も継続的な品質向上が続く方針を示した。さらに、SpaceXでは2026年中にフルスクラッチでトレーニングされたモデルを毎月リリースする計画があることも明かしている。

「Claude Opus超え」の主張——検証はこれから

PC Watchが引用したマスク氏のポストには「初期評価でClaude Opusに近い、場合によっては上回るパフォーマンスが出ている」と記されている。ただしこの評価はxAI内部の初期データに基づくものであり、独立した第三者機関によるベンチマーク検証はまだ実施されていない。

AI業界では開発元が公表するベンチマーク結果と実際のユーザー体験が乖離するケースが珍しくない。Grok 4.5の真の実力については、一般公開後に外部コミュニティや研究機関が複数の評価軸で検証を進めることになる。

日本市場での注目点

現時点でGrok 4.5はSpaceXとTeslaに限定したプライベートベータ段階にある。一般ユーザーへの公開時期、料金体系、日本語対応の品質はいずれも未発表だ。

国内でGrokにアクセスするにはXプレミアムの有料プランが必要だが、Grok 4.5の一般向けリリーススケジュールはまだ公表されていない。Cursorデータによるコーディング特化の強化学習が施されている点から、エンジニア・開発者層にとっては特に注目度の高いモデルといえる。競合製品との比較では、すでに一般提供されているClaude OpusやGPT-4系モデルとの実用比較が今後の焦点になるだろう。

「月1モデルリリース」という計画が実現すれば、AI開発サイクルのスピードという観点でも業界全体に影響を与える可能性がある。ただし、頻繁なモデル更新は企業導入や長期運用を考えるユーザーにとって安定性の懸念につながる面もある。

筆者の見解

Cursorのデータを補完学習に使うというアプローチには独自の合理性がある。コーディング文脈に特化したデータを意識的に混入させることで、エンジニア向けのユースケースで差別化を図る設計だ。このような「用途特化の追加学習」はモデルの汎用性を高める戦略とは異なる方向性であり、ターゲットを絞った競争戦略として評価できる。

ただし、「Opusを超える」という主張は現時点では開発元の初期内部評価に過ぎない。AIモデルの性能はタスクの種類・コンテキスト長・ツール統合の安定性など多くの要素に依存しており、単一のベンチマークスコアで優劣を確定させるのは難しい。コーディングエージェントとしての実用性は特に、長時間タスクの安定性や自律的なループ実行の精度など、ベンチマーク以外の側面が重要になってくる。

SpaceXが「月1リリース」を本当に持続できるなら、開発リソースと品質担保の両立という観点で驚異的なオペレーションだ。しかし量産体制が整っていても、各リリースの品質がばらつくようであれば、ユーザーの信頼を積み上げることは難しい。Grok 4.5の位置付けは、一般公開後の外部レビューと実際のユーザー評価が出揃ってから改めて判断したいところだ。

出典: この記事は Opusを上回るAI「Grok 4.5」、イーロン・マスク氏予告の内容をもとに、筆者の見解を加えて独自に執筆したものです。

1.5T V9基盤モデルとCursorデータの統合#

「Claude Opus超え」の主張——検証はこれから#

日本市場での注目点#

筆者の見解#

1.5T V9基盤モデルとCursorデータの統合

「Claude Opus超え」の主張——検証はこれから

日本市場での注目点

筆者の見解