Google DeepMindは、Google I/O 2026(5月19日)でGemini 3.5 Proを発表し、2026年6月中に一般提供(GA)を開始すると予告した。現在は一部のVertex AIエンタープライズ顧客向けに限定プレビューが提供されており、同じファミリーのGemini 3.5 Flashはすでに一般公開済みだ。
I/Oの発表で何が起きたか
5月19日のGoogle I/Oステージで、Sundar Pichai CEOはGemini 3.5 ProのGAについて「来月まで待ってほしい(Give us until next month to get it to you)」と述べ、会場から苦笑まじりのため息が上がったという。その言葉どおり、ProはまだVertex AIの限定プレビューにとどまっており、公開GAは6月を目標としている。
一方でFlashはI/O当日から全面公開に切り替わり、Geminiアプリ、Google AI Studio、Gemini API、Vertex AI、Gemini Enterprise、さらにはGoogleのAI Mode in Searchのデフォルトモデルとして即日稼働した。
また、I/Oと合わせてデスクトップアプリ「Antigravity 2.0」と新CLIがリリースされた。このCLIは6月18日にGemini CLIを置き換える形で移行が予定されている。
200万トークンのコンテキストウィンドウ——何がどう変わるか
Gemini 3.5 Proの最大の技術的特徴は、200万トークンという業界最大のコンテキストウィンドウだ(2026年5月時点)。他のモデルとの比較はこうなる。
モデル コンテキストウィンドウ
Gemini 3.5 Pro 200万トークン(予定)
Gemini 3.5 Flash 100万トークン
Gemini 3.1 Pro 100万トークン
Claude Opus 4.7 20万トークン(標準)、100万トークン(ベータ)
GPT-5.5 25.6万トークン(通常)、拡張モードで92.2万
200万トークンとは具体的に何を意味するのか。記事によれば、次のようなスケールが1プロンプトに収まる計算になる。
- 約1,500ページの法律文書を1回の推論に丸ごと投入
- 中規模モノレポ全体(コード15万行+テスト+ドキュメント)を一括解析
- 30時間分の音声書き起こし、または約30分の動画(1FPSサンプリング)
- SaaS企業の四半期分のカスタマーサポートチケット全量
ただし、コンテキストの「大きさ」と「検索品質」は別問題だ。長文脈での情報抽出精度を測るMRCR v2ベンチマークでは、128Kトークン付近でGemini 3.1 Proが84.9%を記録するのに対し、3.5 Flashは77.3%にとどまる。そして100万トークン規模では両モデルともに約26%まで精度が落ちるという数字も公開されている。ProがこのギャップをどこまでFlashより改善できるかが、実用上の核心的な問いになる。
Gemini 3.5 Proが担うポジション
Gemini 3.5 Proは、これまでGemini Ultraが担っていたフロンティアユースケースを引き継ぐ位置づけだ。具体的には以下の3領域に特化している。
- Deep Think推論 — Humanity’s Last ExamやARC-AGI-2といった最難関ベンチマークを狙う深い思考モード
- フロンティアマルチモーダル — テキスト・画像・音声・動画を横断した高精度な理解と生成
- 超長文脈推論 — Flashでは追いつけない長文コンテキストでの精度維持
今すぐアクセスするには
GA前の現時点では、Vertex AIのエンタープライズ契約があるユーザーは限定プレビューへの参加申請が可能だ。一般ユーザーはGemini 3.5 Flashを使いながらProのGA(6月)を待つ形になる。Google AI Studioで3.5 Flashを触っておくことで、APIの呼び出し方やプロンプト設計のパターンをProのGA前に把握しておける。
実務への影響——日本のエンジニア・IT管理者に向けて
大規模ドキュメント処理の再設計が視野に入る。200万トークンが実用精度で機能するなら、現在RAGで分散処理している長大ドキュメント(契約書・仕様書・サポートログ)をシンプルなプロンプトインジェクションで扱える可能性がある。ただし、上述のMRCR精度の課題があるため、GA後にベンチマークを自前で検証することを強く勧める。
Vertex AIエンタープライズ契約の有無が分岐点。GAは一般提供と言っても、まずVertex AIからの展開になる可能性が高い。現在Google CloudのVertex AI未導入の組織は、ProのGAを待ちながらアーキテクチャの整合性を検討する時間として使えるだろう。
移行コストは比較的低い。Gemini APIのインターフェースは3.1系からの移行設計が考慮されており、モデルIDの変更程度で既存コードが動くケースが多いとされている。Gemini 3.5 Flashで動作確認済みのコードベースがあれば、Proへの切り替え検証はスムーズになる。
筆者の見解
Gemini 3.5 Proの「200万トークン」という数字はインパクトが大きく、コンテキストの上限がアーキテクチャ選択の足かせになっていた場面では選択肢として真剣に検討に値する。Googleの技術力の高さ、特にマルチモーダルと長文脈処理における投資の継続性は本物だ。
ただし、正直に言えば「数字と実際の精度は別物」という点には注意が必要だ。今回の記事でも触れているように、100万トークン超の領域では現世代の精度が約26%まで落ちるというデータがある。2M対応を謳ったうえで実務精度がどの水準を維持できるのか、GAリリース後の独立したベンチマークを待ちたい。
Googleは技術的な野心と実装のタイムラグが大きいことが過去にも見られた。「来月まで待ってほしい」という発言に会場がため息で反応したのは、そうした期待と現実のギャップへの率直な反応だろう。その期待に本物の品質で応えることができれば、Gemini 3.5 Proはエンタープライズ向けの長文脈処理市場で確かな地位を得るはずだ。6月のGAが楽しみではある。
出典: この記事は Gemini 3.5 Pro: The June 2026 Launch Guide の内容をもとに、筆者の見解を加えて独自に執筆したものです。