Google、Gemini 3.1 Flash-Liteを公開——応答速度2.5倍・出力45%高速化でコスト重視の本番環境向けに

Google、Gemini 3.1 Flash-Liteを開発者向けAPIに正式公開

Googleは2026年3月3日、Gemini APIのリリースノートにて「Gemini 3.1 Flash-Lite Preview」の提供開始を発表した。これはGemini 3シリーズにおける初のFlash-Liteモデルであり、処理速度とコスト効率を最大化した設計が特徴となっている。

主要スペック：スピード重視の効率特化型

公開された情報によると、Gemini 3.1 Flash-Liteは以前のGeminiバージョンと比較して以下の改善を実現している。

応答速度（Time to First Token）：2.5倍高速化
出力生成速度（Output Generation）：45%高速化

この性能向上は、大量のリクエストをさばく必要があるプロダクション環境や、レイテンシが重視されるリアルタイムアプリケーションへの適用を強く意識したものだ。Googleは「コスト重視のユースケース向け高効率モデル」と位置づけており、API利用コストを抑えながらスケールアウトしたい開発者・企業に向いている。

Gemini APIをめぐる最近の動き

今回の発表に前後して、Gemini APIには複数の重要なアップデートが加えられている。

新機能の追加（2026年3月）

Built-in Tools + Function Calling の組み合わせ機能（3月18日）：Gemini組み込みツールとカスタム関数呼び出しを単一のAPIコールで同時利用できるようになった。エージェント型アプリケーション開発の幅が大きく広がる
Grounding with Google Maps（3月18日）：Gemini 3シリーズでのGoogle Maps連携グラウンディングが解禁
gemini-embedding-2-preview（3月10日）：テキスト・画像・動画・音声・PDFをひとつの埋め込み空間にマッピングするマルチモーダル埋め込みモデルを初公開

廃止・終了スケジュール

gemini-2.5-flash-lite-preview-09-2025：2026年3月31日にシャットダウン予定
gemini-2.0-flash / gemini-2.0-flash-lite 系：2026年6月1日にシャットダウン予定

Gemini 2.x系モデルのサポート終了が続いており、開発者はGemini 3系への移行計画を早めに立てておく必要がある。

日本の開発者への影響

国内でもAI機能の組み込みを進めるサービスは増加しており、APIコストとレスポンス速度はプロダクトの競争力に直結する。Gemini 3.1 Flash-Liteのような効率特化型モデルの登場は、大規模リクエストを扱うチャットボット・文書要約・コンテンツ生成パイプラインなどへの導入障壁を下げる可能性がある。

モデルの詳細スペックと開発者向けガイダンスはGoogle AI StudioおよびGemini APIドキュメントで確認できる。

元記事: Google Releases Gemini 3.1 Flash-Lite: 2.5× Faster Response, 45% Faster Output

Google、Gemini 3.1 Flash-Liteを開発者向けAPIに正式公開#

主要スペック：スピード重視の効率特化型#

Gemini APIをめぐる最近の動き#

日本の開発者への影響#

Google、Gemini 3.1 Flash-Liteを開発者向けAPIに正式公開

主要スペック：スピード重視の効率特化型

Gemini APIをめぐる最近の動き

日本の開発者への影響