スマートフォンが「エージェントを走らせるデバイス」に変わる日が、じわじわ近づいている。Googleは2026年4月2日、オープンモデルファミリー「Gemma 4」を発表するとともに、そのEdgeモデル(E2B・E4B)をAndroid AICore Developer Previewに統合したと明らかにした。クラウドに頼らず、端末上でツール呼び出しや多段階推論を実行できる——この一文が持つ意味は、思った以上に大きい。

Gemma 4 Edgeとは何か

Gemma 4はApache 2.0ライセンスで公開されたオープンモデルのファミリーで、今回注目すべきはEdge向けに設計された「E2B」(約20億パラメーター相当)と「E4B」(約40億パラメーター相当)の2バリアント。これらはモバイル・エッジデバイスでの推論に最適化されており、専用ファインチューニングなしで以下の能力を持つとされている。

  • 多段階プランニングと自律アクション: 単発の質問応答ではなく、複数ステップにわたるタスクを自律的に実行
  • オフラインコード生成: ネットワーク接続なしにコードを生成・実行
  • 音声・映像処理: マルチモーダル入力を端末上で処理
  • 140言語以上のサポート: グローバル展開を前提とした多言語対応

Android AICore Developer Previewへの統合

Android AICore は、Google がOSレベルで提供するAI推論基盤だ。アプリ開発者はこのAPIを通じてGemma 4 Edgeモデルにアクセスでき、個別にモデルをバンドルする必要がない。これはiOSのCore MLに近い設計思想で、端末メーカーやアプリ開発者の実装コストを大幅に下げる効果がある。

加えて、GoogleはGoogle AI Edge Gallery(iOS・Android対応)というリファレンスアプリも同時公開した。このアプリに搭載された「Agent Skills」は、オンデバイスで多段階の自律ワークフローを実行する機能で、以下のようなユースケースが例示されている。

  • Wikipedia等の外部知識ベースへのクエリ(RAG的な活用)
  • 音声入力から睡眠・気分データを読み取りグラフ化
  • テキスト・動画からフラッシュカード生成
  • テキスト読み上げ・音楽合成など他モデルとの連携

より広範なデバイス展開を狙う開発者向けには、LiteRT-LM(旧TensorFlow Lite系の推論ランタイムにGenAI特化ライブラリを追加したもの)も提供される。XNNPackやML Driftによる高性能推論を活かしつつ、モバイル・デスクトップ・エッジデバイス全域をカバーする設計だ。

日本のエンジニア・IT管理者への影響

プライバシーとコンプライアンス面での新しい選択肢が生まれる点が最も実務的な意義だ。医療・金融・法律など機密情報を扱う業種では、データをクラウドに送りたくないケースが多い。端末上でエージェント処理が完結するなら、情報漏洩リスクを抑えながらAI活用の恩恵を受けられる。

開発者視点では、Apache 2.0ライセンスである点が重要。商用利用・改変・再配布が自由で、自社アプリへの組み込みもライセンス上の障壁が低い。LiteRT-LMのAPIも既存のAndroid/TFLite開発者には比較的馴染みやすい設計になっている。

エッジAIアーキテクチャの設計としては、「クラウドでヘビー処理・エッジで軽量処理」という従来の分業モデルが崩れ始めることを意味する。エッジ側でも多段階推論が走るなら、どのタスクをどこで実行するかのアーキテクチャ判断が複雑化する。将来の設計時には「エッジファースト」の選択肢を真剣に検討すべき時代になってきた。

筆者の見解

今回の発表で個人的に一番刺さったのは、「Agent Skills」という機能の設計思想だ。単発の質問に答えるのではなく、「計画→実行→検証」のサイクルをデバイス上で回し続ける——これはまさに、AIエージェントの真価を引き出す「ループ設計」の文脈と重なる。

オフライン・オンデバイスでこのループが動くなら、ネットワーク遅延やコストを気にせずエージェントを走らせ続けられる。エンタープライズ向けのモバイルアプリや、IoT端末上での自律制御など、これまでクラウド依存でしか実現できなかったシナリオの可能性が広がる。

一方で、正直なところ「触って確かめるまでは慎重に」という気持ちも残る。多段階推論・ツール呼び出しのクオリティは、ベンチマーク数値よりも実際のタスク精度で判断すべきだ。Developer Previewという段階である以上、実運用に耐えるかどうかはこれからの評価にかかっている。

オンデバイスAIは「夢の話」から「実装の話」に移行しつつある。Apache 2.0という開放的なライセンスのもとで開発者コミュニティがどこまで積み上げていくか、次の6〜12ヶ月が試金石になるだろう。


出典: この記事は Bring state-of-the-art agentic skills to the edge with Gemma 4 の内容をもとに、筆者の見解を加えて独自に執筆したものです。