Geminiのタスク自動化を実機検証——遅くて不格好、でも確かに「未来」を感じた

GeminiがアプリをAI操作——ベータ機能「タスク自動化」を実機で5日間テスト GoogleのAIアシスタント「Gemini」に、スマートフォンアプリを自律的に操作する新機能「タスク自動化(Task Automation)」が追加された。現在はPixel 10 ProとSamsung Galaxy S26 Ultraを対象にベータ提供中で、UberやUber Eats、DoorDashなど一部のライドシェア・フードデリバリーサービスに対応している。 The Vergeのシニアレビュアー、アリソン・ジョンソン氏が5日間にわたって実機テストを行ったレポートが公開された。その評価は「遅くて不格好、でも圧倒的に印象的」という一言に集約される。 実際に使うとどうなる? ユーザーがGeminiに「夕食を注文して」と指示すると、GeminiはUber Eatsなどのアプリを自動で起動・操作し、メニュー選択から注文確認画面まで進める。画面下部にはGeminiが何をしているかを示すテキストが表示され、「チキンテリヤキコンボの2ポーション目を選択中」といった状態をリアルタイムで確認できる。 注目すべきは、Geminiがアプリの文脈を動的に解釈する能力だ。注文時にメニューが「ハーフポーション単位」でしか選べない構成だったとき、Geminiは自動的に2つのハーフを選んで1人前を構成した。一方、画面上に明確に表示されていた「グリーンズ(野菜)」のサイドメニューを見つけるのに手間取るなど、AIらしい不自然なつまずき方もある。 今回のテストでは、夕食の注文完了まで約9分かかった。ユーザーが自分で操作すれば1〜2分で済む作業だが、これはバックグラウンドで動作しながら他の作業と並行できることを前提に設計されている。 安全設計:最後の確認は人間が行う この機能の重要な設計思想として、Geminiは「確認・決済」の最終ステップを自動実行しない。注文内容をユーザーに確認させてから完了させる仕組みだ。テスト中にGeminiが勝手に注文を完了させてしまうケースはなかったという。 失敗するケースも見られたが、そのほとんどは開始後1〜2分以内。位置情報の許可を求められたり、配達先が以前使ったアメリカの住所のままになっていたりといった、アプリ側の初期状態に起因するものが多かった。 日本市場への示唆 現時点での対応サービスはUber系とDoorDashに限られており、日本国内で主流の出前館やmenuには未対応。また提供端末もPixel 10 ProとGalaxy S26 Ultraに限定されている。 ただし、この技術的アプローチは業界全体に影響を与える可能性がある。AppleのSiriやサムスンのGalaxy AI、そして国内スマートフォン向けAI機能の方向性にも波及することが予想される。 ジョンソン氏は「基調講演でも管理されたデモでもなく、実際のスマートフォンで本物のAIアシスタントが動作するのを初めて見た」と評価する。まだ実用的とは言えないが、AIエージェントがスマートフォン操作を代替する未来の最初の実装として、注目に値する機能だ。 元記事: Gemini task automation is slow, clunky, and super impressive

March 22, 2026 · 1 min · 胡田昌彦

生成AIの「クールエイド」は優生学の味がする——ドキュメンタリー『Ghost in the Machine』が暴くAIの暗い起源

生成AIの熱狂の裏側に潜む「優生学」の影 2024年にOpenAIがテキストから動画を生成するモデル「Sora」を一般公開したとき、映像ディレクターのヴァレリー・ヴィーチもその一人として興味を持ち、AI生成コンテンツを共有するオンラインコミュニティに参加した。 しかし彼女がそこで目にしたのは、衝撃的な光景だった。明示的に指示していないにもかかわらず、AIは人種差別的・性差別的なコンテンツを次々と生成した。さらに驚いたのは、AI熱狂者たちがそうした「毒」を吐き出すシステムを全く問題視していなかったことだ。 この体験がヴィーチを生成AIの実験から遠ざけ、同時に新たな探求へと駆り立てた——それが現在公開中のドキュメンタリー『Ghost in the Machine』(Independent Lens)だ。 「人工知能」という言葉自体がマーケティング用語 ヴィーチが最初に切り込むのは、「人工知能(Artificial Intelligence)」という言葉そのものだ。 「AIという言葉を使うなら、その意味をきちんと理解しなければならない。実はこの言葉、何の意味もない。マーケティング用語だし、ずっとそうだった」とヴィーチはインタビューで語る。 「AI」という語は1956年、計算機科学者のジョン・マッカーシーが研究資金を獲得するために作った造語だ。本作はこの事実を一つの通過点に過ぎないとして扱い、物語の起点をさらに100年近くさかのぼる。 ビクトリア朝の優生学から現代の機械学習へ 本作が掘り起こすのは、チャールズ・ダーウィンのいとこにあたるフランシス・ゴルトン(Francis Galton)だ。ゴルトンは19世紀後半に優生学(Eugenics)を創始した人物で、「劣等な」(すなわち非白人の)人種を排除することで人類を「改善」できるという、今日では完全に否定された人種差別的思想を体系化した。 ゴルトンは学術的にも一定の功績を残しているが、ヴィーチはその白人至上主義的信念が当時の社会科学全体に深く影響を与えたという事実を矮小化すべきではないと強調する。 特に重要なのがゴルトンの教え子・カール・ピアソン(Karl Pearson)との関係だ。ゴルトンが多次元モデリングの手法を開発したのは、アフリカ人女性とヨーロッパ人女性の「魅力度」を測定しようとしたことがきっかけだった。ピアソンはこの手法を継承・発展させ、ロジスティック回帰(Logistic Regression)を含む統計的ツール群を開発した。このロジスティック回帰こそ、現代の機械学習を支える根幹技術の一つである。 なぜ今、この歴史を掘り起こすのか 『Ghost in the Machine』が問いかけるのは、AI加速主義者たちが唱える「もうすぐ社会に恩恵をもたらす」という約束ではない。現在の技術がなぜこういう動作をするのか、その歴史的背景を理解させることにある。 日本でも生成AIの導入が急速に進む中、ツールの便利さだけに目を向けず、その設計思想や学習データに潜む偏見・差別をどう扱うかは、開発者・利用者双方に突きつけられた問いだ。ヴィーチの作品は、熱狂の中で見落とされがちなその問いを、歴史の視点から鋭く照らし出している。 元記事: The gen AI Kool-Aid tastes like eugenics

March 22, 2026 · 1 min · 胡田昌彦

AIへの最善投資は「エネルギー技術」かもしれない——データセンター電力不足が生む新たな投資機会

AIブームの陰で進む「電力危機」 ベンチャーキャピタルはここ5年間でAIスタートアップに5,000億ドル超を投資してきた。しかし今、最も賢明なAI投資先は「エネルギー技術」かもしれない——気候変動投資調査機関Sightline Climateの最新レポートがそう示唆している。 同社が追跡する190ギガワット分のデータセンタープロジェクトのうち、現在実際に建設中なのはわずか5ギガワットにとどまる。2025年には全体の約36%がタイムラインの遅延を経験しており、最大の原因が「電力へのアクセス」だ。昨年稼働したのはわずか6ギガワット分。遅延の連鎖は最終的に、AIを業務に活用する一般企業にも影響を及ぼす可能性がある。 2030年までに電力消費175%増の試算 ゴールドマン・サックスによると、AIによるデータセンターの電力消費は2030年までに175%増加すると予測されている。これは現代では前例のない電力不足を引き起こしており、全米で電気料金の上昇を招いている。 トランプ政権もこの危機を認識しており、テック企業に対して独自の発電設備の構築か、より高い料金の負担、あるいはその両方を求めている。もっとも、多くの大手テック企業はすでに自前の電力調達計画を進めていた。 GoogleやAmazonが進める「脱グリッド」戦略 Google、Amazon、Metaなどの大手テック企業は、電力網(グリッド)への依存を減らすべく積極的に動いている。Googleがミネソタ州で進める新データセンターはその好例だ。風力・太陽光に加え、Form Energyが開発した容量30ギガワット時の「100時間対応グリッドスケール蓄電池」を組み合わせる設計となっている。また、電力会社Xcel Energyと協力して新しい料金体系を設計し、新技術の普及促進を目指している。 日本でも、大規模データセンターの電力確保は喫緊の課題として浮上しており、再生可能エネルギーや蓄電技術への関心が急速に高まっている。 エネルギー技術スタートアップに熱い視線 電力問題の解決を目指すスタートアップも続々と登場している。Amperesand、DG Matrix、Heron Powerは新しい電力変換技術を開発中。一方、Camus、GridBeyond、Textureは電力フロー管理ソフトウェアの構築を進めている。 グリッドの老朽化とガスタービンなど発電設備の不足が代替エネルギー源への道を開いており、投資家の目線は今、AIそのものからAIを支えるエネルギーインフラへと移りつつある。電力不足という構造的課題が解消されるまでには長い時間がかかる見込みであり、エネルギー技術分野は今後も有望な投資機会であり続けると見られている。 ※出典: The best AI investment might be in energy tech 元記事: The best AI investment might be in energy tech

March 22, 2026 · 1 min · 胡田昌彦

トランプ政権のAI規制方針、州法を連邦法で上書きへ——子どもの安全責任は保護者に

トランプ政権、AI規制を連邦一元化へ——州の規制権限を大幅制限 トランプ政権は2026年3月、米国のAI政策を統一する立法フレームワークを公表した。最大の特徴は、各州が独自に制定してきたAI規制法を連邦法で「プリエンプション(優先適用)」し、事実上無効化する点だ。 ホワイトハウスの声明は「このフレームワークが機能するには、全米で統一的に適用される必要がある。州法がバラバラに乱立すれば、米国のイノベーションとグローバルなAI競争における主導権が損なわれる」と主張している。 イノベーション優先、規制は最小限に フレームワークは7つの主要目標を掲げており、いずれもAIの革新と普及拡大を前面に押し出している。「最小限の負担で国家標準を設ける」という考え方は、ホワイトハウスAI担当のデービッド・サックス氏(ベンチャーキャピタリスト)が推進する「アクセラレーショニスト」的思想と一致する。 規制の根拠となる独立した監督機関や、AIが引き起こす新たな被害への法的責任フレームワークは今回の方針には含まれておらず、批判的な声も上がっている。 未成年者保護は「親の責任」 注目すべき点として、未成年者の安全に関してフレームワークは「AI企業は性的搾取や未成年者への被害リスクを低減する機能を実装すべき」と述べるにとどまり、具体的な法的義務や罰則は設けていない。実質的な安全確保の責任は保護者に委ねられる形となっている。 州の権限はどこまで残るか 州が引き続き行使できる権限は、詐欺防止・子ども保護に関する一般法、ゾーニング規制、州自身によるAI利用に限定される。AI開発そのものの規制は「本質的に州際問題であり、国家安全保障・外交政策と紐付いている」として、州の管轄から外される。 また、「AIモデルを悪用した第三者の違法行為についてAI開発者を罰してはならない」という免責規定も盛り込まれており、プラットフォーム企業にとっては事業リスクの大幅な低減につながる。 米国の動向が日本にも影響 米国はAI規制の国際的な基準形成においても大きな影響力を持つ。欧州のEU AI Actが義務と罰則を重視する規制アプローチを採る中、米国が「イノベーション優先・軽規制」路線を明確にしたことで、国際的なAIガバナンスの方向性に関する議論が一層複雑化する可能性がある。日本も独自のAI戦略を策定する上で、この動向を注視する必要があるだろう。 なお、ニューヨーク州の「RAISE Act」やカリフォルニア州の「SB-53」など、大規模AIモデルの安全プロトコル公開を求める先進的な州法との衝突も今後の焦点となる。 ※出典: Trump’s AI framework targets state laws, shifts child safety burden to parents — TechCrunch AI 元記事: Trump’s AI framework targets state laws, shifts child safety burden to parents

March 22, 2026 · 1 min · 胡田昌彦

WordPress.comがAIエージェントによる記事執筆・公開に対応——ウェブコンテンツの自動化時代が本格到来

WordPress.comがAIエージェントによる自律的なサイト運営を解禁 ウェブホスティングの巨人 WordPress.com が、AIエージェントによるコンテンツ作成・管理機能を正式に導入した。これにより、AIが記事の下書き・編集・公開から、コメントの承認・返信、カテゴリやタグの整理、alt テキストや SEO メタデータの修正まで、ウェブサイト運営の大部分を担えるようになる。 サイトオーナーは自然言語でAIエージェントに指示を出すだけでよく、技術的な知識がなくてもウェブサイトを立ち上げ・維持できる。ハードルが大幅に下がる一方、「人間が書かない」コンテンツがウェブ上に増加するという懸念も避けられない。 MCPがつなぐAIとWordPress 今回の機能拡張は、昨年秋に導入された MCP(Model Context Protocol)サポートの延長線上にある。MCPはAnthropic が提唱する新興標準規格で、アプリケーションがLLM(大規模言語モデル)にコンテキストを提供するための共通インタフェースだ。 従来のMCP統合では、AIアシスタントがサイトのコンテンツや設定・アナリティクスを「読む」だけだった。今回の更新で、書き込み・構造変更まで可能になった。対応クライアントは Claude Desktop、ChatGPT、Cursor、VS Code など、MCP に対応した主要ツールが網羅されている。 有効化は wordpress.com/mcp から機能をトグルするだけで、利用したい機能を個別に選択できる。 安全策と透明性 AIによる変更はすべて Activity Log に記録される。また、AIが生成した投稿はデフォルトで下書き保存され、公開にはユーザーの承認が必要だ。AIエージェントはサイトのテーマ・デザイン(カラー、フォント、余白、ブロックパターン)を事前に読み取り、既存のデザインと整合するコンテンツを生成する仕組みになっている。 ウェブの43%が動く意味 WordPressは全インターネットサイトの 43%超 を支えるプラットフォームだ。WordPress.com の管理ホスティング部分はその一部にすぎないが、それでも月間 200億ページビュー・4億900万ユニークビジター を抱える巨大な存在である。 この規模のプラットフォームがAIエージェントによる自動公開を標準機能として提供することは、ウェブコンテンツの質と量、そして「誰がコンテンツを書くのか」という根本的な問いに新たな局面をもたらす。Meta が AI同士が投稿し合うSNS「Moltbook」を買収し、Anthropic がAIブログの実験を行うなど、AIによるコンテンツ生成の社会実装は着実に加速している。 日本においても、WordPress を利用する個人ブログや企業サイトは多く、今後この機能が日本語コンテンツ生成にどう活用されるか注目される。 ※出典: WordPress.com now lets AI agents write and publish posts, and more 元記事: WordPress.com now lets AI agents write and publish posts, and more

March 22, 2026 · 1 min · 胡田昌彦

NvidiaのGTC 2025まとめ:1兆ドル予測、NemoClaw、そして暴走ロボット「オラフ」

NvidiaのGTC 2025が示した「AIインフラ覇権」への野望 NvidiaのCEO、ジェンスン・フアン(Jensen Huang)氏が今週、恒例のレザージャケット姿でGTC(GPU Technology Conference)2025の基調講演に登壇し、約2時間半にわたるプレゼンテーションを披露した。 1兆ドルの野望 最も注目を集めたのは、2027年までにAIチップ売上が1兆ドルに達するという大胆な予測だ。AI需要の急拡大を背景に、NvidiaはH100/B200系のGPUを中心としたAIインフラ市場でのポジションをさらに強化する姿勢を鮮明にした。日本でもソフトバンクやNTTなどの大手企業がNvidiaのGPUを大量調達しており、この予測はあながち誇張とも言えない。 「OpenClaw戦略」とは何か フアン氏は講演の中で、「すべての企業がOpenClaw(オープンクロー)戦略を必要としている」と宣言した。OpenClawはNvidiaのAIエージェント向けオープンプラットフォームで、エンタープライズ向けのAIエージェント構築・展開を標準化する狙いがある。NemoClaw(旧NeMo Guardrailsの後継と見られるフレームワーク)もあわせて発表されており、AIエージェントの安全性と制御性を担保するレイヤーとして注目されている。 自動運転からディズニーまで 今回のGTCで際立ったのは、Nvidiaが単なる「チップメーカー」の域を超えようとしている点だ。自動運転(DRIVE Orin/Thor)、ロボティクス、そしてディズニーパークへのAIインフラ提供まで、その触手は多岐にわたる。フアン氏のメッセージは明快だ——NvidiaはAIトレーニングから推論、ロボット、エンターテインメントまで、あらゆる分野の基盤(ファウンデーション)になることを目指している。 話題をさらったロボット「オラフ」 講演のラストを飾ったのは、ディズニーの映画『アナと雪の女王』に登場するキャラクター「オラフ」を模したロボットだった。しかし、このロボットが予定外にしゃべり続けてしまい、運営側がマイクをカットするというハプニングが発生。会場の笑いを誘いつつも、AIロボットの制御における課題をはからずも象徴する場面となった。 スタートアップへの影響 NvidiaのAIインフラパートナーシップの拡大は、スタートアップ界隈にも大きな影響を与える。GPU調達コストの変動や、OpenClawエコシステムへの乗り入れを検討する企業が増えるなど、Nvidiaの動向は引き続きAI産業全体の方向性を左右しそうだ。 ※出典: What happened at Nvidia GTC: NemoClaw, Robot Olaf, and a $1 trillion bet 元記事: What happened at Nvidia GTC: NemoClaw, Robot Olaf, and a $1 trillion bet

March 22, 2026 · 1 min · 胡田昌彦

MicrosoftがWindows 11のCopilot統合を縮小——「AIを詰め込みすぎた」反省から方針転換

MicrosoftがCopilot縮小へ——「意味のある場所にだけAIを」 Microsoftは2026年3月21日(現地時間)、Windows 11の品質改善に向けた一連の変更を発表した。その中で注目を集めているのが、AI アシスタント「Copilot(コパイロット)」の統合箇所を意図的に削減するという方針転換だ。 対象アプリと今後の方向性 同社のWindows & Devices部門EVP(執行副社長)、パバン・ダブルリ氏は公式ブログで「CopilotをWindowsに統合する方法と場所について、より慎重に判断する」と述べた。削減対象となるのはまずフォト、ウィジェット、メモ帳(Notepad)、切り取りツール(Snipping Tool)で、「真に役立つ」AIエクスペリエンスに焦点を絞る姿勢を明確にした。 この「Less is More(少ない方が良い)」アプローチは、近年高まるAIブロート批判——つまりあちこちにAI機能を詰め込みすぎることへの反発——を受けたものとみられる。米調査機関ピュー・リサーチが2025年6月に実施した調査では、米国成人の半数がAIに対して「ワクワクよりも不安を感じる」と回答しており、2021年の37%から大幅に増加している。日本でも生成AIへの期待と警戒が混在する状況は同様だ。 これまでの迷走——Recallの遅延と静かな撤退 MicrosoftがCopilot統合を見直すのはこれが初めてではない。今月初めにWindows Centralが報じたところによれば、Windows 11全体にCopilotブランドのAI機能を展開する計画はすでに静かに棚上げされており、設定アプリやファイルエクスプローラーへのシステムレベル統合も含まれていたという。 さらに遡れば、同社はCopilot+ PC向けのAI記憶機能「Windows Recall(リコール)」のリリースを1年以上延期した経緯がある。プライバシーへの懸念が相次いだためで、2025年4月にようやく提供が始まったものの、セキュリティ上の脆弱性は現在も発見が続いている状況だ。 AI以外の改善策も同時発表 Copilotの縮小と並行して、Microsoftはユーザビリティ改善も打ち出した。主な変更点は以下の通り。 タスクバーの上部・側面への移動が可能に(長年のユーザー要望) システムアップデートのコントロール強化 ファイルエクスプローラーのパフォーマンス向上 ウィジェット体験のブラッシュアップ フィードバックHubの更新とWindows Insider Programのナビゲーション改善 ダブルリ氏は「過去数カ月、コミュニティの声に耳を傾けてきた」と述べており、今回の変更がユーザーフィードバックを強く意識したものであることを示唆している。 まとめ 「AIをどこにでも組み込む」という姿勢から「本当に価値ある場所だけに絞る」への転換は、業界全体のトレンドとも一致する。過去数年のAIブームで積み上がった「AIのためのAI機能」への反省が、ようやくプロダクトレベルで現れ始めたと言えるだろう。 ※出典: Microsoft rolls back some of its Copilot AI bloat on Windows 元記事: Microsoft rolls back some of its Copilot AI bloat on Windows

March 22, 2026 · 1 min · 胡田昌彦

国防総省がAnthropicに「ほぼ合意」とメール送信——トランプ関係断絶宣言の翌週に

国防総省がAnthropicに「ほぼ合意」とメール——関係断絶宣言の翌週に AIスタートアップ企業Anthropicは現地時間3月21日(金)夕方、カリフォルニア連邦裁判所に2通の宣誓宣言書を提出し、米国防総省(DOD)から受けた「国家安全保障上のリスク」指定に真っ向から反論した。3月24日(火)のRita Lin判事による審理を前に提出されたこの文書は、政府側の主張が技術的な誤解と、交渉中には一度も提起されなかった主張に基づいていると訴えている。 訴訟の背景 そもそもこの対立は2026年2月末に表面化した。トランプ大統領と国防長官のPete Hegseth氏が、AnthropicがAI技術の軍事利用制限なき使用を拒否したことを理由に、関係を断絶すると公表したのが発端だ。 その後、DODはAnthropicをサプライチェーンリスクとして正式に指定。Anthropicはこれを不服として提訴し、今回の宣誓宣言書提出に至った。 「そんな要求はしていない」——政策責任者が反論 宣誓宣言書を提出したのは、政策担当責任者のSarah Heck氏と公共部門担当責任者のThiyagu Ramasamy氏の2名。 Heck氏はオバマ政権下で国家安全保障会議(NSC)に勤務した元政府高官で、現在はAnthropicの政府関係・政策業務を統括している。同氏は2月24日の会議でCEOのDario Amodei氏がHegseth長官とDOD次官のEmil Michael氏と直接会談した席に同席していた人物でもある。 同氏の宣誓宣言書では、「Anthropicが軍事作戦に対する承認権限を求めた」という政府側の主張を明確に否定。「交渉中、私を含むAnthropicの従業員が、そのような役割を求めると発言したことは一切ない」と記している。 さらに、「DODがAIシステムを作戦中に無効化・改変される可能性を懸念する」という主張についても、交渉中には一度も提起されず、政府の訴訟文書に初めて登場したものだと指摘。Anthropicが反論する機会が与えられなかった点を批判した。 最大の焦点——「ほぼ合意」メールの存在 今回最も注目を集めているのが、Heck氏の宣誓宣言書に添付された1通のメールだ。 3月4日——DODがAnthropicに対するサプライチェーンリスク指定を正式に確定した翌日——、DOD次官のMichael氏がAmodei CEOに宛てて「両者は(国家安全保障上の懸念として挙げられた)自律型兵器と米国民の大規模監視、この2つの問題について『非常に近い(very close)』立場にある」とメールを送っていた。 ところがその翌日3月5日にAmodei氏が「建設的な協議を続けていた」と声明を出すと、Michael氏は3月6日にXで「国防省はAnthropicとの交渉を現在行っていない」と投稿。さらに翌週にはCNBCで「交渉再開の可能性はゼロ」とまで発言した。 Anthropicの主張はシンプルだ。「もしAnthropicの姿勢がそれほど深刻な国家安全保障上の脅威なら、なぜ指定確定直後に政府自身の高官が『ほぼ合意』と言っていたのか」——この矛盾を法廷で問い直そうとしている。 日本への示唆 日本でもAIの軍事・安全保障利用を巡る議論が高まりつつある中、民間AI企業が政府の軍事利用要求をどこまで受け入れるかという問題は、対岸の火事ではない。Anthropicの姿勢は、AI倫理と国家安全保障の狭間で企業がどう振る舞うべきかを考える上で重要な先例となりうる。 ※出典: New court filing reveals Pentagon told Anthropic the two sides were nearly aligned — a week after Trump declared the relationship kaput 元記事: New court filing reveals Pentagon told Anthropic the two sides were nearly aligned — a week after Trump declared the relationship kaput

March 22, 2026 · 1 min · 胡田昌彦

Gemini 3.1 Flash-Lite登場——大規模処理向け最速・最安モデルがプレビュー公開

Gemini 3.1 Flash-Lite——大量処理時代の新スタンダード Googleは2026年3月、Gemini 3シリーズの新モデル「Gemini 3.1 Flash-Lite」をプレビューとして公開した。開発者向けにはGoogle AI StudioのGemini API経由で、エンタープライズ向けにはVertex AI経由で利用できる。 コスト効率と速度を両立 価格設定は入力トークン100万件あたり0.25ドル、出力トークン100万件あたり1.50ドルと、大型モデルの数分の一に抑えられている。Artificial Analysisのベンチマークによると、前世代の2.5 Flashと比べて初回応答トークンまでの時間が2.5倍短縮、出力速度も45%向上しており、品質は同等以上を維持しているという。 リアルタイム性が求められる高頻度ワークフローにとって、この低レイテンシーは大きな強みとなる。 ベンチマーク性能 Arena.aiリーダーボードでのEloスコアは1432を記録。同クラスの他モデルと比較して、推論・マルチモーダル理解のベンチマークでも優れた結果を示している。 GPQA Diamond: 86.9% MMMU Pro: 76.8% 注目すべきは、これらのスコアが前世代の大型モデル「2.5 Flash」さえ上回る水準という点だ。 「思考レベル」の制御機能 3.1 Flash-LiteはAI StudioおよびVertex AIで思考レベル(Thinking Levels)を標準搭載している。開発者はタスクごとにモデルの「思考の深さ」を調整できるため、コスト管理と精度のバランスを柔軟にコントロールできる。 主なユースケースとして以下が挙げられている。 大量翻訳・コンテンツモデレーション(コスト優先の高頻度処理) UIやダッシュボードの自動生成(複雑な推論が必要な処理) シミュレーション作成・マルチステップエージェント 大量画像の分析・分類 すでに活用する企業も Latitude、Cartwheel、Wheringなどの企業がアーリーアクセスとして3.1 Flash-Liteを採用。テスターからは「上位モデル並みの精度で複雑な入力を処理できる」との評価が寄せられている。 日本のエンジニアへの示唆 日本国内でも翻訳・情報抽出・コンテンツ審査といった大量バッチ処理ニーズは高い。Vertex AIはすでに東京・大阪リージョンで利用可能なため、レイテンシーを抑えつつ本モデルを活用できる環境が整っている。APIコストを重視するスタートアップや、大規模処理を抱えるエンタープライズにとって、試す価値のある選択肢となりそうだ。 ※出典: Gemini 3.1 Flash-Lite: Built for intelligence at scale 元記事: Gemini 3.1 Flash-Lite: Built for intelligence at scale

March 22, 2026 · 1 min · 胡田昌彦

GeminiがGoogle Sheetsでスプレッドシート操作の最高性能を達成——人間の専門家レベルに迫る70.48%の成功率

GeminiがGoogle Sheetsで業界最高水準の性能を達成 Googleは、Google Workspace向けAIアシスタント「Gemini in Sheets」の新機能をベータ版として発表した。今回の更新により、ユーザーは自然言語でスプレッドシートの作成・整理・編集を指示できるようになり、基本的なデータ入力から複雑な分析まで幅広いタスクに対応する。 SpreadsheetBenchで70.48%——人間の専門家に肉薄 特に注目すべきは、公開ベンチマーク「SpreadsheetBench」における評価結果だ。このベンチマークは、現実のビジネスシナリオに即したスプレッドシート編集タスクでモデルの能力を測る指標として広く参照されている。 Gemini in Sheetsは全タスクで70.48%の成功率を記録し、OpenAIやMicrosoftなど競合各社のAIを上回った。さらにこのスコアは人間の専門家が達成する水準に近いレベルとされており、AIによるスプレッドシート自律操作の実用化が現実味を帯びてきた。 日本のビジネス現場への影響 Excelと並んでGoogle Sheetsは日本のビジネス現場でも広く利用されており、特にスタートアップやテクノロジー企業での活用が進んでいる。今回の機能強化により、関数の作成やピボットテーブルの組み立てといった従来は習熟が必要だった作業を、AIへの自然言語指示だけで完結できる可能性が高まる。 繰り返しの多いデータ整形や集計処理の自動化が容易になれば、非エンジニアでも高度なデータ分析を実行できる環境が整うことになる。 Google Workspaceへの統合展開 今回のアップデートはSheetsにとどまらず、Google Drive・Docs・Slidesにもわたる広範なGemini強化の一環として提供される。Googleはこれらの機能をGoogle Workspace向けに順次展開していく方針だ。 Gemini in Sheetsのベータ機能は、対象のWorkspaceプランで利用可能。詳細はGoogleの公式ブログで確認できる。 ※出典: Gemini in Google Sheets just achieved state-of-the-art performance. 元記事: Gemini in Google Sheets just achieved state-of-the-art performance.

March 22, 2026 · 1 min · 胡田昌彦

AI・テクノロジーの情報を発信しています

YouTube

AI・テクノロジーの最新トレンドを動画で配信中

note

技術コラム・深掘り記事を公開中