Tech News JP

MicrosoftがWindows 11の検索機能を改善——ローカルファイル・アプリがWeb結果より優先表示される仕様へ

MicrosoftはWindows 11の検索機能を大幅に見直し、タスクバーの検索バーでローカルのファイルやアプリをBingなどのWeb検索結果より優先して表示する改善を段階的に展開中であることを公式に認めた。何が変わるのか長らくWindows 11の検索バーは「なんでもこなすオールインワン機能」として設計されており、ローカルのファイル検索と同時にBingのWeb検索結果も混在して表示してきた。この結果、たとえばアプリ名を検索しても関係のないWebページが上位に並ぶ、といったUXの問題が常態化していた。 MicrosoftはWindows InsidersのExperimental Channel向けBuild 26300.8493のリリースノートで、次のように明記している。「ファイルやアプリが、コンテンツとしてより強い一致を示す場合に、Web候補より確実に上位に表示されるようにしました」実際のテストでは、映画関連のファイル名を検索した際に、従来はBingで映画情報が上位に出ていたところ、ローカルに保存されたそのファイルが最初に表示されるようになったことが確認されている。また、タイポ（入力ミス）がある場合でもローカル結果が優先されるよう改善されており、日常的な検索精度が大きく向上する見込みだ。今後のロードマップ今回の変更はあくまでも始まりに過ぎない。Microsoftは2026年3月20日に公開したブログ記事の中で、Windows 11 2026品質改善の重点領域のひとつとしてSearchを挙げており、以下の改善を計画していることが明らかになっている。ローカル結果とWeb結果を視覚的に区別する新UIの内部テスト中タスクバー・スタートメニュー・エクスプローラー・設定アプリにまたがる一貫した検索体験の統一より「高速」で「信頼できる」UIへの刷新 Settingsからの検索設定変更（現状はレジストリ操作が必要）なお、Web検索機能そのものが廃止されるわけではない。Bingとの統合は引き続き維持されるが、ユーザーの意図がローカルコンテンツにある場合はそちらを優先するという、当たり前のことが当たり前にできるよう修正される形だ。実務への影響 IT管理者・エンジニアへのポイント現状、企業環境でWindows SearchのWeb結果を無効化したい場合はグループポリシーまたはレジストリ編集が必要だが、今後はSettings UIでの制御が可能になる可能性がある。大規模展開時に構成の手間が減ることが期待できる。また、エクスプローラーの検索精度向上も計画されているため、大量のファイルを扱う作業環境——開発・設計・法務など——での生産性改善にも直結する。Preview buildで先行確認したい場合は、Windows InsiderプログラムのCanaryまたはDevチャンネルへの参加が選択肢となる。ただし本番環境への早期適用は、例年通り不具合リスクを考慮して数週間様子を見るのが無難だ。筆者の見解正直に言えば、これは「なぜ今まで放置されていたのか」という性質の改善だ。ファイルを検索したいときにWebの映画情報が出てくるのは、UIとして根本的に筋が悪い。ユーザーの意図を優先するというのは検索エンジンの基本中の基本であり、それがOSのローカル検索でできていなかった事実は、長年のWindows Searchへの不満の根本にある。ただ、今回Microsoftが「内部ベンチマークとして精度向上を設定している」と明言し、UIの一貫性・高速化・結果の可視化という複数の軸で改善を進めているのは、方向性として評価できる。Windowsの基盤部分の品質を地道に上げる取り組みは、派手ではないが長く使われるOSとして必要なことだ。 AI機能の華々しいアップデートが注目を集める一方で、こういった「地に足のついたUX改善」が積み重なることで、日常的な使い勝手は確実に向上する。Microsoftが正面から取り組んでほしい領域はほかにもあるが、まずはこの改善が予告通りに安定して届くことを期待したい。出典: この記事は Microsoft says Windows 11’s Search will stop forcing web over your apps and local files in most cases の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

MicrosoftのAzure Artifact Signingを悪用した「マルウェア署名代行サービス」——脅威グループFox Tempestを摘発、1,000件超の証明書を失効処理

Microsoftは2026年5月19日、同社のコード署名サービス「Azure Artifact Signing」を悪用してマルウェアに正規証明書を付与する「マルウェア署名代行サービス（MSaaS）」を運営していた脅威グループ「Fox Tempest」の活動を摘発・無効化したと発表した。 Azure Artifact Signingの悪用という巧妙な手口 Azure Artifact Signing（旧称：Trusted Signing）は、Microsoftが2024年に開始したクラウドベースのコード署名サービスだ。開発者が自分のプログラムをMicrosoftのインフラ上で簡単に署名できる仕組みで、正規の開発者にとっては利便性の高いサービスである。 Fox Tempestはこのサービスを不正に利用し、マルウェアにMicrosoft由来の正規コード署名証明書を付与することで、Windowsのセキュリティ機能やエンドポイント保護を回避していた。署名されたマルウェアはMicrosoft Teams、AnyDesk、PuTTY、Webexなどの正規ソフトウェアになりすまし、被害者がダウンロード・実行するよう誘導された。特に巧妙だったのが「有効期間72時間の短命証明書」の活用だ。長期証明書は証明書失効リストに載るリスクがあるが、72時間以内に攻撃を完結させれば証明書が有効なまま悪用できる。グループは1,000件以上の証明書と数百のAzureテナント・サブスクリプションを量産することで、大規模かつ持続的な攻撃インフラを構築していた。身元確認をくぐり抜けるため、米国・カナダの盗用されたIDが利用された疑いがあるとされている。関連するマルウェア・ランサムウェアの全容今回摘発された活動は、複数の悪名高いマルウェアキャンペーンと関連していることが明らかになっている。情報窃取系: Lumma Stealer、Vidar、Oyster（ローダー）ランサムウェア: Rhysida、Akira、INC、Qilin、BlackByte 攻撃に関与した脅威グループとして、INC Ransomwareメンバーを含む「Vanilla Tempest」、Storm-0501、Storm-2561、Storm-0249が特定されている。典型的な感染チェーンは次の通りだ：偽のMicrosoft Teamsインストーラーを実行 → 悪意のあるローダーが起動 → 署名済みOysterマルウェアがインストール → 最終的にRhysidaランサムウェアが展開される。Windowsが「正規ソフトウェア」と認識することで、通常であればブロックされるはずのマルウェアが初期段階をすり抜けるという構造だ。 Microsoftの対応措置 Microsoftは今回、以下の措置を実施した。 1,000件超のコード署名証明書を失効処理 signspace[.]cloudドメインを押収数百台の仮想マシンをオフライン化犯罪プラットフォームへのアクセスをブロックニューヨーク南部地区連邦地方裁判所に法的措置（Vanilla Tempestを共謀者として名指し）押収されたドメインはMicrosoftの公式説明ページにリダイレクトされており、摘発の内容が一般公開されている。Microsoftのデジタル犯罪対策部門（DCU）が業界パートナーと連携して実施した今回の作戦は、インフラ破壊から法的措置まで包括的な対応となっている。実務への影響：日本のエンジニア・IT管理者が今すぐ確認すべきことエンドポイント保護の見直しコード署名だけを信頼の根拠にしてはいけない。今回の事件は、署名証明書が比較的容易に不正取得・悪用できることを改めて示した。Windows Defender / EDR製品の振る舞い検知を有効化し、署名済みファイルであっても動的解析を通過させる設定を確認したい。また、Microsoft TeamsなどのアプリケーションはMicrosoft StoreまたはIntuneを通じた組織配布経路からのみインストールを許可するポリシーの導入を検討すべきだ。 Azure環境のガバナンス自社テナントでAzure Artifact Signingを利用している場合、証明書発行ログを定期的に確認する習慣をつけたい。また、不審なAzureテナントやサブスクリプションの作成を検知するためのMicrosoft Defender for Cloudのアラート設定も見直す価値がある。ユーザー啓発「Microsoftの署名があるから安全」という思い込みは今回で完全に否定された。エンドユーザー向けのセキュリティ教育において、この点を明確に伝える必要がある。筆者の見解今回の件を見て、「よくやった」と「なぜここまで見逃したのか」が同時に頭をよぎった。コード署名という信頼の根幹をなすインフラを不正利用され、1,000件超の証明書が発行されるまで検知・停止できなかった事実は軽視できない。「Microsoftの署名＝安全」という前提が攻撃者に徹底的に利用された形であり、正直なところもったいないと感じる。Azure Artifact Signingの設計には、このような大量不正発行を早期に検知するための仕組みが不十分だったということだ。その一方で、DCUが法的措置を含む大規模な摘発に踏み切ったことは素直に評価したい。インフラ破壊だけでなく、裁判所への提訴とVanilla Tempestへの共謀者認定まで踏み込んだ姿勢は、業界全体への抑止効果をもたらすはずだ。今回の根本的な教訓は「署名ベースの信頼モデルには限界がある」という点に尽きる。ゼロトラストアーキテクチャの観点では、コード署名はあくまで信頼判断の「ヒントの一つ」であって、それだけで実行許可を与えてはいけない。振る舞い検知、最小権限の実行環境、ネットワーク通信の監視——これらを組み合わせた多層防御が今こそ不可欠だ。 Microsoftにはぜひ、今回の経験をサービス設計にフィードバックしてほしい。「次に同様の悪用が始まったら数日以内に止められる」というレベルの検知・対応品質向上を、応援する立場として強く期待している。 ...

Windows

AIアプリ向けベクターDB「ChromaDB」にCVSS 10.0の最高深刻度脆弱性——未認証で任意コード実行が可能

AIアプリケーション向けのオープンソースベクターデータベース「ChromaDB」の Python FastAPI 実装に、CVSS スコア 10.0（最高深刻度）の脆弱性（CVE-2026-45829）が発見された。セキュリティ企業 HiddenLayer が2月に報告したこの欠陥は、インターネットに公開されたサーバーに対して、認証なしで任意コードを実行できるという深刻なものだ。 ChromaDB とはどんなミドルウェアか ChromaDB は、LLM（大規模言語モデル）推論の際に意味的に関連するドキュメントを高速に取得するための「ベクターデータベース」だ。RAG（Retrieval-Augmented Generation）アーキテクチャを採用するエージェント型AIアプリケーションで広く使われており、PyPI からの月間ダウンロード数は約1,400万件に達する。近年の生成AIブームを背景に、スタートアップから大企業まで多数のプロジェクトで採用が進んでいる。脆弱性の仕組み——「認証は存在するが、場所が間違っている」 HiddenLayer の分析によれば、問題の本質は認証機能の欠如ではなく、認証チェックの実行順序が誤っている点にある。攻撃者が細工したリクエストを送ると、ChromaDB は Hugging Face から悪意ある機械学習モデルを取得してローカルで実行する。認証チェックが走るのはその後であり、時点では手遅れだ。サーバーはリクエストを拒否して HTTP 500 を返すが、攻撃者のペイロードはすでに動いている。 HiddenLayer はこれを次のように端的に表現している。「認証は実装されているが、実行される順番が間違っている。認証が発火する頃には、モデルはすでにフェッチされ実行済みだ」こうした「チェックより先に処理が走ってしまう」設計上の欠陥は、ミドルウェアレイヤーで発生すると被害範囲が広くなりやすく厄介だ。影響範囲と現状対象バージョン: ChromaDB 1.0.0〜1.5.8（Python FastAPI サーバー）非対象: ローカル限定デプロイ / Rust フロントエンド使用環境 **インターネット公開インスタンスの約73%**が脆弱なバージョンを稼働中（Shodan 調査より）バージョン 1.5.9 がリリース済みだが、本脆弱性が修正済みかどうかは執筆時点で未確認 HiddenLayer はメール・SNS 経由で複数回連絡を試みたが、開発者から返答なし実務での対応ポイントこの脆弱性への対処は「ChromaDB を使っているかどうか」の確認から始まる。即時確認すべき事項公開 API の棚卸し: ChromaDB の Python API サーバーポートがインターネットや社内 LAN に無防備に開放されていないか確認するバージョン確認: pip show chromadb でバージョンを確認し、1.0.0〜1.5.8 なら対応が必要 Rust フロントエンドへの切り替え: 公開が必要な環境では、影響を受けない Rust 版フロントエンドへの移行を検討するネットワークレベルの遮断: ファイアウォールや NSG で ChromaDB API ポートへのアクセスを信頼できるホストのみに絞る ML モデルアーティファクトの事前スキャン: trust_remote_code=True でモデルをロードすることは、未検査コードをそのまま実行するに等しい。ランタイム前のスキャンを運用フローに組み込むクラウド上でRAGシステムを構築・運用しているチームは今すぐデプロイ構成を見直したい。開発環境でローカルにのみ起動しているケースは対象外だが、Kubernetes や Docker で外部公開している場合は要注意だ。 ...

Plex生涯パスが約11万円に3倍値上げ——7月1日までなら現行249.99ドルで駆け込み購入可能

自前の動画ライブラリをどこからでもストリーミングできるメディアサーバーアプリ「Plex」の生涯サブスクリプション「Lifetime Plex Pass」が、2026年7月1日をもって現行の249.99ドル（約3万8,700円）から749.99ドル（約11万6,000円）へと約3倍に値上げされることが明らかになった。米テクノロジーメディアThe Vergeが5月19日（現地時間）に報じた。昨年3月に119.99ドルから249.99ドルへ約2倍に引き上げられたばかりで、1年余りで再び大幅な価格改定となる。なぜこの値上げが話題になるのか PlexはNASや自作PCにインストールするメディアサーバーソフトとして、ガジェット愛好家を中心に長年支持されてきた。NetflixやAmazon Prime Videoとは異なり、自分が所有するコンテンツを自分のサーバーから配信するというコンセプトが特徴だ。「自分のデータを自分で管理する」という理念を重視するユーザー層に強く支持されてきただけに、今回の値上げはコミュニティに波紋を広げている。 Plexは公式ブログで「生涯プランの発行をやめたかった。長期的な開発継続のために、定期サブスクリプションへの移行を推進したい」と説明している。現行の年額プランは約69.99ドル前後のため、750ドルの生涯パスで元を取るには約11年間の継続利用が必要になる計算だ。 The Vergeが指摘する「巧妙な価格戦略」 The VergeのシニアエディターであるSean Hollister氏は、今回の値上げを単純なコスト増ではなく、FOMO（取り残される恐怖）を利用したマーケティング施策として分析している。 Hollister氏の指摘によると、Plexが実際に750ドルを支払ってもらうことを期待しているわけではないという。むしろ「7月1日前なら現行の249.99ドルで購入できる」という期限付きオファーが、ユーザーの駆け込み購入を促す狙いがある。現行価格での購入は年額換算で約3.5年分の収益に相当するが、Plexにとっては即座のキャッシュインフローが得られる仕組みだ。 Plexの公式サイトとメール通知にも「2026年7月1日 UTC午前0時01分までに現行の249.99ドルで購入可能」という強調されたCTAが掲載されており、プレッシャーをかける設計になっている。 Plex Passで使える主な機能イントロ・エンドクレジットのスキップ自宅外からのリモートストリーミング（昨年から有料化）メディアのリモートダウンロード一時停止時の自動巻き戻しメディアサーバーアプリでのハードウェアアクセラレーション対応無料ユーザーでも、ローカルネットワーク上へのストリーミングやコレクション作成は引き続き利用可能。ただし自宅外からのリモート再生はPlex Pass必須となっており、この変更は昨年すでに実施されている。既存の生涯パス保有者への影響は今回はない。なお、Hollister氏はPlexの財務状況についても言及しており、同社は数年前に大規模なレイオフを経験した非公開の小規模企業であり、グローバルな広告市場の低迷も背景にあることを指摘している。日本市場での注目点 Plexは日本でも一定のファン層を持ち、NASや自作PCでホームメディアサーバーを運用しているユーザーを中心に利用されている。Plex.tvのウェブサイトからクレジットカードで直接購入可能なため、日本からの入手に大きな障壁はない。円換算（1ドル≒155円）での価格感は以下の通り。プランドル価格円換算（目安）月額 $7.99 約1,240円年額 $69.99 約10,850円生涯（現行・7/1まで） $249.99 約38,750円生涯（7/1以降） $749.99 約116,250円また、同様のメディアサーバー機能を持つオープンソースの「Jellyfin」がサブスクリプション不要の代替として近年急速に注目を集めている。Plexの有料機能拡大の流れを受けて移行するユーザーも増えており、選択肢として検討に値する。筆者の見解今回の値上げは、SaaS業界で加速する「生涯プラン終焉」の流れの典型例といえる。ビジネス的には定期収益への移行という合理的な判断であり、小規模企業が持続的な開発を続けるためのコスト確保という文脈では理解できる部分もある。ただ、違和感を覚えるのは「自分のコンテンツを自分のサーバーから配信する」というPlexの原点と、それに課金し続けるモデルの間にある矛盾だ。所有コンテンツの管理ツールに年々増えるランニングコストを払い続けることへの疑問は、コミュニティで長らく議論されてきた。実用的な観点での判断軸は明確だ。今後も長期的にPlexを使い続ける強い理由があるなら、7月1日前の249.99ドルでの購入を真剣に検討する価値はある。一方、「外部サービスへの依存をなるべく減らしたい」「無料で同等の機能を自分で管理したい」という方向性であれば、Jellyfinへの移行を今から試しておくのが現実的な選択肢になるだろう。世界規模で進むサブスクリプション疲れの中、自分のメディアライブラリをどう管理するかという問いは、今後ますます重要になってくる。出典: この記事は Plex is tripling the price of a lifetime pass to $750 after doubling it last year の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Wear OS 7発表：配送追跡・AIタスクを手首でリアルタイム確認、バッテリー最大10%向上

Google I/O 2026の発表ラッシュの中、The VergeのJay Peters記者がWear OS 7の詳細をレポートした。Googleのスマートウォッチプラットフォームの次期メジャーアップデートとなるWear OS 7は、日常的なタスク追跡から電池持ちの改善まで、実用面での進化が中心となる内容だ。「Live Updates」でリアルタイム情報を手首に Wear OS 7の目玉機能の一つが、Androidに昨年導入されたiPhoneスタイルの「Live Updates」のスマートウォッチへの拡張だ。The Vergeの報道によると、宅配便の配送状況やスポーツのスコアなどをリアルタイムで手首から確認できるようになるという。さらに注目すべきは、AIが実行中のタスクの進捗もウォッチ上で追跡できるという機能だ。「AIに任せた作業がどこまで進んでいるか」を常時チェックできる仕組みで、エージェント型AIの活用が進む現在のトレンドに沿った設計といえる。 Tiles から「Wear Widgets」へ刷新従来のグランス情報表示に使われてきたTilesが「Wear Widgets」として刷新される。The Vergeの伝える情報では、AndroidのSmall（2x1）・Large（2x2）ウィジェットフォーマットに「完全に対応」する設計で、スマートフォン側のウィジェットとデザインの一貫性が高まる。使い勝手の向上という点で地味ながら重要な改善だ。 Gemini Intelligence と電池持ち10%向上 Gemini Intelligence――Googleが「パーソナライズされたプロアクティブなGemini機能」のキャッチオール的ブランドと位置づける機能群――が「今年後半」に「一部のウォッチ」向けに導入予定とされている。ただし対応機種の具体的な情報はまだ明かされていない。電池持ちについては、Wear OS 6からのアップグレードで最大10%の改善をGoogleは約束している。「パワーオプティマイゼーション」への投資によるものとしているが、実際の改善幅は利用アプリや利用状況次第となるため、実機での検証結果を待ちたいところだ。日本市場での注目点日本ではPixel Watch 3が2024年に発売されており、Wear OS 7へのソフトウェアアップデートの対応可否が今後の焦点となる。Samsung Galaxy Watch 7などのWear OS搭載デバイスも対象に含まれる可能性が高く、ユーザーとしては既存端末でのアップデート対応を注視したい。 Gemini Intelligenceの日本語対応については現時点では不明だ。Android向けLive Updatesも昨年の日本対応は限定的だったため、宅配便追跡などの実用度が日本でどこまで発揮されるかはまだ不透明といわざるを得ない。国内での対応サービス拡充のスピードが、実用的な価値を左右するだろう。筆者の見解 Wear OS 7で最も興味深いのは、AIが実行中のタスクを手首でモニタリングできるという設計思想だ。AIエージェントが自律的にループし続ける運用スタイルが広まる中で、「任せたまま手首でチェック」というUXは方向性として正しいと思う。エージェント型AIの価値を日常動線に組み込むアプローチとして評価したい。ただし、Gemini Intelligenceの「select watches」「later this year」という表現は気になる。競合が具体的な機能・対応機種をきちんと示してくる中で、発表から実体験まで時間がかかる状況が続くのはもったいない。Googleには実力があるのだから、「いつ・どの端末で・何ができるか」をもっと早期に明確に示してほしい。電池持ち10%向上は地味だが、スマートウォッチにとっては本質的な改善だ。Apple Watchとのシェア争いが続く中、ソフトウェア品質と基礎体力を着実に積み上げているWear OS陣営の姿勢は歓迎できる。関連製品リンク Google Pixel Watch 3 41mm Polished Silver Aluminum Case/Porcelain Active Band (Wifi) ...

FBIが全米ナンバープレート監視ネットワーク構築へ——リアルタイム車両追跡、3,600万ドル規模の入札開始

米国の技術メディア Ars Technica が2026年5月19日に報じたところによると、米連邦捜査局（FBI）が全米規模のナンバープレート読み取りカメラ（LPR: License Plate Reader）ネットワークへのアクセス調達に向け、入札募集（RFP）を公開した。5月14日付の公告では、最大5年間・総額3,600万ドル規模の複数契約が予定されており、監視技術と市民のプライバシー権のせめぎ合いが改めて注目を集めている。なぜこの動きが注目されるのかナンバープレート読み取り技術自体は新しくない。問題は「全米規模・リアルタイム・FBI一元管理」という三要素が組み合わさることにある。これまでは地方警察レベルで個別導入されていたLPRシステムを、連邦レベルで統合・横断検索できるインフラとして整備しようとしている点が、今回のRFPの本質だ。要求仕様の詳細 Ars Technicaの報道によれば、FBIが求める要件は以下のとおりだ。全米75%以上のカバレッジ: 大陸本土に加え、ハワイ・アラスカ・プエルトリコ・グアム・米領ヴァージン諸島を含む6地域に分割して入札ニアリアルタイムでのデータ提供: 捜査対象車両を道路・高速道路上で継続追跡柔軟な検索機能: ナンバープレートの部分・完全一致、登録州、住所、スキャン位置、車両メーカー・モデルによる絞り込み検索ヒートマップ機能: カメラカバレッジを地図上に可視化し、カメラ密度を把握情報ソース開示: 赤信号カメラ、速度取締カメラ、レッカー業者など、情報元の区別が必要有力ベンダー：FlockとMotorolaが筆頭候補 404 Mediaの報道を引用する形でArs Technicaは、Flock Safety と Motorola Solutions が有力候補と指摘している。 Flockは全米1万2,000以上の公安機関・自治体と契約するALPR（自動ナンバープレート読み取り）の大手で、太陽光パネル付き独立型カメラで地方警察への普及率が高い。Motorola Solutionsは幹線道路や警察車両搭載型カメラを手がけ、インフラ規模での展開を得意とする。FBIは各地域に複数の落札者を認める方針で、両社が競合・補完する形で参入する可能性がある。懸念される問題点 Ars Technicaの報道では、ナンバープレート認識システムの誤認識による無実の人の誤逮捕事例が繰り返し発生していることも取り上げられている。また、404 Mediaの昨年の報道では地方警察がFlock LPRシステムをICE（移民・関税執行局）の非公式な代理ツールとして活用していた実態が明らかになっており、今回のFBI計画はこうした「裏口アクセス」を正式に組織化する動きとも読み取れる。日本市場での注目点日本には現時点で連邦規模の統合LPRネットワークは存在しないが、この動向は無関係ではない。技術的な親和性: 日本の高速道路にはNシステム（自動車ナンバー自動読み取り装置）がすでに整備されており、技術的構造は近い。今後の日本での整備議論の参考事例となりうる民間セクターへの影響: FlockやMotorola Solutionsの技術は海外展開も視野に入っており、日本の防犯カメラ市場（パナソニック・キヤノン・アクシスなどが競合）への波及効果を注視する価値があるデータ主権の観点: 同盟国間の捜査協力や情報共有の枠組みにこうしたシステムが発展するか否か、法執行・プライバシー法制の観点から継続ウォッチが必要筆者の見解法執行機関が「脅威評価と市民の安全のために必要」と説明するこの仕組みは、技術的合理性としては理解できる部分もある。しかしリアルタイムで全米の移動を追跡できるインフラを単一機関が保有することの意味を過小評価してはならない。重要なのは「禁止するか否か」という二項対立ではなく、利用目的の明文化・監査の透明性・データ保持期間の制限・誤認識時の救済手続きといったガバナンスの枠組みが整備されているかどうかだ。ツール自体の是非より、それを運用するルールの設計の方がはるかに重要という話は、あらゆる監視技術に共通する原則である。ナンバープレート認識の誤認識問題が解消されないまま全国規模での運用が始まれば、被害件数は単純に件数倍で増加する。技術の精度保証と誤謬への対処プロセスをどう組み込むか——そこが今回の調達で最も問われるべき論点だろう。出典: この記事は FBI seeks US-wide access to license plate cameras, wants “data in near real time” の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Firefox 151モバイル版にAI一括オフ機能——ワンタップで全AIを無効化できる「ガードレール」がiOS/Androidに登場

Mozillaは2026年5月19日、FirefoxのモバイルブラウザアップデートFirefox 151をiOSおよびAndroid向けにリリースした。このアップデートの目玉は、すべての生成AI機能を一括でオフにできる「AIガードレール」機能の実装だ。Engadgetのアンナ・ワシェンコ記者がこのニュースを取り上げたのは、奇しくもGoogleがI/O 2026でAI機能を次々と発表していた同日のこと。「AIを押しつける」業界トレンドに一石を投じる動きとして注目されている。 Firefox 151のAIコントロール機能とは Engadgetの報道によると、Firefox 151では以下のAIコントロールオプションが提供される。一括オフスイッチ：バイナリ形式のトグルで、すべての生成AI機能をワンタップでオフにできる個別設定：有効にしたいAI機能だけを選んでオン/オフする細かい制御対象のAI機能：翻訳、音声検索など、Mozillaが提供する複数のAI支援機能が対象なお、このAIコントロール機能はデスクトップ版に2026年2月にすでに実装されており、今回それがモバイルプラットフォームにも拡張された形だ。なぜこの製品が注目か Engadgetのワシェンコ記者は、「このような完全なオプトアウト機能はテック企業の間では珍しい」と指摘した。同日のGoogle I/OでAI機能を矢継ぎ早に発表したGoogleのアプローチと、ユーザーに「切る権限」を与えたMozillaのアプローチは対照的で、記事中ではGoogleへの皮肉も滲んでいる。非営利法人として運営されるMozillaは、商業的なインセンティブ構造が他社と根本的に異なる。AI機能を「売る」必要がないからこそ、「使いたくなければ切れる」という設計を堂々と採用できるという側面もある。 MozillaのAI戦略とProject Glasswing Engadgetはあわせて、MozillaがAnthropicのProject Glasswingに参画していることにも言及した。これはAIがサイバーセキュリティの問題と解決策の両面でどのような役割を果たすかを研究するプロジェクトであり、MozillaがAIを積極的に研究・活用していることも示している。AIを「オフにできる」機能を実装しながら、AIの可能性を探る研究にも参画する——この両面のアプローチがMozillaの立ち位置を端的に表している。日本市場での注目点 Firefox for Androidは日本でも一定のシェアを持つブラウザであり、今回の機能追加は日本ユーザーにも即座に恩恵をもたらす。入手方法：Google Play StoreおよびApp Storeから通常のアップデートで取得可能（Firefox 151以降）価格：無料競合との比較： Chrome（Google）：AI機能のオプトアウトは限定的で、Geminiとの統合が段階的に進んでいる Safari（Apple）：Apple Intelligence機能は一部オフにできるが、個別制御は複雑 Brave：プライバシー機能に強みがあり、AI機能は限定的プライバシー意識の高いユーザーや、AIツールの利用規定がまだ整備されていない法人環境では、「ブラウザのAI機能を確実にオフにできる」という選択肢は実務上の価値を持つ。筆者の見解「禁止か許可か」の二択しかない設計は、現場ではほぼ機能しない——これは筆者が長年IT現場で見てきた事実だ。大切なのは、ユーザーが自分の判断で適切な選択ができる状況を作ることだ。 Mozillaのアプローチは、まさにこの考えに沿っている。全部オフにもできるし、翻訳だけ使う選択も、全部使うことも自由だ。「AIを使わせるために不透明にする」のでも「AIを一律禁止にする」のでもなく、ユーザーが自分の意思で選べる状態を提供している点が評価できる。企業のIT担当者やセキュリティチームの視点では、「ブラウザのAI機能を管理ポリシーで制御できるかどうか」は今後のブラウザ選定における重要な評価軸になりつつある。この意味でFirefox 151が示した方向性は、エンタープライズ利用においても参考になるだろう。翻訳や音声検索のようなAI機能は日常業務を確実に加速させる。全部オフにする必要はないが、「切れる」という選択肢があることが、むしろAIへの信頼感を生むという逆説は興味深い。「押しつけずに、ユーザーが選べる状態を作ること」——ブラウザの話に留まらず、あらゆるAI製品設計が参考にすべき哲学だと感じる。出典: この記事は Firefox AI guardrails arrive for mobile の内容をもとに、筆者の見解を加えて独自に執筆したものです。

DiscordがすべてのビデオChat・音声通話にE2EEを自動適用完了——Metaと真逆の「プライバシー強化」路線を鮮明に

Engadgetは2026年5月19日、Discordが音声・ビデオ通話のすべてにエンドツーエンド暗号化（E2EE）を完全適用したと報じた。ステージチャンネルを除く全通話が対象であり、ユーザー側で設定を変更する必要はない。なぜこの取り組みが注目か E2EEとは、送信者と受信者だけが通信内容を復号できる仕組みだ。通信を中継するサーバー側でも内容を読み取ることができないため、通信の傍受や情報漏洩のリスクを根本から低減できる。 Discordはゲーマー向けコミュニティツールとして普及したが、現在は企業の社内コミュニティ、教育機関、開発者グループなど幅広い用途に拡大している。用途の多様化に伴い、プライバシー保護への要求水準も高まっており、今回の対応はその流れに応えるものだ。 Engadgetが報じた評価ポイント Engadgetのレポートによると、今回の完全適用はDiscordが「数年にわたって進めてきた取り組みの完了」と位置付けているものだ。良い点: 全音声・ビデオ通話（ステージチャンネルを除く）が対象オプトイン設定が不要——ユーザーが何もしなくても自動的にE2EEが適用されるプラットフォームとしての信頼性が一段と向上業界の文脈として見逃せない点: Engadgetはプライバシー保護への姿勢が各プラットフォームで二極化していることを指摘している。MetaはInstagram DMからE2EEを削除し、TikTokはDMでのE2EE提供を見送ると発表した。一方でAppleはRCSメッセージへの暗号化を実装した。Discordは「プライバシー強化」の側に立場を明確にした形だ。日本市場での注目点 Discordは日本でも多くのユーザーを持つプラットフォームであり、主に以下の用途で活用されている：ゲームコミュニティの音声通話・テキストチャット IT/開発者コミュニティのオープン・クローズドサーバー教育・学習グループの連絡・講義配信今回のE2EE完全適用により、機密性の高い議論や社内限定のやり取りを行う用途でも、心理的な安心感が増す。 Discordはフリーミアムモデルのサービスで日本でも無料で利用可能。プレミアムプラン「Discord Nitro」は月額950円〜（2026年5月時点）だが、E2EEは無料プランを含む全ユーザーに適用される点は覚えておきたい。筆者の見解「禁止するのではなく、安全に使える仕組みを整える」というのは、セキュリティ設計の要諦だと日頃から考えている。今回のDiscordの対応は、その考え方を体現している。オプトイン方式——つまり「知識のあるユーザーが自分で設定を有効にする」——では、最も保護が必要な一般ユーザーが恩恵を受けられないことが多い。デフォルトでE2EEが有効になる設計は、セキュリティを「一部のリテラシーある人だけの特権」にしない点で合理的かつ公平だ。一方、MetaがInstagram DMからE2EEを削除した動きは気になる。多くの一般ユーザーが日常的に使うプラットフォームがプライバシー保護を後退させることは、コミュニケーションインフラとしての責任感の観点から疑問が残る判断だ。企業や開発者が業務の一部でDiscordを使うケースも増えている。今回の強化は、「Discordで業務の会話をしていいものか」という心理的ハードルを実質的に下げるものであり、実用面での価値は小さくない。コミュニケーションツールを選ぶ際、セキュリティは利便性と同等以上に検討すべき要素だ。出典: この記事は Discord now has end-to-end encryption on all calls の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

Microsoft Copilot Personalを狙う新攻撃「Reprompt」——リンク1クリックで機密データが無音流出する仕組みと対策

セキュリティ企業Varonis Threat Labsは、Microsoft Copilot Personalを標的にした新たな攻撃手法「Reprompt」を詳細公開した。正規に見えるMicrosoftのリンクをクリックするだけで、Copilotが攻撃者のサーバーから指示を受け取り、被害者の機密データを自動的かつ段階的に外部へ送り出すという仕組みだ。Microsoftはすでにパッチを適用済みで、Microsoft 365 Copilot（エンタープライズ向け）は本攻撃の影響を受けないと明言している。 Repromptの仕組み——3つの技術の組み合わせ ① qパラメーター注入（P2P injection）多くのAIプラットフォームは、URLのqパラメーターにテキストを含めることでプロンプトを自動実行できる機能を持つ。copilot.microsoft.com/?q=Hello にアクセスすれば「Hello」という入力が自動的に送信されるイメージだ。Repromptはこの仕組みを悪用し、攻撃者は任意の指示をURLに埋め込んで被害者に踏ませる。ChatGPTやPerplexityでも同様の問題が過去に報告されており、AI系サービスで広く見られる挙動だ。 ② 二重リクエスト技術 Copilotには、初回リクエストで直接データを外部に漏えいさせる動作を防ぐガードレールが組み込まれている。しかしRepromptは「同じ操作を2回繰り返すよう指示する」という単純な方法でこの保護をすり抜ける。ガードレールが初回リクエストにしか適用されない設計上の隙を突いた手法だ。 ③ チェーンリクエスト技術最も巧妙なのがこの部分だ。最初の指示が実行されると、攻撃者のサーバーが前の応答内容に基づいて次の指示を動的に生成する。「今日アクセスしたファイルを要約して」→「そのファイルの中の個人情報を列挙して」→「連絡先を外部URLに送信して」という連鎖が、ユーザーが何もしないまま静かに進行する。クライアント側の監視ツールでは、初回プロンプトしか見えないため流出の全体像を把握できない。実務への影響今回の攻撃がエンタープライズ向けMicrosoft 365 Copilotに影響しない点は重要な事実だが、個人アカウントで業務データにアクセスしている社員がいる組織では対岸の火事ではない。「自宅PCからMicrosoftの個人アカウントで業務ファイルを開いている」という状況はよくある話だ。 IT管理者が取るべき実務上の対応は以下の通り：ブラウザとOSのアップデートを即時適用する（パッチはリリース済み）従業員への注意喚起：見慣れたMicrosoft.comのURLであっても、送られてきたリンクは慎重に扱う個人アカウントと業務アカウントの分離ポリシーを改めて徹底するゼロトラスト観点からの定期監査：Copilotのセッションログをどこまで取得・監視できるか確認する筆者の見解 Repromptが興味深いのは、プラグインやコネクターといった拡張機能を一切使わず、AIプラットフォームのデフォルト機能だけで完結している点だ。これは「外部連携を切ればAIは安全」という発想が根本的に誤っていることを示している。ゼロトラストの観点からすると、AIアシスタントに付与された「ユーザーのデータにアクセスできる権限」そのものが攻撃面になる。Just-In-Time（JIT）アクセスの考え方をAIエージェントにも適用し、必要なタイミングにのみ必要なスコープだけを与える設計が求められる。今後、Non-Human Identity（NHI）管理とAIエージェントの権限設計は不可分のテーマになるだろう。 Microsoftがパッチを迅速に対応した点は評価に値する。ただ、qパラメーターのような「便利な設計」が攻撃面になるケースはAI系サービス全般に共通する課題だ。Copilotには実力があるのだから、こういった脇の甘さを一つひとつ潰して、エンタープライズでも個人向けでも安心して使える環境を整えてほしい。応援している分だけ、期待値も高い。出典: この記事は Reprompt: The Single-Click Microsoft Copilot Attack that Silently Steals Your Personal Data の内容をもとに、筆者の見解を加えて独自に執筆したものです。

Windows

Microsoft 365 CopilotにCritical脆弱性3件——AIが集約する企業データが情報漏洩リスクの新たな標的に

Microsoft は2026年5月7日、Microsoft 365 CopilotおよびMicrosoft EdgeのCopilot Chatに影響するCritical評価の情報漏洩脆弱性を3件公開し、同日中にクラウド側での修正を完了した。エンドユーザーや管理者による追加対応は不要とされているが、Copilotに付与されたデータアクセス権限の設計を見直す契機として受け止めるべき事案だ。 3件の脆弱性——何が起きていたのか今回公開されたのはCVE-2026-26129、CVE-2026-26164、CVE-2026-33111の3件で、いずれも機密情報漏洩（Information Disclosure）を引き起こしうるインジェクション系の脆弱性だ。 CVE-2026-26129 はMicrosoft 365 CopilotのBusiness Chat機能が対象。ダウンストリームコンポーネントへの出力で特殊文字が適切に処理されない（CWEでいうインジェクション系）ことで、ネットワーク経由で機密情報が漏洩する可能性があった。 CVE-2026-26164 も同じくM365 Copilotを対象とし、CWE-74（インジェクション）に分類される。攻撃ベクターはネットワーク経由、特権不要・ユーザー操作不要という条件で、CVSS スコアは7.5（時間的スコア6.5）。機密性への影響は「高」と評価されている。Microsoftの社内研究者であるEstevam Arantesと独立研究者の0xSombraの連名で発見が報告された。 CVE-2026-33111 はMicrosoft Edgeに組み込まれたCopilot Chat機能に影響し、CWE-77（コマンドインジェクション）に分類される。CVSSスコアはCVE-2026-26164と同じく7.5/6.5で、攻撃プロファイルも同様。エンタープライズ環境でEdgeの展開が広がっていることを考えると、潜在的な影響範囲は無視できない。 Microsoftは「いずれも公開前の悪用は確認されていない」と明言しており、クラウド側のサービス層でパッチを適用済みだ。なぜAIツールが情報漏洩リスクの新たな標的になるのか今回の事案が単なるパッチ情報以上の意味を持つのは、Microsoft 365 Copilotというサービスの性質にある。 Copilotはユーザーの指示に応じてメール、ドキュメント、Teamsの会話、SharePointのファイルなど、組織内の膨大なデータを横断的に参照・要約する。つまり、単一エンドポイントへの攻撃が、従来のファイルサーバー侵害では得られなかった「横断的な情報収集」を可能にしてしまう構造になっている。インジェクション系の脆弱性がAIの出力パイプラインに潜むと、攻撃者はCopilotが生成したレスポンスの中に細工された要素を混入させ、信頼境界を越えて機密情報を引き出せる可能性がある。メールの内容、社内の機密文書、制限付き記録などが、正規ユーザーに成りすました形で漏洩しうる。日本の企業IT担当者がすべき対応「クラウド側で修正済みだから終わり」で済ませてほしくない事案だ。具体的に確認しておくべき点を挙げる。 1. Copilotのアクセス権限を最小化する Copilotは設定次第で組織内のほぼすべてのデータにアクセスできる。「使いやすさ」優先でデフォルトのまま運用している場合、脆弱性が悪用されたときの影響範囲が最大化してしまう。SharePointの権限設計、センシティブなラベル付きコンテンツへのCopilotアクセス制御を今すぐ確認すること。 2. Microsoft Purview との連携を確認する Microsoft Purviewの機密ラベル（Sensitivity Labels）を正しく設定していれば、CopilotはラベルベースのDLP（データ損失防止）ポリシーに従って動作する。ラベル付けが不完全な環境では、攻撃面は広いままだ。 3. Edge の Copilot Chat の利用範囲を把握する CVE-2026-33111はEdge組み込みのCopilot Chatに関するものだ。エンタープライズ向けにEdgeを標準ブラウザとして展開している組織では、Copilot Chatの機能制限ポリシー（EnterpriseNewTabPageHideDefaultTopSites や Copilot 関連のグループポリシー）を整備しておくことを勧める。 4. 今後の同種脆弱性に備えた監視体制を構築する MicrosoftはクラウドCVEの透明性イニシアティブとしてこれらを公開している。同様の開示が今後も続く可能性が高い。Microsoft Security Response Center（MSRC）のフィードを定期的に監視し、Copilot関連の更新情報をキャッチアップする運用フローを確立しておこう。筆者の見解 Microsoftが今回の脆弱性を「クラウドCVE透明性プログラム」として積極的に開示したこと自体は、正しいアプローチだと思う。悪用の事実なし、ユーザー対応不要、公開と修正を同日実施——この対応のスピードと透明性は評価に値する。ただ、根本的な問いは別にある。「AIが組織データを横断的に集約・処理する」というアーキテクチャそのものが、インジェクション系脆弱性と組み合わさったとき、従来のエンドポイント侵害では得られなかったレベルの情報収集を攻撃者に提供してしまう——この構造的リスクに、われわれは真剣に向き合う必要がある。 Copilotにブロードなアクセス権を付与して「AIがなんでも答えてくれる」状態を作るのは、セキュリティの観点ではJust-In-Timeとは真逆の設計だ。「常時アクセス可能」が特権アカウント管理における最大リスクであるのと同じ原則が、AIエージェントにも適用される。Non-Human Identityとしての Copilot にどこまでアクセスを許可するか——この問いを真剣に設計フェーズで議論していた組織は、今回の件でもリスクを最小化できていたはずだ。 Microsoftには、Copilotの権限モデルと最小権限設計を、もっとわかりやすく・導入しやすい形でユーザーに提供してほしい。技術的には実現できる力がある会社なのだから、セキュリティを後付けではなくアーキテクチャの中心に置いた設計を見せてくれると、Copilot全体への信頼回復にも繋がるはずだ。出典: この記事は Critical Microsoft 365 Copilot Vulnerabilities Expose Sensitive Information の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

Azure

Azure DevOpsのGitHub連携リポジトリ上限が4倍の2,000件に拡大、REST APIによる自動管理も実現

MicrosoftのAzure DevOpsチームは2026年2月、GitHubリポジトリをAzure DevOpsプロジェクトに接続できる上限を従来の500件から2,000件へと4倍に拡張した。同時に、接続管理を自動化するREST APIエンドポイントも新たに追加され、大規模組織でのGitHub連携管理が大幅に改善された。なぜ500件では足りなかったのか Azure DevOpsとGitHubの連携は、Azure Boardsのワークアイテムとプルリクエストを紐づけたり、Azure Pipelinesのトリガーにしたりと、多くの組織で基幹的なDevOpsワークフローの一部になっている。しかし、従来の500リポジトリという制限は、マイクロサービスを積極的に採用している組織や、複数のプロダクトラインを持つ大規模開発チームにとって現実的な壁となっていた。1サービス1リポジトリの構成で100以上のマイクロサービスを複数チームで管理すると、あっという間に500件の壁に近づく。GitHub Organizationsを複数に分けるなどの回避策を強いられていた組織も少なくない。今回の2,000件への引き上げにより、こうした大規模環境での連携管理が現実的なものになった。 REST APIで「人手なし」の自動管理が可能に上限拡張と同時に追加されたREST APIは、より本質的な改善といえる。従来はAzure DevOpsのプロジェクト設定画面から手動でリポジトリを追加・削除する必要があった。新しいAPIエンドポイントを使えば、TerraformやBicep、あるいは自社製のプロビジョニングスクリプトから自動的に接続を管理できる。実際のユースケースとしては以下が考えられる：新規マイクロサービス作成時の自動接続: CI/CDパイプラインの一部としてGitHubリポジトリ作成と同時にAzure DevOps連携を設定 IaCによるDevOps環境の再現性確保: 開発・ステージング・本番の各プロジェクトに対して、同一のリポジトリセットを宣言的に管理オフボーディング自動化: プロジェクト終了時にリポジトリの接続を自動的に解除し、不要なアクセス権を残さない同時期の関連アップデート今回のリポジトリ上限拡張は、2026年2月〜5月にかけて連続的に投入されたAzure DevOpsの一連の強化策と連動している。リリース機能意義 2026年5月 Git objectカウント制限の撤廃大規模モノレポ対応 2026年4月組み込みコード検索（拡張機能不要）環境依存の解消 2026年3月 Remote MCPサーバーのパブリックプレビュー AIエージェントとのDevOps連携 2026年2月 GitHubリポジトリ上限2,000件＋REST API 本記事の対象 Remote MCPサーバーのプレビューが同時期に始まっている点は注目に値する。Azure DevOpsをAIエージェントの操作対象として扱えるインフラが整いつつあることを示している。日本の現場への影響日本のエンタープライズIT部門では、GitHub EnterpriseとAzure DevOpsを「両方使っている」環境が一定数存在する。コード管理はGitHub、プロジェクト管理（Boards）やパイプラインはAzure DevOpsという分業体制だ。この構成を採用している組織では、今回の制限緩和と自動化APIの恩恵を直接受けられる。特に、年度替わりの大規模プロジェクト立ち上げや、SIer各社が顧客ごとに複数の開発リポジトリを管理するシナリオで効果が大きい。明日から試せること：現在の接続リポジトリ数を確認（プロジェクト設定 → GitHub connections）新REST APIのドキュメントを確認し、既存のプロビジョニングフローに組み込めるか検討 Terraform Azure DevOps Providerの対応状況を確認筆者の見解 2,000件という数字は単なる上限緩和ではなく、「エンタープライズ規模での本格運用」を明示的に意識した判断だ。GitHubとAzure DevOpsという2つの強力なプラットフォームを擁するMicrosoftならではの、統合投資の成果が見え始めている。 ...

画面なしのAIデバイス誕生へ——OpenAIとジョニー・アイヴが挑む「次世代AIコンピュータ」の全貌

米テックメディア Built In が2026年5月6日に報じたところによると、OpenAIは元Appleチーフデザインオフィサーのジョニー・アイヴ（Jony Ive）が率いる「io」スタジオと共同で、まったく新しいカテゴリのAIデバイスを開発中だ。画面を持たず、ポケットに収まるサイズで、音声とカメラ・マイクによるコンテキスト認識を特徴とするこのデバイスは、2026年後半の登場が見込まれている。 OpenAIが目指す「次世代AIコンピュータ」とは Built Inの報道によれば、OpenAI CEOのサム・アルトマンはこのデバイスを「新世代のAI搭載コンピュータ」と表現した。スマートフォンでもスマートウォッチでもなく、まったく新しいカテゴリを作ろうとしているのが大きなポイントだ。現時点で確認されているスペック・特徴は次のとおり：フォームファクター: ポケットサイズ・画面なし主要インターフェース: 音声センサー: 内蔵カメラ・マイクによる周囲のコンテキスト認識連携: スマートフォン・PCなど既存デバイスとの統合搭載AI: OpenAIの最新AIモデル形状についてはまだ明確ではなく、Built Inによれば「ひもに付けたiPod Shuffle風」「イヤバッド」「ペン」といった憶測もあるが、いずれも未確認だ。同メディアはOpenAIが音声モデルの大幅刷新に向けてエンジニアリング・プロダクト・研究チームを一本化したとも伝えており、音声インターフェースへの本格注力姿勢が伺える。「デバイスファミリー」の全体像 Built Inがさらに詳しく報じているのが、デバイス単体ではなく「ファミリー」としての開発計画だ。The Informationの情報源によると、OpenAIは200名超のエンジニアを擁するハードウェアチームで複数の製品を並行開発している。製品特徴予想時期主力AIデバイス（画面なし）音声・コンテキスト認識 2026年後半スマートスピーカーカメラ内蔵・物体認識・顔認証決済 2027年以降スマートグラス詳細未発表 2028年以降スマートランププロトタイプ開発中未定スマートスピーカーには内蔵カメラによる物体識別機能に加え、Apple Face IDに類似した顔認証による安全な決済機能も検討されているという。なぜこのデバイスが注目を集めるか注目すべきは、ハードウェアよりもインタラクションパラダイムの転換にある。「画面を見ない」という設計思想は、スマートフォン中心の現在のデジタル生活を根本から問い直すものだ。ジョニー・アイヴがAppleでiPod・iPhone・MacBookを生み出したデザイン哲学を、AI時代の新デバイスにどう落とし込むかも大きな見どころとなっている。日本市場での注目点現時点では日本での発売スケジュールや価格帯は一切発表されていない。2026年後半という時期は、まず米国を中心とした展開になると見ておくのが妥当だろう。競合として意識すべき前例として、「画面なし・音声AI」カテゴリに挑戦したHumane AI Pin（米国で約700ドル、すでにサービス終了）やRabbit r1（約200ドル）がある。いずれも機能面で期待を下回ったと評価されており、OpenAI＋Jony Iveコンビがこの教訓をどう活かすかが鍵になる。日本市場では、シニア層や「スマートフォンの操作が苦手な層」への訴求が考えられる一方、プライバシー意識の高い日本のユーザーに対してカメラ・マイク常時起動型デバイスがどう受け入れられるかは未知数だ。筆者の見解 AI時代のデバイスをどう設計するかという問いに対して、OpenAIが「画面を捨てる」という大胆な答えを出してきたことは注目に値する。ただ、AIデバイスの成否を分けるのは、デザインよりAIエージェントとしての自律性だと筆者は見ている。ユーザーが毎回指示を出すたびに確認を求めるような設計では、どんなに洗練されたハードウェアでも日常的に使い続けることは難しい。「目的を伝えればあとは任せられる」という体験が設計の核心に据えられているかどうかが、このデバイスの実力を決めるはずだ。 200名を超えるエンジニア体制で複数製品を並行開発するOpenAIのリソース投入は本気度の現れだ。Humane AI PinやRabbit r1が切り拓こうとして果たせなかった「ポスト・スマートフォン時代のAIデバイス」という市場を、今度こそ具現化できるか。2026年後半の登場を注視したい。出典: この記事は OpenAI’s New Device: What We Know So Far の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

Google検索、約30年ぶりの大刷新——自律AIエージェントが24時間監視、リアルタイムUI生成も

Google I/O 2026において、Googleが主力プロダクト「Google Search」に対し「約30年で最大の刷新」と称する大規模アップデートを発表した。Tom’s GuideのSanuj Bhatia氏が詳細をレポートしており、AIエージェント、マルチモーダル入力、リアルタイムUI生成、カスタムミニアプリ作成など、検索体験そのものを根本から変える機能群が一挙に投入される。 SearchがAIプラットフォームへと変貌 Googleの直近の決算では、Google Searchのクエリ数が過去最高を記録し、事業の19%成長を牽引したと報告されている。今回の発表はその主力プロダクトをさらに大きく進化させるものだ。昨年のGoogle I/OでAI Modeが導入されたことに続き、今年はその一段上を行く機能群が公開された。 Tom’s Guideの報道では「単なる検索ボックスのリデザインをはるかに超えている」と評されており、会話型・マルチモーダル・プロアクティブという三つの軸で検索体験が大きく再定義される。主な新機能マルチモーダル入力の全面展開テキストに限らず、画像・動画・ファイル、さらにはChromeのタブまでを組み合わせた複合的なクエリに対応する。クエリの複雑さに応じてインターフェース自体がダイナミックに展開し、AIによる提案をリアルタイムで表示するという。自律AIエージェントによる24時間監視今回の目玉機能の一つが「Search agents（検索エージェント）」だ。ユーザーが設定した条件に基づき、AIエージェントが24時間バックグラウンドで情報を監視し続け、変化があれば自動通知する仕組みだ。 Tom’s Guideの報道によれば、利用例として「特定の条件を満たす株価の動き」や「こだわり条件の賃貸物件の新着情報」などが紹介されている。GoogleがFlight検索で提供してきた価格追跡機能を「ほぼあらゆる繰り返し検索に拡張したイメージ」と説明されており、情報収集の自動化という観点で注目度が高い。この機能は今夏、まず米国の「Google AI Pro」「Google AI Ultra」サブスクライバー向けに先行リリースされる予定だ。リアルタイムUI生成（Agentic Coding in Search）「Agentic Coding in Search」では、Gemini 3.5 FlashとGoogleの「Antigravity」システムを活用し、検索クエリに応じてカスタムの可視化・シミュレーション・ウィジェットをその場で生成する。天体物理学に関する検索を行うと、通常の検索結果に加えてインタラクティブな可視化が生成され、フォローアップ質問に応じて動的に更新されるという例が示されている。この機能は今夏、全Googleユーザーへの展開が予定されている。カスタムミニアプリ・ダッシュボードの作成さらに、ユーザーが自分専用の「ミニアプリ」や「ダッシュボード」を検索体験の中で構築できる機能も追加される。天気・地図・食事プラン・レビュー・カレンダーなどを組み合わせたフィットネスダッシュボードや、結婚式準備・引越し管理といった長期プロジェクト支援ツールの例が紹介された。日本市場での注目点今回発表された機能の多くは今夏の米国先行リリースとなっており、日本への展開時期は現時点では明言されていない。Search agentsはGoogle AI ProおよびUltraのサブスクリプション（有料）が前提となる見通しで、日本での提供形態についても今後の情報を待つ必要がある。 ChatGPT SearchやPerplexity AIなど、検索体験を変えようとする競合サービスが日本でも存在感を増している中、Googleは今回の刷新によって、Searchを単なる「検索エンジン」から「情報管理エージェントプラットフォーム」へと再定義しようとする意志を明確に示した。筆者の見解今回の刷新で最も注目すべきは、Search agentsの「自律的なバックグラウンド動作」という設計思想だと思う。ユーザーが都度確認や操作をしなくても、設定した条件に基づいてAIが継続的に動き続けるアーキテクチャは、AIの本質的な価値——認知負荷の削減——を体現している。「目的を伝えたら自律的に動き続ける」設計こそが、AIエージェントの正しい方向性であり、その観点からGoogleの今回のアプローチは筋がいいと評価する。ただし、ミニアプリ生成や汎用ダッシュボード構築については、実用性の評価はまだこれからだ。発表のインパクトは大きいが、筆者は常に「情報を追うよりも実際に使って成果を出す」スタンスを大切にしている。派手な機能が実際の生産性向上につながるかどうかは、リリース後の使いこなし次第だ。 Search agentsの日本展開が実現した際には、繰り返し検索していた情報を本当に自動化できるかどうか、実際に試してみたいと思う。出典: この記事は Google Search just got the biggest makeover in nearly 30 years — here’s the upgrades の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

AIが代わりに買い物する時代へ——Google I/O 2026で発表された「Universal Cart」の全貌

Google I/O 2026にて、GoogleはAIショッピング機能「Universal Cart（ユニバーサルカート）」を発表した。Tom’s GuideのOlivia Halevy氏が詳細を報じており、AIが単なる検索結果の表示を超え、価格監視・在庫通知・さらには購入代行まで実行する「エージェント型コマース（agentic commerce）」への転換を宣言するものとなっている。なぜ「Universal Cart」が注目されるのか従来のオンラインショッピングでは、ユーザーは複数のECサイトを巡回し、カートを別々に管理する必要があった。Universal Cartはこの課題に正面から挑む。GoogleのSearch・Gemini・YouTube・Gmailといった主要アプリを横断して単一のカートを共有し、ブラウジング中・動画視聴中・メール返信中でも商品を追加できる設計だ。 Googleが掲げる「エージェント型コマース」というビジョンは、AIが単なる情報提供にとどまらず、ユーザーの代理として能動的に行動するというパラダイムシフトを意味する。「まるで個人専属のショッピングアシスタントがついているように」とGoogleは表現している。海外レビューのポイント Tom’s GuideのOlivia Halevy氏のレポートによると、Universal Cartの主要機能は以下の通りだ。カートに入れた瞬間から自動的に動き出す価格監視: 登録商品の価格変動を常時トラッキング割引・セール通知: ディスカウント適用時にアラート在庫復活通知: 品切れ商品が再入荷したタイミングで通知より安い代替案の提示: Gemini AIが類似・競合商品を提案自作PCパーツの互換性チェック——実用シナリオが示す本気度 Googleが具体例として挙げたのが、自作PCユーザーのシナリオだ。複数ショップでパーツをカートに入れると、AIが部品間の互換性を確認し、問題があれば購入前に警告・代替提案を行う。これは価格比較にとどまらない、専門的なアドバイザーとしてのAI活用を示している。チェックアウトの統一：Universal Commerce Protocol（UCP） GoogleはUCPも拡張する。Google Payでの一括決済、または各ショップサイトへの転送による購入の両方に対応。Nike・Sephora・Target・Walmart・Wayfair・Shopify加盟店（Fenty、Steve Maddenなど）での利用が今夏より順次開始予定だ。 AIに購入を委任する「Agent Payments Protocol（AP2）」最も踏み込んだ機能がAP2だ。AIエージェントがユーザーの代わりに購入まで実行する仕組みで、支出上限額・購入可能商品の事前設定といった安全装置を備える。「完全放任」ではなく、ユーザーが定めたルールの範囲内で自律的に動く設計となっている。日本市場での注目点現時点ではUniversal CartのローンチはSearch・Geminiアプリを通じて米国にて2026年夏を予定しており、日本での提供時期は未発表だ。日本のEコマース市場はAmazon.co.jpや楽天市場が圧倒的なシェアを持ち、Googleショッピングの存在感は相対的に低い。Universal Cartが日本に展開される際には、国内主要ECとのUCP連携がどこまで進むかが普及の鍵になる。一方、価格比較・在庫監視ニーズは日本でも高く、kakaku.comやAmazonウィッシュリストの代替として使われる可能性は十分ある。競合としてはAmazonのAIショッピング機能が挙げられるが、Google検索・YouTube・GmailというWeb行動の主要動線を一気通貫で繋ぐ点はAmazon単体では実現できない強みだ。筆者の見解今回のUniversal Cart発表は、AIエージェントが「確認・承認を人間に求め続ける」副操縦士モデルから脱却し、自律的に行動する本来のエージェントとしてEコマースに参入した出来事として捉えている。複数サイトを巡回して価格を手動チェックし、在庫状況を記憶し、互換性を調べる——こうした作業は本来人間が時間をかけるべきではない。AP2による「AIへの購入委任」はスペンディングキャップという制約付きながら、エージェントが目的に向かって自律的に動く設計として筋がいい。日本の法人・EC事業者にとっては、UCPへの早期対応が重要な戦略課題になり得る。Googleのエコシステムに乗ったとき「AIに推薦される側」に回れるかどうかは、今後の競争優位に直結するはずだ。この流れは日本でも無視できない。出典: この記事は Google’s new ‘Universal Cart’ can monitor prices, suggest products and even buy items for you — here’s how it works の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

「Ask YouTube」でGoogle動画検索が刷新——会話型AIが「見たい瞬間」に直接ジャンプ

2026年5月19日（現地時間）、GoogleはGoogle I/O 2026にてYouTubeの動画検索を刷新する新機能「Ask YouTube」を発表した。米テックメディア「Tom’s Guide」のScott Younker記者が速報している。なぜ「Ask YouTube」が注目されるのか現行のYouTube検索はキーワードマッチング中心の設計で、「就寝前にのんびり楽しめるコージーゲームのレビュー」「子どもへの自転車の教え方のコツ」といった複合的・文脈依存的なクエリへの対応は苦手だった。Ask YouTubeはこの課題に正面から取り組む機能だ。 Sundar Pichai CEOは同機能を「動画発見体験を完全に再設計した」と表現。AIが自然言語の質問を解釈し、ロングフォーム動画とShortsの両方から横断的に最適なコンテンツを検索する。Googleの「AIオーバービュー」と同様に「インタラクティブで構造化された」結果を表示し、ユーザーが求めている動画の該当箇所に直接ジャンプさせる点が最大の特徴だ。海外レビューのポイント Tom’s Guideの記者Marcus Cooper氏は率直な評価を寄せている。「表面上はユーザーに便利かもしれないが、アルゴリズムよりも多様なクリエイターを発掘できるかどうかは未知数だ。すべてをAIにする必要があるのか」と懐疑的な見方を示した。 Creator側への影響も指摘されている。現在のYouTubeクリエイターはアルゴリズムとの「いたちごっこ」を常に強いられているが、Ask YouTubeが新たな露出機会をもたらすのか、それとも別の壁が生まれるのかは今後の焦点となる。 Gemini OmniがShortsとYouTube Createにも統合同時発表されたのがGemini OmniのShorts RemixおよびYouTube Createへの統合だ。RemixはShorts動画にAIプロンプトや画像を組み合わせて新たな映像を生成する機能で、Gemini Omniの統合によりユーザーの意図をより正確に解釈し、複雑な映像・音声編集を一貫したストーリーテリングで実現するという。 Omniで作成したRemixed Shortsにはデジタル透かしと識別メタデータが自動付与され、元動画へのリンクも自動生成される。クリエイターにはオプトアウトの選択肢も提供される。Shorts RemixおよびYouTube Createでの利用は2026年5月19日より無料で提供開始となった。日本市場での注目点 Ask YouTubeは現時点で米国のYouTube Premiumサブスクライバー（18歳以上）限定で提供開始されており、グローバル展開のタイムラインはGoogleから明示されていない。日本でも動画検索への不満は根強く、YouTube Premiumは日本でも月額1,280円（個人プラン）で利用可能なため、地域制限が解除されれば早期アクセスできる可能性はある。ただし日本語の自然言語処理精度や国内コンテンツへの対応がどこまで最適化されるかが、日本ユーザーにとっての最大の関心事になるだろう。 Shorts RemixのGemini Omni統合は地域制限の記述がなく、日本のYouTube Createユーザーも比較的早期に恩恵を受けられる可能性がある。筆者の見解 Ask YouTubeが興味深いのは、「検索」という行為をキーワード入力からコンテキスト対話に引き上げようとしている点だ。「コージーゲームのレビュー」というキーワードは従来の検索でも機能するが、「寝る前に1時間のんびり楽しめる、日本語対応のゲームのレビュー動画、実況ではなくレビュー形式で」という問いかけは、これまでの検索では歯が立たなかった。 AIが「ユーザーの意図の文脈を保持したまま答えを返す」という方向性は、認知負荷を本当の意味で削減する設計として筋がいい。単発キーワードを打ち直させ続けるのではなく、真の目的まで掘り下げて答えるアプローチは、AIが実際に役立つ場面の典型だと思う。ただしMarcus Cooperの指摘する「クリエイター多様性の問題」は見過ごせない。AIが推薦する動画がより均質化・偏向する可能性は否定できず、ここはGoogleの設計哲学にかかっている。透かしとメタデータの自動付与、クリエイターのオプトアウト尊重は誠実な設計だと感じる。日本展開の時期と、日本語コンテンツへの対応精度——この2点がAsk YouTubeの日本での成否を分ける鍵になるだろう。出典: この記事は Ask YouTube ’entirely reimagines’ how you find videos — here’s how it works の内容をもとに、筆者の見解を加えて独自に執筆したものです。

GoogleがGemini 3.5 FlashとGemini Sparkを発表——チャットボット時代を超え、常時稼働AIエージェント時代へ

GoogleがAI戦略の大転換を図っている。2026年5月19日、Tom’s Guideが報じたところによると、Googleは新モデル「Gemini 3.5 Flash」と、常時稼働型AIエージェント「Gemini Spark」を同時発表した。単なるモデル性能の向上にとどまらず、「チャットボットから自律エージェントへ」という明確なパラダイムシフトを宣言した点が業界的に大きな注目を集めている。なぜこの発表が注目か Gemini 3.5 Flashが目指すのは、複数ステップにわたるワークフローの自律実行、ソフトウェアプロジェクトの維持管理、ドキュメント作成、複数の「サブエージェント」の協調制御など、人間の介入を最小化した自律的なタスク遂行だ。Googleはこれを「frontier intelligence with action（実行を伴う最前線の知性）」と表現しており、会話生成から実世界への作用へという設計哲学の転換を明示した形となっている。海外レビューのポイント Tom’s GuideのAmanda Caswellの報道によると、Gemini 3.5 FlashはGemini 3.1 Proを複数の重要ベンチマークで上回ると発表されている。評価されている点: ベンチマーク性能: Terminal-Bench 2.1およびMCP Atlasにおいて、コーディング・エージェント系タスクでGemini 3.1 Proを凌駕応答レイテンシの大幅削減: AIエージェント実用化の障壁となっていた「遅さ」を大幅に改善推論性能と応答速度の両立: 従来の「高性能だが遅い」か「速いが能力が浅い」というトレードオフを解消すると主張留意すべき点: Tom’s Guideは「OpenAI、Anthropic、Metaのツールもすでに高度なワークフローを実行できる」と指摘しており、競合各社のエージェント機能もすでに成熟しつつある。Googleがどこまで実質的な差別化を実現できるかは、実際の展開後の評価を待つ必要がある。 Gemini Spark——AIが「見えない運用レイヤー」になる日今回の発表でより大きな注目を集めているのが「Gemini Spark」だ。Tom’s Guideによると、Sparkは常時バックグラウンドで稼働し、ユーザーの監督下でタスクを実行する持続型エージェント。スケジュール管理、ドキュメント整理、反復作業の自動化、アプリ間の調整など、デジタルライフの「ambient intelligence（環境知性）」としての機能を目指す。展開スケジュールとしては、まず信頼されたテスターに先行アクセスを提供し、翌週には米国のGoogle AI Ultraサブスクライバーへ段階的に公開される予定とのこと。安全性については、GoogleのFrontier Safety Frameworkのもとで開発され、サイバーおよびCBRN（化学・生物・放射線・核）リスクへの対策を強化しつつ、安全なプロンプトに対する不必要な拒否を最小化するバランスを追求しているという。日本市場での注目点現時点でGemini Sparkの展開は米国のGoogle AI Ultraサブスクライバー向けが最初のターゲットとなっており、日本での提供時期は未発表。Gemini 3.5 Flashについては、Google AI StudioやGemini APIを通じた開発者向けの利用が比較的早い段階で可能になると見られる。 APIコストや日本語性能については別途評価が必要だが、GmailやGoogleカレンダー、Google Driveなど日本でも広く使われるGoogleサービスとの連携がどこまで実現するかが、エージェント機能の実用性を左右する重要なポイントになるだろう。筆者の見解「チャットボットから自律エージェントへ」という方向性は、ここ1〜2年で筆者が繰り返し注目してきたテーマと一致する。AIが指示を受けて応答するだけでなく、目的を渡せば自律的に判断・実行・検証を繰り返す「ハーネスループ」型のアーキテクチャこそ、AIが本当の意味で業務を変えるための必要条件だ。Gemini 3.5 FlashとGemini Sparkが目指している世界観は、その正しい方向を向いている。 Googleが持つ強みは、検索・Gmail・カレンダー・Driveなど、すでに生活に深く組み込まれたサービス群にある。エージェントがこれらを横断的に操作できるなら、他社にはないリアルワールドへの接点となりうる。絵として非常に魅力的だ。ただし、エージェントAIはデモが良くても実運用で力を発揮できないケースが多い。「推論性能と応答速度の両立」「最小限の人間介入でのタスク完遂」が本当に実現されているかは、Gemini Sparkの実際の展開後にユーザーからのフィードバックが出てから判断したい。Googleには自社の膨大なサービス基盤を活かし、エージェントAI競争で実質的な成果を示してほしいところだ。出典: この記事は Google just launched Gemini 3.5 Flash — here’s all the upgrades の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

声だけで動画を生成・編集できる「Gemini Omni Flash」——Googleが発表したマルチモーダルAIの実力

米テクノロジーメディアTom’s GuideのElton Jones氏が2026年5月19日に報じたところによると、Googleは音声・テキスト・画像・動画など多様な入力に対応した新しいマルチモーダルAI動画生成モデル「Gemini Omni Flash」を発表した。Googleがすでに展開しているAI画像生成サービス「Nano Banana」に続く、映像生成領域への本格参入として注目を集めている。 Gemini Omni Flashとは何か Gemini Omni Flashは、音声・テキスト・画像・既存動画のいずれからでも動画を生成・編集できるマルチモーダルAIモデルだ。主な機能は以下の通り。マルチモーダル入力対応: 声で描写するだけでなく、キャラクター画像や手描きのスケッチを参照画像として渡し、スタイルや動きを指定できる物理法則の内部モデル: 重力・運動エネルギー・流体力学の知識を組み込んでおり、より自然でリアルなシーン生成を実現会話型逐次編集: 生成した動画に対して「このキャラクターを変えて」「背景を夜に」といった音声指示を重ねて編集できるアバター機能: 自分の声で話すデジタルアバターを生成し、ナレーション動画の作成に活用できる Googleは本モデルをGeminiアプリ、Google Flow、そしてYouTube Shortsへ順次展開していく方針を示している。 Tom’s Guideが注目した評価ポイント Tom’s GuideのElton Jones氏は本モデルを「これまで見てきたAI動画生成ツールの中でも最もパワフルなものの一つ」と表現している。特に評価されている点：音声による直感的な操作体験。キーボード操作やタイムラインの手動編集を必要とせず、会話だけで複雑な編集が完結するキャラクターや動物の追加・削除、視覚スタイルの変更、特定シーンの置き換えなど、編集の自由度が高い Geminiの言語・画像理解を活かした「解説動画」の自動生成にも対応留意すべき点：今回の記事はGoogleの発表情報をベースにした内容であり、独立した実機レビューはまだ実施されていない。実際の出力品質については続報を待つ必要がある日本市場での注目点日本向けの正式提供スケジュールは現時点で未公表だが、Geminiアプリ経由での提供であれば、他地域と大きく時差なく展開されることが見込まれる。価格帯については未発表だが、Gemini Advancedプランへの組み込み、あるいは段階的な上位プラン展開が予想される。日本のYouTuberやショート動画クリエイターにとって特に注目すべきはYouTube Shortsとの連携だ。スマートフォンで撮影した動画をそのままGeminiに渡し、日本語の音声指示だけで編集が完結するようになれば、ショート動画制作のフローは大きく変わる可能性がある。競合として挙げられるのはOpenAIのSora、RunwayやLuma Labsの各ツールだが、すでにYouTubeというプラットフォームを持つGoogleは配布チャネルの面で圧倒的な強みを持つ。「ツール単体の性能」ではなく「エコシステム全体の最適化」という観点で見ると、他社とは土俵が異なる。筆者の見解 Googleの画像・映像生成における技術力はもともと業界最高水準にある。Gemini Omni Flashが謳う「物理法則の理解に基づくリアルなシーン生成」は技術的に非常に筋のいいアプローチだ。映像の物理的整合性は既存モデルの弱点でもあるため、そこを正面から取り組んでいる点は評価できる。一方で、今回は発表内容が先行しており、実際の出力品質については独立した評価がまだない。動画生成AIの品質は実際に使い込んでみなければわからない部分が大きく、Tom’s Guideの記事もGoogleの発表ベースの紹介にとどまっている点は念頭に置くべきだろう。戦略として合理的なのはYouTube Shortsとの統合だ。世界最大の動画プラットフォームにAI動画生成を直接組み込むのは、Googleが持つ数少ない「他社にはできない」構造的優位のひとつ。AIツールはいかに優秀でも、使われなければ意味がない。配布経路の強さはそれ自体が強力な差別化要因になる。音声で動画を操作するインターフェースは、AIが人間の認知負荷を削減するという方向性として正しい。あとは実際のリリース品質と日本語対応の精度がどこまで伴うか——続報に注目したい。出典: この記事は Gemini Omni Flash can create and edit videos with your voice and it feels like the future of multimodal AI の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

AppleがAI活用の新アクセシビリティ機能群を発表——VoiceOver強化・字幕自動生成・Vision Proで車椅子制御まで

Tom’s GuideのScott Younker記者が2026年5月19日に報じたところによると、Appleは「Apple Intelligence」を活用した一連の新アクセシビリティ機能を発表した。VoiceOver・Voice Control・Magnifierの強化に加え、動画への字幕自動生成や、Apple Vision Proを使った電動車椅子制御という革新的な取り組みも含まれる。すべての機能は「今年後半に提供予定」とされており、具体的な提供日は明示されていない。なぜこの発表が注目されるのかアクセシビリティ機能はこれまで「あれば便利」という位置づけになりがちだったが、Apple Intelligenceの組み込みによって質的な変化が起きている。AIが画像を詳細に説明し、自然言語で機器を操作し、未キャプション動画にも自動字幕を付与する——これは従来の「補助機能」の範疇を超え、日常的なUI体験そのものを変えうる可能性を持つ。海外レビューのポイント：各機能の詳細 Tom’s Guideの報道によると、今回発表された主な機能は以下の通りだ。 VoiceOverとMagnifier（視覚障害・弱視向け） VoiceOverに追加された「Image Explorer」は、Apple Intelligenceを使って写真・請求書のスキャン・個人記録など画像内の情報を詳細に説明する。ライブカメラ映像について質問し（Live Recognition）、フォローアップの質問も重ねられる点が評価ポイントだ。 Magnifierはハイコントラストインターフェースにアクションボタン連携を追加。「フラッシュをオンにして」「ズームイン」といった音声コマンドで操作できる。 Voice Control（音声だけでデバイスを操作） Tom’s Guideによると、Voice Controlは自然言語処理の大幅アップデートを受け、「紫のフォルダをタップ」「今見えているものを言って」といった会話的な表現で操作できるようになった。画面上のボタン名を正確に記憶していなくても操作できる点が特徴で、アクセシビリティラベルが適切に付与されていないアプリへの対処としても有効とされる。 Accessibility Readerと字幕自動生成ディスレクシアや弱視など幅広い視覚的困難に対応するAccessibility Readerは、科学論文のような複雑な資料もサポート。オンデマンドの要約・翻訳・フォントや色のカスタマイズが可能とのことだ。字幕生成機能はiPhone・iPad・Mac・Apple TV・Vision Proに対応し、キャプションのない動画にApple Intelligenceが自動で字幕を生成する。家族や友人からメッセージで届いた動画にも対応する点が特筆される。 Vision Proによる電動車椅子制御（最も革新的な機能） Apple Vision Proの高精度アイトラッキングを使って電動車椅子を制御するシステムが発表された。Tom’s Guideの報道では、ALS患者支援団体Team GleasonのPatient Advisory BoardメンバーであるPat Dolan氏が「自分で電動車椅子を動かせる選択肢は、私にとって金の価値がある」とコメントしている。様々な照明条件下で動作し、頻繁な再キャリブレーションも不要とのことだ。日本市場での注目点提供時期は「今年後半」のみ: 具体的な日付は明示されていない。日本向けのApple Intelligenceは英語からの展開が先行するケースが多く、日本語対応のタイミングに注視が必要だ Voice Controlの日本語対応: 自然言語での音声操作は、日本語の言語特性（助詞・語順等）への対応が鍵になる。現行のVoice Controlも日本語に対応しているが、自然言語理解の質は継続的な改善が求められる Apple Vision Proの国内普及: 視線制御による車椅子操作は画期的だが、Vision Proの普及状況に大きく依存する。医療・介護分野でのニーズは高く、今後の行政・医療機関との連携も含めた展開に注目したいアクセシビリティ設計の波及効果: 今回の機能強化は障害のあるユーザー向けにとどまらず、高齢者・一時的な怪我・騒音環境での利用など、広い文脈でのUI改善につながる可能性がある筆者の見解今回のAppleの発表で最も注目すべきは、AIを「便利さの向上」ではなく「できないことをできるようにする」方向に活用している点だ。Vision Proで電動車椅子を制御する機能や、未キャプション動画への自動字幕生成は、文字通り生活を変えうるユースケースである。 AI技術の議論は往々にして生産性向上や業務効率化に集中しがちだが、アクセシビリティへの応用こそ、AIが人間の認知・身体的な限界を補完する最も本質的な形の一つではないだろうか。「目的を伝えれば自律的にタスクを遂行する」という設計が、これほど直接的に人の自律性を支援する例は、現時点では希少だ。一点、気になるのは「今年後半」という曖昧な提供時期だ。アクセシビリティを必要とするユーザーにとっては、いつ使えるようになるかは切実な問題である。より明確なロードマップの公開と、日本語環境での早期対応を期待したい。関連製品リンク ...

生成AI

OpenAIのGPT-5.5、学術ベンチマーク首位もArena.ai実ユーザー評価でClaude・Gemini・Meta Muse Sparkに完敗——ベンチマークと実用評価の乖離が再び焦点に

OpenAIが2026年4月に投入したGPT-5.5は、Artificial Analysisの学術ベンチマーク総合ランキングでClaude Opus 4.7（Anthropic）やGemini 3.1 Pro（Google）を抑えて首位を獲得した。しかし、実際のユーザーが体感を評価するArena.ai（旧LMArena）の盲検テストでは、Claude Opus 4.7・4.6、Gemini 3.1 Pro、さらにはMeta Muse Sparkにも及ばないという対照的な結果が明らかになり、ベンチマークスコアと実用評価の乖離が改めて注目されている。ベンチマーク首位の中身を読む Artificial Analysisは10種類の標準化された学術テストをもとにAIモデルを評価するプラットフォームだ。GPT-5.5（xhighバージョン）は以下の4カテゴリで総合首位を獲得した。論理推論・推論（Humanity’s Last Exam、GPQA Diamondなど）知識（AA-Omniscience、AA-LCRなど）数学・科学（SciCode、CritPtなど）コーディング・実践タスク（Terminal-Bench Hard、GDPval-AA、τ²-Bench Telecomなど） OpenAIはGPT-5.5を「長期ぶりに完全な事前学習（pre-training）を受けた最初のモデル」と位置づけており、今後のAIエージェント展開の基盤となることを目指して開発されたとしている。実ユーザー評価では別の顔 Arena.aiは、ユーザーが任意のプロンプトを入力し、匿名の2つのモデルの回答を比較して「どちらが良いか」を選ぶ盲検方式を採用している。チェスのELOシステムを発展させたBradley-Terryモデルで数百万回の対戦データから順位を算出するため、学術テストでは測れない「使って気持ちいいか」という体験値を反映しやすい。このArena.aiでは、GPT-5.5はAnthropicのClaude Opus 4.7・4.6、GoogleのGemini 3.1 Pro、さらにMetaのMuse Sparkの下位に位置づけられている。ベンチマーク首位のモデルがユーザー体験評価では5位以下という構図だ。なぜ乖離が生まれるのかこの乖離は今回が初めてではない。学術ベンチマークは再現性と客観性を重視するため、特定の問題形式や評価基準に最適化されやすい。一方、実ユーザー評価は「日常的な質問への回答の読みやすさ」「複雑な指示の解釈力」「文章のトーン・自然さ」など、より多層的な側面を反映する。端的に言えば、ベンチマークで強いモデルが必ずしも「使っていて満足できるモデル」ではない。エンジニアがAPIを選定する際、あるいは企業がAIツールを導入する際、このギャップを理解しておくことは極めて重要だ。価格面でも競合最高水準パフォーマンスだけでなく、コスト面でも注目すべき点がある。GPT-5.5の価格は前世代のGPT-5.4から大幅に上昇しており、現時点で競合の中で最も高価な選択肢となっている。モデル入力（100万トークンあたり）出力（100万トークンあたり） GPT-5.4 $2.50 $15.00 GPT-5.5 $5.00 $30.00 GPT-5.5 Pro $30.00 $180.00 Artificial Analysisも「GPT-5.5（High）は知性面でトップクラスのモデルだが、同価格帯の他モデルと比べて特に高価だ」と評している。APIを大量に呼び出すシステムでは、このコスト差が月次の運用費に直撃する。実務への影響——日本のエンジニア・IT管理者へ 1. APIモデル選定はベンチマークをスタート地点にする Artificial Analysisのスコアはモデルの能力を把握する上での有用な出発点だ。ただし、そのままモデル選定の根拠にするのは危うい。自社のユースケースに近いプロンプトで実際にPoC（概念実証）を行い、ユーザーが実際に評価する形で比較することを推奨する。 2. コスト・パフォーマンス比を必ず試算する GPT-5.5は同価格帯の競合と比べて割高になっている。大量推論を伴うシステムでは、月次APIコストのシミュレーションを事前に行っておくこと。「最高スコアのモデルを使えば間違いない」という発想がコスト超過の温床になりやすい。 3. タスク特性でモデルを使い分ける視点を持つコーディング支援、文書生成、論理推論、創造的タスクなど、用途によってモデルの得意・不得意は異なる。単一モデルですべてをカバーしようとせず、ユースケースごとに最適解を探るアプローチが現実的だ。筆者の見解ベンチマーク首位と実ユーザー評価の乖離——これは今後も繰り返し議論されるテーマだと思う。学術テストで高スコアを叩き出す能力と、日常業務で「指示通りに動いてくれる」「文章が読みやすい」という体験は、本質的に別の軸の話だ。この二つをきちんと分けて評価できる組織が、AIツール選定で失敗しない。 GPT-5.5がエージェント向け基盤として設計されているという方向性自体は面白い。完全な事前学習を経た新世代モデルという位置づけも、次の展開への布石として理解できる。ただ、今の時点でArena.aiの評価がこの結果であるなら、「ベンチマーク首位」という事実が実際の利用体験に直結していないことは率直に認識しておく必要がある。価格面でいえば、競合最高水準のコストをつけるなら、実ユーザー評価でも同様の説得力を示してほしいというのが正直なところだ。高い価格設定に見合うだけの実用的な優位性が、今後のアップデートで示されるかどうかが焦点になるだろう。 AI活用が当たり前になりつつある今、「数字が一番だから採用」という意思決定は通用しなくなっている。日本の現場でモデル選定を行う際は、ベンチマークスコアを参考情報として活用しつつ、自社のユーザーが実際に評価する形でのPoC検証を怠らないことを強く勧める。出典: この記事は GPT-5.5 Tops Academic Benchmarks but Loses to Rivals in Real-User Tests の内容をもとに、筆者の見解を加えて独自に執筆したものです。 ...

Azure

Azure第7世代VM（D/E/Lsv）正式提供開始・Virtual Network Manager強化——2026年5月15日アップデート解説

Microsoftは2026年5月15日、第7世代の汎用（D）・メモリ最適化（E）・ストレージ最適化（Lsv）仮想マシンシリーズをAzureで正式提供開始（GA）したと発表した。同時に、Azure Virtual Network Managerへのルール影響アナライザー追加、Service Bus PremiumのKoreaリージョン向け機密コンピューティング対応など、インフラ関連の複数アップデートが一斉に展開されている。第7世代VM（D/E/Lsv7）：何が変わったか VMシリーズの整理 Azureの仮想マシンにはCPUアーキテクチャの世代更新に合わせて定期的に新シリーズが登場する。今回GAとなったv7世代の位置付けは次のとおりだ。 Dシリーズv7（汎用）: CPUとメモリのバランスが良く、Webサーバーや一般的なアプリケーションサーバーに適する Eシリーズv7（メモリ最適化）: 大量RAMが必要なDBサーバーやSAP、インメモリキャッシュ用途に最適 Lsvシリーズv7（ストレージ最適化）: NVMe SSDを大量に搭載し、高I/OのNoSQLや分析ワークロードに対応世代が上がると同一コスト帯でのパフォーマンスが向上することが多い。v5やv6系を利用中の場合は、移行コストと効果を試算する価値がある。移行時の注意点新世代VMへの移行は基本的にリサイズ操作で完結するが、以下の点を事前に確認したい。一部のレガシーエージェントや拡張機能がv7に未対応の場合がある Availability Setを使用中の場合はAvailability Zoneへの移行を検討する好機でもある世代が上がっても同一SKU名で価格が変わるケースがあるため、価格/パフォーマンス比の再計算を必ず実施する Azure Virtual Network Manager：ルール影響アナライザーGA 「変更前にシミュレートする」価値ネットワーク設定の変更は、エンタープライズ環境における最大のリスクイベントのひとつだ。NSGルールを変更したら本番トラフィックが遮断された、というインシデントは日本でも枚挙にいとまがない。 Azure Virtual Network Manager（AVNM）のルール影響アナライザーは、変更を適用する前に「何が影響を受けるか」を可視化する機能だ。具体的には次の情報を確認できる。影響を受けるVNetおよびサブネットの一覧既存のトラフィックフローへの影響範囲ポリシーロールアウト前の変更検証レポート日本のエンタープライズへの実務インパクト日本の大規模エンタープライズでは、オンプレミス時代のネットワーク設計がそのままAzureに移植されているケースが多く、複雑なNSGルールやUser Defined Route（UDR）が積み重なった環境も珍しくない。AVNMのアナライザーは、そうした複雑な環境での変更管理（Change Management）の安全網として機能する。 Service Bus Premium：機密コンピューティングと拡張SLA Service Bus PremiumがKorea（韓国）リージョンで機密コンピューティングに対応したことに加え、可用性ゾーン対応リージョンでのSLAが4ナイン（99.99%）に拡大した。日本リージョン（Japan East/Japan West）での機密コンピューティング対応については今回のアップデートに含まれていないが、SLA拡張はJapan Eastを利用するユーザーにも適用される可能性がある。最新のSLAドキュメントで確認しておきたい。 App Service & FastAPI：開発者体験の改善 SSHヘルパーエイリアス: Azure App Service for Linux上のPythonアプリへのSSH接続がエイリアスで簡略化。デバッグ時の接続手順が減り、診断速度が向上する FastAPIデプロイ簡略化: FastAPIアプリのApp Service for Linuxへのデプロイに必要な設定が削減。PythonモダンAPIフレームワークをAzureで本格活用したいチームには朗報だ Azure Monitor + Grafana：可視化統合の強化 AzureメトリクスをGrafanaで可視化するインテグレーションが強化されたほか、「MDASH」というコードネームの新しいダッシュボードツールが導入された。チーム横断での運用ビューの作成・共有が容易になる見込みだ。 ...