Tech-News

iPhone 17 ProでなんとLLM 400Bが動作——オンデバイスAIの常識を覆すデモが話題に

iPhone 17 Proで400Bパラメータ級LLMが動作——オンデバイスAIの限界を更新 Apple製デバイス向けLLM推論プロジェクト「ANEMLL（Apple Neural Engine Machine Learning）」が、iPhone 17 Proで4000億（400B）パラメータ規模の大規模言語モデル（LLM）を動作させるデモ映像を公開し、開発者コミュニティで大きな反響を呼んでいる。Hacker Newsでは370ポイント以上を獲得し、200件超のコメントが集まった。 400Bとはどれほど巨大か 400Bパラメータというのは、現時点で公開されている最大クラスのオープンモデルと肩を並べる規模だ。たとえばMeta社のLlama 3.1の最大モデルが405Bであり、数年前まで「クラウド専用」の代名詞だった規模感である。これをデータセンターのGPUクラスタではなく、ポケットに入るスマートフォン1台で動かすという試みは、エッジAIの文脈において革命的な意味を持つ。 ANEMLLが活用するApple Neural Engine ANEMLLは、iPhoneおよびiPad・Mac搭載のApple Siliconに内蔵される「Apple Neural Engine（ANE）」を最大限活用するためのLLM推論フレームワークだ。ANEはCPU・GPUとは独立した専用演算ユニットであり、行列演算を高効率・低電力で処理できる。通常のLLMフレームワークがCPUやGPUを主に使うのに対し、ANEMLLはANEに最適化したモデル変換と推論パイプラインを独自に構築している。今回のデモでは、4ビット量子化（INT4）などのモデル圧縮技術と、Apple Siliconの統合メモリアーキテクチャを組み合わせることで、超大規模モデルをオンデバイス推論可能にしていると考えられる。iPhone 17 Proは前世代から大幅に増強されたメモリ容量と改良されたANEを搭載しており、こうした試みを可能にするハードウェア基盤が整ってきた形だ。プライバシーとレイテンシの観点からオンデバイスでLLMが動作することの意義は、単なる技術的な面白さにとどまらない。クラウドにテキストを送信せずに処理できることはプライバシー保護に直結し、ネットワーク遅延も排除できる。医療・法律・金融といった機密性の高い業務や、オフライン環境でのAI活用にも道が開ける。日本国内でも個人情報保護法や各種業界ガイドラインの観点から「クラウドに社内データを送りたくない」というニーズは強い。大規模モデルのオンデバイス化が実用レベルに達すれば、エンタープライズ向けモバイルAIの設計思想そのものが変わりうる。現時点での課題 Hacker Newsのコメント欄では「推論速度はどの程度か」「トークン生成レートが実用域に達しているか」を問う声が多く上がっている。400Bモデルを数ビット量子化しても必要なメモリ帯域幅は膨大であり、現状では応答速度に制約があることが予想される。デモがどの程度の実用性を示しているかは、続報を待つ必要がある。とはいえ、わずか数年前には「スマートフォンでGPT-2クラスすら動かない」とされていた時代から、今や400B規模のデモが登場するまでに至った進化の速度は驚異的だ。ANEMLLの取り組みは、オンデバイスAIの可能性を再定義する一石として記憶されることになりそうだ。元記事: iPhone 17 Pro Demonstrated Running a 400B LLM

兄の整備工場のために「AIフロント係」を自作した話——RAG＋音声AIで取り逃がし客をゼロに

月数十万円の機会損失を「AIフロント係」で解決する兄が高級車専門の整備工場を経営しているが、毎週数百件もの電話に出られず、月に数千ドル相当の受注機会を逃していた。エンジンルームに頭を突っ込んでいる最中に電話が鳴り、出られなければ客は他店へ電話する。ブレーキ交換なら450ドル、エンジン修理なら2,000ドルの案件が、電話一本で消えていく。そこで筆者が自作したのが、AIボイスエージェント「Axle（アクスル）」だ。車の車軸（axle）にちなんだ名前で、単なる汎用チャットボットではなく、工場の正確な料金・営業時間・ポリシーを把握した専用の音声受付システムである。 Part 1：AIの「脳」をRAGパイプラインで構築する最初の課題は、AIがハルシネーション（事実に基づかない回答）なく正確に答えられるかだ。素のLLMに「ブレーキはいくら？」と聞かせると、実際は450ドルなのに200ドルと答えかねない。これは顧客の期待を裏切り、クレームに直結する。これを防ぐために採用したのが**RAG（Retrieval-Augmented Generation：検索拡張生成）**だ。モデルに推測させるのではなく、実際の情報をナレッジベースとして与え、そこからのみ回答させる仕組みである。実装ステップ ① ウェブサイトをスクレイピングしてナレッジベース化サービスページや料金表をMarkdownファイルとして収集。サービス種別・料金・納期・営業時間・支払い方法・キャンセルポリシー・保証・代車有無・対応車種など、21以上のドキュメントを整備した。 ② MongoDB AtlasにベクトルDBとして格納各ドキュメントをVoyage AI（voyage-3-large）で1024次元のベクトルに変換して格納。単なるキーワード一致ではなく「意味的な近さ」で検索できるため、「ブレーキ交換の値段は？」という問いかけが、文言が異なっていても正確にブレーキ料金ドキュメントを引き当てられる。 ③ Claude（Sonnet）で回答生成取得したドキュメントをコンテキストとしてAnthropic Claude（claude-sonnet-4-6）に渡し、「ナレッジベースにある情報のみで答え、知らなければ折り返し連絡を申し出る」という厳格なシステムプロンプトで制御する。この段階でターミナルから質問を入力すると、「オイル交換はいくら？」→「conventional（鉱物油）は45ドル、synthetic（化学合成油）は75ドルです。フィルター交換・液体補充・タイヤ空気圧チェック込みで約30分です」という正確な回答が返るようになった。 Part 2：実際の電話番号と接続する次に、このAIを実際の電話回線につなぐためVapiを採用した。Vapiは電話番号の取得・音声認識（Deepgram）・音声合成（ElevenLabs）・リアルタイム関数呼び出しをすべて担う音声AIプラットフォームだ。筆者はFastAPIでWebhookサーバーを構築。顧客が質問するとVapiがサーバーの/webhookエンドポイントにリクエストを送り、サーバーがRAGパイプライン経由でClaudeに問い合わせて回答を返す。Vapiはその回答を音声合成して顧客に話しかける、というフローだ。技術スタックのまとめ役割採用技術ナレッジベース検索 MongoDB Atlas Vector Search 埋め込みモデル Voyage AI（voyage-3-large） LLM Anthropic Claude（claude-sonnet-4-6）音声インフラ Vapi（Deepgram + ElevenLabs）バックエンド FastAPI（Python）このようなRAG＋音声AIの組み合わせは、中小規模の対人サービス業（飲食店・クリニック・不動産など）でも応用可能だ。電話対応の人手不足に悩む日本の事業者にとっても、参考になる実装アプローチといえる。元記事: I built an AI receptionist for a mechanic shop

Trivyへのサプライチェーン攻撃が拡大——DockerHubとGitHubリポジトリにも被害

Trivyへのサプライチェーン攻撃が拡大——DockerHubとGitHub組織にまで波及オープンソースの脆弱性スキャナ「Trivy」を開発するAqua Securityが、「TeamPCP」と呼ばれる脅威アクターによる継続的な攻撃を受けていることが明らかになった。攻撃者はAquaのGitHub組織を侵害し、悪意あるDockerイメージの公開やリポジトリの大規模な改ざんを実行した。 GitHubのビルドパイプラインが起点に TrivyはGitHubで3万3,800以上のスターを持つ人気ツールで、コンテナイメージやソフトウェア成果物の脆弱性・設定ミス・シークレット漏洩を検出するために広く利用されている。サプライチェーンセキュリティ企業のSocketは、3月22日にDockerHubへ公開された新しいイメージタグ「0.69.5」と「0.69.6」に問題があることを報告した。これらのタグには対応するGitHubリリースやタグが存在せず、TeamPCPが展開したインフォスティーラー（情報窃取マルウェア）の侵害指標が含まれていた。最新の正規リリースは「0.69.3」であり、Socketは「DockerHubのタグはイミュータブル（変更不可）ではないため、タグ名だけで整合性を判断すべきではない」と警告している。二度にわたるGitHub組織への不正アクセス Aqua Securityは3月20日、以前の対応時に実施したシークレット・トークンのローテーションが不完全だったため、攻撃者がリフレッシュされたトークンを入手し、再度アクセスを確立したと発表した。この侵害により、Trivyのビルドパイプラインに資格情報を窃取するコード「TeamPCP Cloud stealer」が注入された。さらに3月22日、同じ脅威アクターがaquasec-comというGitHub組織（非公開の独自コードをホスト）に対して追加の不正アクセスを行ったことが確認された。攻撃者は自動化スクリプトを用い、わずか2分で組織内の44リポジトリすべての名前に接頭辞「tpcp-docs-」を付加し、説明文を「TeamPCP Owns Aqua Security（TeamPCPはAqua Securityを所有する）」に書き換えた。サービスアカウントのPATが悪用されるマルウェアインテリジェンスプラットフォームのOpenSourceMalwareによると、攻撃者は「Argon-DevOps-Mgt」という名のサービスアカウントを侵害することで、AquaのパブリックおよびプライベートのGitHub組織両方へのアクセス権を得た。このサービスアカウントはGitHub Appではなく、通常ユーザーのPersonal Access Token（PAT）で認証を行っていた。PATはパスワードと同様に機能し、GitHub Appのトークンより有効期間が長い。また、サービスアカウントは通常MFA（多要素認証）が設定されていないという構造的な問題も悪用された。攻撃者はパブリックリポジトリaquasecurity/trivy-plugin-aquaに新しいブランチを作成・削除することで、管理者権限の確認テストも実施していた。影響と対策 Aqua Securityは3月20日に安全なバージョンのTrivyを公開済みで、インシデントレスポンス企業Syngniaと連携して対応にあたっている。現時点でTrivyの最新バージョン自体への影響は確認されていない。 Trivyを利用している組織は、DockerHubから取得したイメージのタグと公式GitHubリリースを照合し、バージョン0.69.5・0.69.6を使用していないか確認することが強く推奨される。また、サービスアカウントへのPAT認証の見直しとMFAの適用も重要な対策となる。元記事: Trivy supply-chain attack spreads to Docker, GitHub repos

TeamPCP、Kubernetesクラスタ攻撃でイラン標的のワイパーマルウェアを展開

イランのシステムを標的にした破壊的マルウェアが発見アプリケーションセキュリティ企業Aikidoの研究者が、ハッキンググループ「TeamPCP」による新たな攻撃キャンペーンを確認した。このグループはKubernetesクラスタを標的とし、イランのシステムを検出した場合にすべてのデータを消去するワイパーマルウェアを展開している。 CanisterWormとの関連性 TeamPCPは、脆弱性スキャナ「Trivy」へのサプライチェーン攻撃や、3月20日から始まったNPMベースのキャンペーン「CanisterWorm」を実行した脅威アクターとして知られる。 Aikidoの調査によれば、今回のKubernetes攻撃キャンペーンは、CanisterWormと同一のC2（コマンド＆コントロール）サーバー、バックドアコード、ドロップパス（/tmp/pglog）を使用している。使用されているIPCキャニスター（tdtqy-oyaaa-aaaae-af2dq-cai.raw.icp0.io）も同一だ。地政学的に標的を絞った破壊ロジック今回のキャンペーンで特筆すべきは、イランのタイムゾーンとロケールを検出した場合にのみ発動する破壊的ペイロードの存在だ。この判定はKubernetesの有無に関わらず実行される。 Kubernetesが存在するイランのシステムの場合： kube-system名前空間に「Host-provisioner-iran」という名称のDaemonSetを展開特権コンテナを使用し、ホストのルートファイルシステムを/mnt/hostにマウント「kamikaze」と名付けられたAlpineコンテナが、ホストの最上位ディレクトリをすべて削除した後、強制再起動を実行イランシステムでKubernetesが存在しない場合： rm -rf / コマンドを--no-preserve-rootフラグ付きで実行し、アクセス可能なすべてのファイルを削除 root権限がない場合は、パスワードなしのsudo昇格を試みるイラン以外でKubernetesが存在するシステムの場合：データ消去は行わず、代わりにPythonバックドアをホストのファイルシステムに書き込み systemdサービスとして永続化し、全ノードに感染を広げるいずれの条件にも合致しないシステムでは、マルウェアは何も実行せずに終了する。 SSH伝播への進化 Aikidoはさらに、同一のIPCキャニスターバックドアを使用する新バージョンのマルウェアも確認している。このバージョンではKubernetesベースの横断的移動が省かれ、代わりにSSH伝播を使用。認証ログから有効な認証情報を解析し、盗んだ秘密鍵を利用して感染を拡大する。主な侵害の指標研究者は以下のIoC（侵害の痕跡）を公開している：侵害ホストからのStrictHostKeyChecking=noオプション付きアウトバウンドSSH接続ローカルサブネット内のDockerAPIポート（2375）へのアウトバウンド接続認証なしDocker API経由でルートファイルシステム（/）をhostPathとしてマウントした特権Alpineコンテナ今回の攻撃は、地政学的な対立をサイバー攻撃に組み込む手口が高度化していることを示している。Kubernetesクラスタを運用する組織は、DaemonSetの不審な作成やDocker APIへの不正アクセスがないか至急確認することが推奨される。元記事: TeamPCP deploys Iran-targeted wiper in Kubernetes attacks

Firefox 149リリース：VPN内蔵・Split View・多数の新機能で大幅強化

Mozillaは、人気オープンソースブラウザ「Firefox」の最新版となるFirefox 149を正式にリリースした。今回のアップデートは、コミュニティから長らく要望されてきた機能が複数実装された注目のメジャーアップデートとなっている。目玉機能：ブラウザ内蔵VPN 最大の新機能は、VPN（仮想プライベートネットワーク）機能のブラウザへの統合だ。これまでVPNを利用するには別途アプリのインストールや契約が必要だったが、Firefox 149ではブラウザ単体でVPN接続が可能になる。プライバシー保護や公衆Wi-Fiでの安全なブラウジングを手軽に実現できる点は、セキュリティ意識の高いユーザーに特に響く機能といえる。日本でも公衆Wi-Fi環境は広く普及しているが、セキュリティリスクへの対策が十分でないユーザーも多い。ブラウザと一体化したVPNは、そうした層に対してもハードルを下げる試みとして評価できる。 Split View（画面分割）機能 Split Viewは、1つのブラウザウィンドウ内で複数のタブを並べて表示できる機能だ。リサーチと執筆を同時に行う作業や、複数サイトを比較参照したい場面での生産性向上が期待される。Google ChromeやMicrosoft Edgeにも類似の機能が存在するが、Firefoxへの実装はユーザーが待ち望んでいたものだ。その他の改善点 Firefox 149には上記の主要機能に加え、コミュニティから要望が多かった細かな改善も多数含まれているとされている。パフォーマンスや安定性の向上、UI周りの洗練なども進んでいるとみられる。 Firefoxの立ち位置ブラウザ市場ではChromiumベースのブラウザが圧倒的なシェアを持つ中、Mozillaはプライバシー・オープンソース・カスタマイズ性を訴求軸にFirefoxの差別化を図り続けている。今回のアップデートはその戦略に沿った大型強化であり、Chrome離れを検討しているユーザーへの訴求力も高まりそうだ。 Firefox 149は現在、公式サイトおよびブラウザ内の自動アップデート機能からダウンロード・更新が可能となっている。元記事: Firefox gets big update with built-in VPN, Split View, and other improvements

MicrosoftがExchange Onlineの大型アップデートを緊急撤回——Outlookメール障害が広範囲に発生

MicrosoftがExchange Onlineアップデートを緊急撤回——Outlookに広範な障害 Microsoftは先日、クラウドメールサービス「Exchange Online」に対して大型のアップデートを展開したが、Outlookのメール機能に深刻な問題を引き起こしたとして、このアップデートを緊急撤回する事態となった。何が起きたのか MicrosoftがExchange Onlineに適用したアップデートは、広範なOutlookユーザーにメール送受信の障害をもたらした。影響を受けたユーザーからは、メールが届かない、送信できない、あるいはOutlookクライアントそのものが正常に動作しないといった報告が相次いだ。問題の規模が大きく、ユーザーへの影響が無視できないと判断したMicrosoftは、アップデートのロールバック（撤回・巻き戻し）を決断した。企業の基幹業務を支えるメールインフラである以上、このような迅速な対応は当然とも言える。 Exchange OnlineとOutlookの関係 Exchange Onlineは、Microsoft 365（旧Office 365）に含まれるクラウドベースのメールサーバーサービスだ。Outlookクライアント（デスクトップ版・Web版問わず）は、バックエンドとしてExchange Onlineと通信することでメールの送受信やカレンダー同期を行っている。このため、Exchange Online側の変更は直接Outlookの動作に影響する。日本企業でもMicrosoft 365を業務利用しているケースは多く、今回のような障害が発生した場合の影響は決して小さくない。クラウドサービスの「自動更新」リスク今回の件は、クラウドサービス特有のリスクを改めて浮き彫りにした。オンプレミスの Exchange Server であれば、管理者が更新のタイミングをコントロールできる。一方、Exchange Online のようなSaaS（Software as a Service）では、Microsoftが自動的にアップデートを展開するため、企業側での事前検証が難しい。 Microsoftはこうした問題に備えてService Health Dashboard（サービス正常性ダッシュボード）を提供しており、障害情報をリアルタイムで確認できる。Microsoft 365を業務利用する企業のIT管理者には、日頃からこのダッシュボードを監視する運用体制を整えておくことが推奨される。今後の対応 Microsoftはアップデートのロールバックによって問題の収束を図ったとされるが、根本原因の調査と再発防止策の策定が求められる。同社は過去にも大規模なサービス障害を経験しており、クラウドインフラの安定性向上が継続的な課題となっている。影響を受けたユーザーや企業は、Microsoftの公式ステータスページで最新情報を確認することをおすすめする。元記事: Microsoft forced to retract a major Exchange Online update as it breaks Outlook email

TypeScript 6.0リリース——JavaScriptで書かれた最後のバージョン、次世代はGo製へ移行

TypeScript 6.0、静かな革命の幕開け Microsoftは、TypeScript 6.0を正式リリースした。このバージョンは、TypeScriptコンパイラ自体がJavaScriptで実装された、最後のメジャーリリースとなる。一見すると地味なマイルストーンに見えるが、その意味合いは非常に大きい。Microsoftは2025年初頭に、TypeScriptコンパイラをGo言語でゼロから書き直す計画を発表していた。Go製コンパイラでは、ビルド速度が最大10倍に向上するとされており、大規模なコードベースを抱える開発現場にとっては待望の改善となる。なぜGoへ移行するのか現行のTypeScriptコンパイラは、TypeScript（およびJavaScript）で実装されており、Node.js上で動作する。これはブートストラップ（言語自身で自分を実装する）の観点からは理想的だが、シングルスレッド動作であるNode.jsの制約を受けるため、並列処理による高速化に限界があった。 Go言語はゴルーチンによる並行処理を得意としており、コンパイラをGo移植することでCPUコアを最大限活用できるようになる。Microsoftの検証では、実際の大規模プロジェクトで約10倍のビルド高速化を確認済みとのことだ。 TypeScript 6.0自体の新機能 TypeScript 6.0は「最後のJS製バージョン」という歴史的な意義のほかに、言語機能としてもいくつかの改善が含まれている。型システムの精度向上、モジュール解決の改善、そしてエラーメッセージの可読性強化などが主な変更点とされている。既存プロジェクトからの移行については、後方互換性を維持しつつ段階的に対応できるよう設計されており、TypeScript 5.x系からの移行コストは比較的低いとMicrosoftは説明している。日本の開発現場への影響 TypeScriptは日本国内でもフロントエンド・バックエンドを問わず広く採用されており、特にReactやNext.jsを使ったWebアプリ開発では事実上の標準となっている。Go製コンパイラへの移行が完了すれば、CI/CDパイプラインのビルド時間短縮という実利的なメリットを多くの開発チームが享受できるだろう。 Go製の新コンパイラは現在も開発が進んでおり、TypeScript 6.xシリーズでの段階的な統合、そして将来的なTypeScript 7.0での完全移行が見込まれている。TypeScript 6.0のリリースは、その移行プロセスにおける重要な「出発点」と位置づけられる。詳細はMicrosoft公式ブログおよびTypeScript GitHubリポジトリで確認できる。元記事: Microsoft releases TypeScript 6.0, the last version built on JavaScript

AIエージェントを2コマンドで本番環境へ——Azure Developer CLIの新機能「azd ai agent」でMicrosoft Foundryデプロイが激変

ローカルで動くエージェント、次のステップは？ AIエージェントをローカルで作り上げた後、最大の壁となるのが本番環境へのデプロイだ。リソースのプロビジョニング、モデルのデプロイ、マネージドIDの設定、接続のワイヤリング——これらをすべて手作業でつなぎ合わせるのは、開発者にとって大きな負担だった。 Microsoftは、Azure Developer CLI（azd）に新しいワークフロー azd ai agent を追加。リポジトリから本番稼働中のエージェントへ、わずか2コマンドで到達できる開発体験を実現した。デプロイまでのステップ 1. サンプルプロジェクトのクローンチュートリアルでは、Pythonベースのホテルコンシェルジュエージェントを例に使用する。VS Codeで開いてすぐに作業を開始できる。元記事: From code to cloud: Deploy an AI agent to Microsoft Foundry in minutes with azd

CISA警告：Microsoft Intuneが悪用され医療機器大手Strykerへのサイバー攻撃でデバイスが大量消去

Microsoft Intuneが「武器」に——Strykerへのサイバー攻撃でCISAが緊急警告米国のサイバーセキュリティ機関CISA（Cybersecurity and Infrastructure Security Agency）は、医療機器大手Strykerへのサイバー攻撃を受け、組織のエンドポイント管理システムを早急に強化するよう警告する勧告を発出した。攻撃の手口：マルウェア不使用でデバイスを大量消去今回の攻撃で特筆すべき点は、従来型マルウェアをまったく使用しなかったことだ。攻撃者はMicrosoft Intune——企業が社内デバイスをリモート管理するためのエンドポイント管理サービス——の管理者権限を不正に取得し、大規模なデバイスのワイプ（初期化・消去）を実行したとされる。 CISAによれば、攻撃の起点は管理制御の脆弱性にあった。正規の管理ツールを悪用することで、セキュリティ製品の検知を回避しながら広範な破壊活動を展開できるという、現代的な「Living off the Land（環境寄生型）」攻撃の典型例となっている。なぜIntuneが狙われるのか Microsoft Intuneは、Microsoft 365エコシステムに統合された主要なモバイルデバイス管理（MDM）ソリューションであり、国内外の多くの企業・組織が採用している。その特性上、一度管理者権限が奪われると、配下にある数百〜数千台のデバイスをリモートから一括操作できてしまう。こうした管理プラットフォームは、正規機能を通じて操作するため、エンドポイントセキュリティ製品がアラートを上げにくいという盲点がある。攻撃者はマルウェアを仕込むリスクを負わずに、壊滅的な被害を与えられる。 CISAが推奨する対策 CISAの勧告では、エンドポイント管理システムを保護するための具体的な対策が示されている。多要素認証（MFA）の徹底：管理者アカウントへの不正アクセスを防ぐ第一関門として、すべての管理者アカウントにMFAを必須化する最小権限の原則：Intuneを含む管理ツールの権限を最小限に抑え、不必要な管理者権限を削除する条件付きアクセスポリシーの強化：信頼された場所・デバイスからのみ管理操作を許可するログ監視の強化：Intuneの操作ログをSIEMと連携し、異常な一括操作を即座に検知できる体制を整える定期的な権限レビュー：管理者アカウントの棚卸しを定期的に実施し、退職者・異動者の権限を速やかに削除する日本企業への示唆 Microsoft 365を広く導入している日本企業にとっても、この攻撃手法は対岸の火事ではない。特にIntuneをはじめとするエンドポイント管理ツールの管理者アカウントは、攻撃者にとって最も価値の高い標的の一つとなっている。今回のStrykerへの攻撃は、セキュリティ対策が「マルウェア対策だけでは不十分」であることを改めて浮き彫りにした。正規ツールの悪用（Abuse of Legitimate Tools）への対策として、ID管理・権限管理・ログ監視の強化が急務だ。元記事: CISA Warns Attackers Abused Microsoft Intune to Wipe Devices in Stryker Cyberattack

Google、Gemini 3.1 Flash-Liteを公開——応答速度2.5倍・出力45%高速化でコスト重視の本番環境向けに

Google、Gemini 3.1 Flash-Liteを開発者向けAPIに正式公開 Googleは2026年3月3日、Gemini APIのリリースノートにて「Gemini 3.1 Flash-Lite Preview」の提供開始を発表した。これはGemini 3シリーズにおける初のFlash-Liteモデルであり、処理速度とコスト効率を最大化した設計が特徴となっている。主要スペック：スピード重視の効率特化型公開された情報によると、Gemini 3.1 Flash-Liteは以前のGeminiバージョンと比較して以下の改善を実現している。応答速度（Time to First Token）：2.5倍高速化出力生成速度（Output Generation）：45%高速化この性能向上は、大量のリクエストをさばく必要があるプロダクション環境や、レイテンシが重視されるリアルタイムアプリケーションへの適用を強く意識したものだ。Googleは「コスト重視のユースケース向け高効率モデル」と位置づけており、API利用コストを抑えながらスケールアウトしたい開発者・企業に向いている。 Gemini APIをめぐる最近の動き今回の発表に前後して、Gemini APIには複数の重要なアップデートが加えられている。新機能の追加（2026年3月） Built-in Tools + Function Calling の組み合わせ機能（3月18日）：Gemini組み込みツールとカスタム関数呼び出しを単一のAPIコールで同時利用できるようになった。エージェント型アプリケーション開発の幅が大きく広がる Grounding with Google Maps（3月18日）：Gemini 3シリーズでのGoogle Maps連携グラウンディングが解禁 gemini-embedding-2-preview（3月10日）：テキスト・画像・動画・音声・PDFをひとつの埋め込み空間にマッピングするマルチモーダル埋め込みモデルを初公開廃止・終了スケジュール gemini-2.5-flash-lite-preview-09-2025：2026年3月31日にシャットダウン予定 gemini-2.0-flash / gemini-2.0-flash-lite 系：2026年6月1日にシャットダウン予定 Gemini 2.x系モデルのサポート終了が続いており、開発者はGemini 3系への移行計画を早めに立てておく必要がある。日本の開発者への影響国内でもAI機能の組み込みを進めるサービスは増加しており、APIコストとレスポンス速度はプロダクトの競争力に直結する。Gemini 3.1 Flash-Liteのような効率特化型モデルの登場は、大規模リクエストを扱うチャットボット・文書要約・コンテンツ生成パイプラインなどへの導入障壁を下げる可能性がある。モデルの詳細スペックと開発者向けガイダンスはGoogle AI StudioおよびGemini APIドキュメントで確認できる。元記事: Google Releases Gemini 3.1 Flash-Lite: 2.5× Faster Response, 45% Faster Output

Claude Opus 4.6がSWE-Bench Verifiedで81.4%を達成——GPT-5.4・Gemini 3.1 Proとの三つ巴対決、勝者は「タスク次第」

3社の最新AIが28日で出揃った——「最強モデル」の概念が崩壊 2026年2月〜3月の28日間で、Anthropic・Google・OpenAIの3社がそれぞれのフラッグシップモデルを相次いでリリースした。Claude Opus 4.6（2月5日）、Gemini 3.1 Pro（2月19日）、GPT-5.4（3月5日）——いずれも100万トークンのコンテキストウィンドウを備え、しかし三者三様の「賭け」に出ている。 1年前であれば「総合最強」を名乗れるモデルが存在した。その時代は終わった。各モデルが異なるベンチマークで首位に立ち、ユーザーは「ブランド」ではなく「タスク」でモデルを選ぶ時代になっている。コーディング領域：AnthropicのClaude Opus 4.6が制すソフトウェアエンジニアリングの実力を測る SWE-Bench Verified では、Claude Opus 4.6が**81.4%**を記録し、Gemini 3.1 Proの80.6%をわずかに上回った。GPT-5.4はより難易度の高い「SWE-bench Pro」での比較を選択しており、直接比較では明らかにClaudeがリードしている。さらに注目すべきは、Anthropicが公表した METR Time Horizon（自律的なエージェントタスクをどれだけ継続できるか）の数値だ。Claude Opus 4.6は14.5時間のタスクホライズンを達成。これは長時間の自律コーディングエージェントとして実用に耐えることを意味し、GitHub Copilotなどのコーディング支援ツールと競合するAIエージェント製品の選定基準として注目される。推論・科学系：Gemini 3.1 Proが圧倒的抽象的推論を測る ARC-AGI-2 でGemini 3.1 Proは**77.1%を記録した。前世代から31.1%ポイントという驚異的な向上幅だ。博士レベルの科学知識を問う GPQA Diamond では94.3%**と、現在公開されているスコアの中で最高値を叩き出している。 Googleが推論に注力した背景には、OpenAIとAnthropicがともに入力100万トークンあたり$5〜$15を課金するなか、Gemini 3.1 Proを**$2/M**という破格の価格設定で投入したという戦略がある。高性能かつ低コストという訴求で、大量処理を必要とするエンタープライズ用途を取り込む狙いが透けて見える。 PC操作・知識作業：GPT-5.4が人間を超えた OpenAIの最大の賭けは「コンピュータ操作（Computer Use）」のネイティブ対応だ。デスクトップ操作能力を評価する OSWorld-Verified でGPT-5.4は**75.0%**を記録。人間の専門家ベースライン72.4%を超えた——汎用AIが初めてPC操作で人間を上回った瞬間だ。Claude Opus 4.6も72.7%と肉薄しているが、ファーストムーバーの優位はOpenAIにある。知識作業の生産性評価 GDPval でもGPT-5.4は**83.0%**とリードしており、弁護士・コンサルタント・アナリストなどホワイトカラー業務の自動化においてOpenAIが強みを持つ。日本の開発者・企業への示唆三モデルの比較から読み取れる実用的な選択指針をまとめると以下のとおりだ。用途推奨モデルコーディング・エージェント開発 Claude Opus 4.6 科学・学術・複雑な推論タスク Gemini 3.1 Pro PC操作自動化・業務プロセス自動化 GPT-5.4 コスト最優先の大量処理 Gemini 3.1 Pro 日本市場でも、GitHub CopilotやClaude Codeなどのコーディング支援ツールを評価・導入する企業が増えている。今回のベンチマーク結果は、特にソフトウェア開発チームの採用判断に直接影響を与えるだろう。 ...

Google vs OpenAI「スーパーアプリ」戦争勃発——AI Studio全面刷新とChatGPT統合の全貌

GoogleとOpenAIが同日、「スーパーアプリ」構想を相次ぎ発表 2026年3月、GoogleとOpenAIがほぼ同じタイミングで、AI開発ツールの大規模統合計画を打ち出した。両社の動きは、単なる機能追加にとどまらず、開発者の「日常的な作業場所」をめぐる覇権争いの様相を呈している。 Google AI Studio、ただの「プロンプト遊び場」から脱却 Googleは「Google AI Studio」を全面刷新し、フルスタックのアプリ開発環境へと進化させた。これまでのAI Studioは、Geminiモデルを試すためのプレイグラウンドにとどまり、データベース接続やユーザー認証といった実用的な機能を持っていなかった。新バージョンでは、GoogleのAntigravityコーディングエージェントが中核を担い、自然言語でアプリの要件を記述するだけでデプロイ可能なアプリが生成される。いわゆる「バイブコーディング（Vibe Coding）」——平易な英語で意図を伝えるとAIがコードを書いてくれる手法——の本格実装だ。注目すべきは、Googleのデータベース・認証基盤であるFirebaseとの自動統合だ。アプリがユーザーアカウントやデータストレージを必要とする場合、AIが自動的に検知してセットアップまで行う。Google AI Studio責任者のLogan Kilpatrick氏によると、今後はGoogle Workspace（DriveやSheets）との統合、決済システムや外部データソースへの接続も予定されている。 Googleは合わせて、macOS向けのGeminiデスクトップアプリのテストも開始。ChatGPTやClaudeのデスクトップアプリに対抗する姿勢を明確にした。 OpenAIはChatGPT・Codex・Atlasを1本化、さらにAstralを買収同日、OpenAIはChatGPT、Codex、Atlasの3サービスを統合した単一のデスクトップ「スーパーアプリ」を開発中であることを明らかにした。これまで用途別に分散していたAIツールを1つの窓口に集約する狙いだ。さらに、Pythonエコシステムで広く使われているリンター「Ruff」や高速パッケージマネージャー「uv」を開発したAstral社の買収も発表した。PythonはAI開発の主要言語であり、開発ツールチェーンへの投資は、AIエンジニアの取り込みを強化する戦略とみられる。 Cursorは独自モデルで「Claude超え」を主張 AIコーディングツール「Cursor」も、新機能「Composer 2」を発表。自社開発のコーディング専用モデルが、コストをClaude Opus 4.6比で86%削減しつつ性能で上回ると主張している。大手AI企業だけでなく、専業ツールベンダーも独自モデル開発に乗り出しており、競争はさらに激化している。日本の開発者への影響これらのツールは日本の開発者にも直接関係する。Google AI Studioは無料枠でも利用可能であり、Firebase統合による迅速なプロトタイピングは個人開発者やスタートアップにとって大きな恩恵となりうる。一方、OpenAIのスーパーアプリ統合が完成すれば、コーディング・チャット・エージェントの切り替えなく一元的に扱える環境が整う。 AI開発ツールの「オールインワン化」という潮流は、2026年以降の開発体験を根本から変える可能性がある。元記事: Anthropic Announces the Anthropic Institute – Research into Societal and Security Impacts of AI

CloudflareがAI自律コードレビューエージェント「Bonk」を公開――Kimi K2.5ベース、小規模チームの開発フローに直接統合

Cloudflareが自律コードレビューエージェント「Bonk」を公開 Cloudflareは2026年3月、GitHub向けの自律コードレビューエージェント「Bonk」をリリースした。中国のAIスタートアップMoonshotが開発したKimi K2.5をベースモデルとして構築されており、専任のコードレビュアーを置けない小規模チームでも、既存の開発ワークフローにシームレスに統合できる点が特徴だ。「インフラ企業」がAIエージェント提供者へ Bonkの登場は、CloudflareがCDN・セキュリティ企業の枠を超え、AIエージェントの提供者としても台頭していることを示す象徴的な動きだ。Pull Requestのレビュー依頼をトリガーとして自動起動し、コードの問題点や改善提案をコメントとして返す仕組みを持つとされる。大手クラウド・インフラ企業がAIエージェントをプロダクトとして提供し始めるトレンドは、OpenAIやAnthropicといった純粋なAIラボとは異なる競争軸を生み出している。既存のインフラとの親和性を武器に、エンタープライズ市場への浸透を狙う構図だ。 AI業界全体の「静かな移行期」 Bonkがリリースされた2026年3月19日前後、OpenAI・Google DeepMind・Anthropic・Metaはいずれもフラッグシップモデルのリリースを行っていない。しかしこれは「停滞」ではなく、業界がモデル発表フェーズからデプロイメント・統合フェーズへ移行していることを示すサインだと見る向きが強い。直近のリリースでは、OpenAIのGPT-5.4 miniが無料ユーザー向けのデフォルトとして急速に普及し、AnthropicのClaude（Sonnet系）はコーディングベンチマークで高評価を維持している。一方でDeepSeekの新バージョンが大規模コンテキストウィンドウを引っ提げて静かにテスト段階に入っているとも報じられている。 NVIDIAは「フィジカルAI」に照準モデルリリースが一服する中、GTC 2026においてNVIDIAはフィジカルAI（物理空間と連携するAI）への大型投資を表明した。ヒューマノイドロボット向け基盤モデル「GR00T N1.7」や、Blackwellチップ向けに最適化されたハイブリッドモデル「Nemotron 3 Super」、通信大手Nokiaとの協業による「AI-RAN」など、テキスト処理にとどまらない実世界への展開を加速させている。法的・規制面でも業界再編の動き注目すべき動きとして、米国当局がAnthropicを「安全保障上の懸念」と指摘した法的局面で、競合にあたるOpenAI・Google・Microsoftの関係者が法廷文書でAnthropicを支持する異例の事態が発生した。AI業界の競争が「企業対企業」から「業界対規制当局」という新たな構図に移りつつあることを示す出来事として注目されている。 Bonkのような実用的なAIエージェントが大手インフラ企業から続々と登場し始めた今、開発現場でのAI活用は「実験」から「日常業務への統合」フェーズへと確実に移行している。元記事: Cloudflare Releases ‘Bonk’ – Autonomous Code Review Agent Built on Kimi K2.5

Alibaba「Qwen 3.5 Small」90億パラメータで1200億級モデルに匹敵──小型モデル革命が加速

90億パラメータが「巨人」に挑む──Qwen 3.5 Smallの衝撃 Alibabaが開発するオープンソースLLMシリーズ「Qwen（千問）」の最新モデルQwen 3.5 Smallが、AIコミュニティに大きな衝撃を与えている。パラメータ数わずか90億（9B）でありながら、科学・医学・工学の専門知識を問う難関ベンチマークGPQA（Graduate-Level Google-Proof Q&A）ダイヤモンドにおいて、1,200億（120B）パラメータ規模のモデルと同等の性能スコアを記録したのだ。 GPQAダイヤモンドとは何か GPQAダイヤモンドは、生物学・化学・物理学の博士課程レベルの問題で構成される評価セットで、Googleによる検索でも簡単には正解できないよう設計されている。現在、AIモデルの「真の推論能力」を測る指標として業界標準的な位置づけを獲得しており、このベンチマークでの高スコアは単純な暗記や検索ではなく、深い概念理解を示す証左とされる。従来、このクラスのベンチマークで高得点を出すには、GPT-4oやClaude 3 OpusといったフロンティアモデルやMetaのLlama 3.1 405Bのような超大型モデルが必要とされていた。Qwen 3.5 Smallはその常識を覆した形だ。なぜ小型モデルがここまで強くなれたのか背景には、ポストトレーニング技術の急速な進化がある。2026年時点で主流となっているのは、従来のRLHF（人間フィードバックによる強化学習）に代わる新世代手法群だ。 GRPO（Group Relative Policy Optimization）：グループ単位での相対評価による効率的な強化学習 DAPO（Direct Alignment from Preference Optimization）：人間の選好データを直接活用した整合化 RLVR（Reinforcement Learning from Verifiable Rewards）：検証可能な報酬信号による強化学習これらの手法は、モデルの「思考プロセス」を洗練させることに特化しており、パラメータ数を増やさずとも推論品質を飛躍的に向上できる。いわば「筋肉量より神経効率」を鍛えるアプローチだ。日本市場・エッジAIへの影響 Qwen 3.5 Smallのような高効率小型モデルの台頭は、日本の産業界にも直結する話題だ。クラウドAPIへの依存を減らし、オンプレミスやエッジデバイス上での高精度AI推論が現実的な選択肢となる。医療・製造・金融など、データのクラウド送信に制約がある分野での活用が一気に広がる可能性がある。また、モデルの小型化はコスト削減にも直結する。GPU使用量の削減はカーボンフットプリントの低減にもつながり、サステナビリティの観点からも注目が集まっている。「スケーリング則の終わり」か、「新たな次元」かかつてAI性能はパラメータ数とデータ量に比例するという「スケーリング則（Scaling Law）」が支配的だった。しかし、Qwen 3.5 Smallのような事例が相次ぐ今、業界の視点は「いかに大きくするか」から「いかに効率的に学ばせるか」へと完全にシフトしつつある。 AlibabaはQwenシリーズをオープンソースで公開しており、研究者や開発者が自由に活用・改良できる点も普及の加速要因となっている。小型・高性能・オープンという三拍子が揃ったモデルの登場は、AIの民主化という大きな潮流をさらに推し進めるだろう。元記事: Qwen 3.5 Small (9B) Matches 120B-Scale Models on GPQA Diamond Benchmark

GPT-5.4が100万トークンコンテキストと自律エージェント機能を引っさげてリリース——AI覇権争いが加速

2日間隔でのリリース——加速するAIモデル競争 OpenAIは2026年3月、GPT-5.4を正式リリースした。注目すべきはそのタイミングだ。GPT-5.3のリリースからわずか2日後という異例のスピードで、業界内ではGoogleとの競争激化による「駆け込みリリース」との見方が広まっている。最大の目玉：ネイティブなコンピュータ操作（Computer Use） GPT-5.4の最大の新機能は、**ネイティブコンピュータ使用（Computer Use）**だ。これは単なる「テキスト生成」を超え、モデルがWebブラウザの操作、フォーム入力、アプリケーション実行といった実際の作業を自律的に行えることを意味する。これまで人間の手が必要だったマルチステップのワークフローを、AIが単独でこなす「エージェント型AI」の実用化が本格的に始まったといえる。 100万トークン超のコンテキストウィンドウ GPT-5.4はThinkingとProの2バリアントで提供される。Thinkingは段階的な推論に最適化された思考型モデル、Proは開発者・パワーユーザー向けの最高性能モデルだ。両バリアントとも、入力コンテキストウィンドウが最大1,050,000トークン（約105万トークン）に拡張され、出力は最大128,000トークンを生成できる。日本語の技術文書や長大なコードベースでも、文脈を切らずに処理できる規模感だ。ベンチマーク性能：Claude Opus 4.6を上回り、Gemini 3.1 Proと互角独立ベンチマーク「Artificial Analysis Intelligence Index」（10項目の経済的実用タスクを重み付け平均）では、GPT-5.4 ProはClaude Opus 4.6を上回り、Gemini 3.1 Proと57点で同点タイに達した。特にコーディングとエージェント系タスクのサブインデックスではGPT-5.4がリードしている。なお、OSWorldベンチマーク（PCの実際の操作タスクを評価）では人間ベースライン72.4%に対し75%を記録しており、コンピュータ操作能力の高さを裏付けている。料金体系 ChatGPT Plus・Team・Proプランから利用可能。API利用時の料金は以下の通り。モデル入力（100万トークン）出力（100万トークン） GPT-5.4 $2.50 $15 GPT-5.4 Pro $30 $180 フロンティアモデルの差は縮小中——重要なのは「自分のワークフロー」への適合 2026年初頭のAIモデル群を俯瞰すると、GPT-5.4・Gemini 3.1 Pro・Claude 4.6はいずれも過去のモデルと比較して格段に高い性能を持つ。しかし、実用的なタスクにおけるモデル間の差は縮小してきており、「どのモデルが最強か」よりも「自分のワークフローやコストに合うモデルはどれか」という視点が重要になってきている。 Google Workspaceとの深い統合を持つGemini 3.1 Proや、コーディング・エージェント系を得意とするGPT-5.4 Proなど、用途に応じた選択が今後のAI活用の鍵となりそうだ。元記事: GPT-5.4 Launches with 1-Million-Token Context Window and Autonomous Multi-Step Workflows

2026年問題：Secure Boot証明書の失効に備えるための公式対応手順をMicrosoftが公開

Secure Boot証明書の2026年問題とは Microsoftは、2026年に発生するSecure Boot（セキュアブート）証明書の失効問題に対応するための公式ガイド「Secure Boot playbook」を公開した。2011年に発行されたSecure Boot関連の証明書が、2026年6月を皮切りに順次有効期限を迎えることが背景にある。 Secure Bootとは、PCの起動時にOSやブートローダーのデジタル署名を検証し、マルウェアや不正なソフトウェアによる改ざんを防ぐUEFIの機能だ。Windows 11の必須要件にもなっており、企業・個人を問わず広く使われている。失効後はどうなる？証明書が失効しても、Windowsは引き続き起動する。ただし、失効した証明書に依存していたセキュリティ保護の一部が適用されなくなる。具体的には、DBX（失効署名データベース）の更新や特定のセキュリティパッチが正しく機能しなくなる可能性があり、セキュリティ水準の低下を招く恐れがある。対象となるPCは？ 2024年以降に製造されたPCは、すでに2023年発行の新しい証明書が組み込まれており、対応不要だ。問題になるのは、古いUEFIファームウェアを搭載した旧世代のPCで、特に企業の現場では長期利用が多いため注意が必要だ。必要な対応手順 Microsoftが公開したプレイブックでは、以下の対応フローが案内されている。現状確認 — デバイスのUEFIファームウェアバージョンと、搭載されているSecure Boot証明書のバージョンを確認するファームウェア更新の確認 — PCメーカー（OEM）が2023年証明書対応のファームウェアアップデートを提供しているか確認する手動更新の実施 — アップデートが提供されている場合、Windows Updateまたはメーカーのサポートページからファームウェアを更新するエンタープライズ環境での管理 — Microsoft IntuneやConfigMgrなどのデバイス管理ツールを活用して、組織内の対象デバイスを一括把握・対応する企業IT担当者への影響日本の企業環境でも、PCの長期運用は珍しくない。特にWindows 10の延長サポート終了（2025年10月）を控えた移行期にあたるため、ハードウェアの棚卸しと並行してSecure Boot証明書の確認を進めることが望ましい。期限まで時間的な余裕があるうちに対応デバイスを洗い出し、ファームウェア更新の計画を立てておくことを強くお勧めする。元記事: Secure Boot playbook for certificates expiring in 2026

Microsoft、Windows 11の大規模改善を正式発表——タスクバー移動・Copilot縮小・File Explorer高速化など

Microsoft、Windows 11の「長年の不満」にようやく正面から向き合う Microsoftは、Windows 11に対してユーザーが長年にわたって指摘してきた問題点を解消する大規模なアップデートを正式に発表した。2026年4月以降、Windows Insider Program（ベータテストプログラム）を通じて段階的に提供される予定だ。主な改善点タスクバーの移動が可能に Windows 11でもっとも批判を受けてきた仕様変更のひとつが、タスクバーを画面の上部や左右に移動できなくなった点だった。Windows 10では自由に配置できたこの機能が、Windows 11では廃止されていた。今回の発表では、この要望に応える形でタスクバーの移動機能が復活する見込みだ。 Copilot統合の大幅縮小 Windows 11ではAIアシスタント「Copilot（コパイロット）」がOSに深く組み込まれ、意図しない場面で起動するなどとして不満の声が多かった。今回の改善では、CopilotのOS統合が大幅に縮小される。AIを積極的に活用したいユーザーには引き続きオプションとして提供しつつ、不要なユーザーへの押しつけを減らす方向に舵を切った形だ。 File Explorerの高速化ファイル管理の要であるFile Explorer（ファイルエクスプローラー）のパフォーマンス改善も発表された。大量のファイルを扱う業務ユーザーやクリエイターにとって、体感できるレベルでの速度向上が期待される。広告の削減スタートメニューやエクスプローラー内に表示される推奨アプリや広告についても削減が予定されている。有料OSでの広告表示はかねてより批判が強く、今回の対応はユーザーの声を反映したものといえる。「Microslop」批判への回答ネット上では品質低下を揶揄して「Microslop（マイクロスロップ）」と呼ぶ声も一部で見られるほど、Windows 11への批判は根強かった。今回の発表はそうした声への直接的な回答とも受け取れ、Microsoftがユーザー体験の改善を最優先課題として位置づけたことを示している。展開スケジュール改善は2026年4月以降、まずWindows Insiderチャンネル経由で提供が開始され、その後一般ユーザーへ段階的に展開される予定だ。日本国内のユーザーも同時期に利用できるとみられる。長年のフラストレーションに応える今回の大型改善が、Windows 11の評価を大きく塗り替えるか、今後の展開が注目される。元記事: Microsoft announces major Windows 11 updates designed to fix biggest flaws

AKS、Ubuntu 24.04が正式対応＆ブルーグリーンノードアップグレードがプレビュー公開

AKS、Ubuntu 24.04 GAとブルーグリーンアップグレードで運用の幅が広がる Microsoftは2026年3月、Azure Kubernetes Service（AKS）において複数の重要なアップデートを発表した。なかでも注目は、Ubuntu 24.04のGA（一般提供）昇格と、ブルーグリーン方式のノードプールアップグレードのパブリックプレビュー開始の2点だ。 Ubuntu 24.04がKubernetes v1.32以降の標準ノードOSに Ubuntu 24.04（Noble Numbat）が、Kubernetes v1.32以降を使用するAKSクラスターの標準ノードOSとして正式採用された。主な改善点は以下のとおり。 Containerd 2.0同梱: コンテナランタイムが最新世代に刷新され、起動速度と安定性が向上起動時間の短縮: ノードの起動プロセスが最適化され、スケールアウト時のレイテンシが改善カーネルハードニング強化: セキュリティ設定がデフォルトで強化されており、本番環境への適用が安心しやすくなった Ubuntu 20.04から22.04への移行でつまずいた経験を持つ組織にとっても、今回は標準パスとして提供されるため、スムーズな移行が期待できる。ブルーグリーンアップグレードで無停止運用が現実的にこれまでノードプールのアップグレード中は断続的なワークロード影響が生じることがあったが、ブルーグリーン方式の導入によって状況が大きく変わる。ブルーグリーンアップグレードでは、既存のノードプール（Blue）を稼働させたまま、新しいバージョンのノードプール（Green）を並行して立ち上げ、切り替えを行う。移行が完了するまでBlue側はトラフィックを受け持ち続けるため、アップグレード中のダウンタイムをほぼゼロに抑えられる。この手法は、金融・医療・ECなど可用性要件の高い本番環境での採用が特に期待される。現在はパブリックプレビュー段階であり、正式採用前に検証環境での試験を推奨する。その他の主なアップデート Kubernetes新パッチ版の提供開始: v1.32.11、v1.33.7、v1.34.3が利用可能に KubernetesLTS版v1.28の非推奨化: サポート対象バージョンへの移行を早急に検討すること Azure Linux、GPU対応を拡充: NVIDIA A100・H100・H200 VMもサポート対象に OpenTelemetry（OTLP gRPC）のパブリックプレビュー: Azure Monitorとの連携がより柔軟に Ciliumをv1.18.6に更新: CVE-2025-64715およびCVE-2026-26963に対処 FlatcarコンテナLinuxの廃止予告: 2026年6月8日にプレビュー終了。移行計画が必要まとめ AKSはUbuntu 24.04の正式採用でセキュリティと性能の基盤を強化しつつ、ブルーグリーンアップグレードで運用時の柔軟性を大幅に高めた。Kubernetes v1.28のEOLも控えており、クラスターのバージョン管理を早めに見直しておきたいタイミングだ。元記事: Azure Kubernetes Service: Ubuntu 24.04 GA and Blue-Green Node Pool Upgrade Preview

Microsoft Foundry「Priority Processing」がGA——プロビジョニング不要でSLA保証のAI推論を実現

Microsoft Foundry、遅延に敏感なAIワークロード向け「Priority Processing」を正式提供開始 Microsoftは、クラウドAI開発プラットフォーム「Microsoft Foundry（旧Azure AI Foundry）」において、Priority Processing（優先処理）機能の一般提供（GA）を発表した。リアルタイム性が求められるAIアプリケーションのレスポンスタイムを大幅に改善する新機能だ。プロビジョニング不要でSLA保証のパフォーマンス Priority Processingの最大の特徴は、プロビジョニング済みスループット（PTU）を事前確保しなくても、SLA（サービスレベルアグリーメント）に裏付けられたパフォーマンスが得られる点にある。従来、AIモデルの安定した推論速度を確保するにはPTUの事前購入が必要だった。これはコストと計画の両面で企業にとって負担となっていた。Priority Processingはこの制約を取り除き、従量課金モデルのまま優先的なリソース割り当てを受けられる仕組みを提供する。チャットbotからコパイロットまで——インタラクティブAI体験に最適この機能が特に威力を発揮するのは、ユーザーがリアルタイムで操作するシナリオだ。具体的には以下のようなユースケースが想定される：カスタマーサポートチャットbot — 問い合わせへの即時応答 AIコーディングアシスタント — コード補完や提案のリアルタイム表示コパイロット型アプリケーション — ドキュメント作成支援や検索拡張生成（RAG）音声AIエージェント — 自然な会話フローを維持するための低レイテンシー処理 Adobe・Harveyなど先進企業がすでに導入 GA前のアーリーアクセス段階から、すでに複数の有力企業が本機能を採用している。クリエイティブソフトウェア大手のAdobeは、AIを活用したデザインツールの操作感改善に活用。リーガルテック企業のHarveyは、法律専門家向けAIアシスタントの応答性向上に役立てている。両社とも「ユーザーが体感できるレベルでの応答速度改善が確認できた」とコメントしており、インタラクティブなAI体験の品質向上に直結する機能として評価されている。日本企業への影響国内でも、Azure OpenAI ServiceやMicrosoft Foundryを活用したAIソリューション導入が急速に広がっている。カスタマーサポートの自動化や社内向けコパイロット構築を進める企業にとって、追加のインフラ投資なしにエンドユーザー体験を向上できるPriority Processingは、ROI改善の観点からも注目に値する機能だ。 Microsoft Foundryのコンソールから即日有効化が可能で、既存のAzure OpenAI Serviceとの統合も容易とされている。元記事: Announcing Priority Processing in Microsoft Foundry for Performance-Sensitive AI Workloads

Microsoft、SharePointの全面刷新を発表——「Discover/Publish/Build」の3軸に再設計、AI機能も統合

MicrosoftがSharePointの新UIを段階展開中——3年ぶりの大型刷新 Microsoftは2026年3月3日より、Microsoft 365上のSharePointを全面的にリデザインした「New SharePoint Experience」のパブリックプレビューを開始した。コラボレーション基盤として長年使われてきたSharePointが、より直感的かつAI活用を前提とした形に生まれ変わる。アプリバーを「3つのジョブ」で再設計最大の変化は左側のアプリバーの刷新だ。従来は統一的なナビゲーションが並んでいたが、新UIでは以下の5つのセクションに整理された。 Home — グローバルナビゲーションが有効な場合、企業イントラネットの入口として機能。Viva Connectionsで提供されていた体験がこのHomeサイトに統合される Discover — 従来のSharePointスタートページを置き換え。AIによるアクションで質問したり、フォロー中のサイトのアップデートをキャッチアップできる Publish — コミュニケーションサイトやニュース発信などのコンテンツ公開に特化 Build — ビジネスソリューションやカスタムアプリの構築に特化 OneDrive — 個人ファイル管理なお、グローバルナビゲーションが設定されていない場合はHomeではなくDiscoverが最初のアイコンとして表示される。 AI機能はCopilotライセンスが必要新UIにはAI連携ツールが統合されているが、利用にはMicrosoft 365 Copilotライセンスが必要となる点は注意が必要だ。SharePoint Admin Agentなど、管理者向けのAI支援機能も追加される予定。日本企業でCopilotライセンスを導入済みの組織にとっては、SharePointがより実用的なナレッジハブとして機能するようになる。展開スケジュールフェーズ時期パブリックプレビュー 2026年3月3日〜3月中旬ターゲットリリース 2026年4月末〜5月初旬一般提供（GA） 2026年5月初旬〜5月末有効化の方法新UIはデフォルトでは無効。SharePoint管理者またはグローバル管理者がSharePoint管理センターから手動で有効化する必要がある。手順は以下のとおり。 SharePoint管理センターにアクセス「設定 → SharePoint → New SharePoint experience」に移動「Enable the new SharePoint experience」チェックボックスをオン保存有効化後、ユーザーはアプリバー下部の「New SharePoint」トグルで新旧UIを切り替え可能。プレビュー期間中はいつでも旧UIに戻せる。旧「Featured Links」機能は2026年6月末に廃止新UIへの移行に伴い、旧来の「Featured Links」機能は2026年6月末に廃止予定。現在この機能を活用しているイントラネット担当者は、早めに新UIへの移行計画を立てておく必要がある。現在はプレビュー段階のため、本番環境への適用は一般提供開始後が推奨される。元記事: Microsoft introduces New SharePoint Experience