Tech News JP

Google vs OpenAI「スーパーアプリ」戦争勃発——AI Studio全面刷新とChatGPT統合の全貌

GoogleとOpenAIが同日、「スーパーアプリ」構想を相次ぎ発表 2026年3月、GoogleとOpenAIがほぼ同じタイミングで、AI開発ツールの大規模統合計画を打ち出した。両社の動きは、単なる機能追加にとどまらず、開発者の「日常的な作業場所」をめぐる覇権争いの様相を呈している。 Google AI Studio、ただの「プロンプト遊び場」から脱却 Googleは「Google AI Studio」を全面刷新し、フルスタックのアプリ開発環境へと進化させた。これまでのAI Studioは、Geminiモデルを試すためのプレイグラウンドにとどまり、データベース接続やユーザー認証といった実用的な機能を持っていなかった。新バージョンでは、GoogleのAntigravityコーディングエージェントが中核を担い、自然言語でアプリの要件を記述するだけでデプロイ可能なアプリが生成される。いわゆる「バイブコーディング（Vibe Coding）」——平易な英語で意図を伝えるとAIがコードを書いてくれる手法——の本格実装だ。注目すべきは、Googleのデータベース・認証基盤であるFirebaseとの自動統合だ。アプリがユーザーアカウントやデータストレージを必要とする場合、AIが自動的に検知してセットアップまで行う。Google AI Studio責任者のLogan Kilpatrick氏によると、今後はGoogle Workspace（DriveやSheets）との統合、決済システムや外部データソースへの接続も予定されている。 Googleは合わせて、macOS向けのGeminiデスクトップアプリのテストも開始。ChatGPTやClaudeのデスクトップアプリに対抗する姿勢を明確にした。 OpenAIはChatGPT・Codex・Atlasを1本化、さらにAstralを買収同日、OpenAIはChatGPT、Codex、Atlasの3サービスを統合した単一のデスクトップ「スーパーアプリ」を開発中であることを明らかにした。これまで用途別に分散していたAIツールを1つの窓口に集約する狙いだ。さらに、Pythonエコシステムで広く使われているリンター「Ruff」や高速パッケージマネージャー「uv」を開発したAstral社の買収も発表した。PythonはAI開発の主要言語であり、開発ツールチェーンへの投資は、AIエンジニアの取り込みを強化する戦略とみられる。 Cursorは独自モデルで「Claude超え」を主張 AIコーディングツール「Cursor」も、新機能「Composer 2」を発表。自社開発のコーディング専用モデルが、コストをClaude Opus 4.6比で86%削減しつつ性能で上回ると主張している。大手AI企業だけでなく、専業ツールベンダーも独自モデル開発に乗り出しており、競争はさらに激化している。日本の開発者への影響これらのツールは日本の開発者にも直接関係する。Google AI Studioは無料枠でも利用可能であり、Firebase統合による迅速なプロトタイピングは個人開発者やスタートアップにとって大きな恩恵となりうる。一方、OpenAIのスーパーアプリ統合が完成すれば、コーディング・チャット・エージェントの切り替えなく一元的に扱える環境が整う。 AI開発ツールの「オールインワン化」という潮流は、2026年以降の開発体験を根本から変える可能性がある。元記事: Anthropic Announces the Anthropic Institute – Research into Societal and Security Impacts of AI

生成AI

CloudflareがAI自律コードレビューエージェント「Bonk」を公開――Kimi K2.5ベース、小規模チームの開発フローに直接統合

Cloudflareが自律コードレビューエージェント「Bonk」を公開 Cloudflareは2026年3月、GitHub向けの自律コードレビューエージェント「Bonk」をリリースした。中国のAIスタートアップMoonshotが開発したKimi K2.5をベースモデルとして構築されており、専任のコードレビュアーを置けない小規模チームでも、既存の開発ワークフローにシームレスに統合できる点が特徴だ。「インフラ企業」がAIエージェント提供者へ Bonkの登場は、CloudflareがCDN・セキュリティ企業の枠を超え、AIエージェントの提供者としても台頭していることを示す象徴的な動きだ。Pull Requestのレビュー依頼をトリガーとして自動起動し、コードの問題点や改善提案をコメントとして返す仕組みを持つとされる。大手クラウド・インフラ企業がAIエージェントをプロダクトとして提供し始めるトレンドは、OpenAIやAnthropicといった純粋なAIラボとは異なる競争軸を生み出している。既存のインフラとの親和性を武器に、エンタープライズ市場への浸透を狙う構図だ。 AI業界全体の「静かな移行期」 Bonkがリリースされた2026年3月19日前後、OpenAI・Google DeepMind・Anthropic・Metaはいずれもフラッグシップモデルのリリースを行っていない。しかしこれは「停滞」ではなく、業界がモデル発表フェーズからデプロイメント・統合フェーズへ移行していることを示すサインだと見る向きが強い。直近のリリースでは、OpenAIのGPT-5.4 miniが無料ユーザー向けのデフォルトとして急速に普及し、AnthropicのClaude（Sonnet系）はコーディングベンチマークで高評価を維持している。一方でDeepSeekの新バージョンが大規模コンテキストウィンドウを引っ提げて静かにテスト段階に入っているとも報じられている。 NVIDIAは「フィジカルAI」に照準モデルリリースが一服する中、GTC 2026においてNVIDIAはフィジカルAI（物理空間と連携するAI）への大型投資を表明した。ヒューマノイドロボット向け基盤モデル「GR00T N1.7」や、Blackwellチップ向けに最適化されたハイブリッドモデル「Nemotron 3 Super」、通信大手Nokiaとの協業による「AI-RAN」など、テキスト処理にとどまらない実世界への展開を加速させている。法的・規制面でも業界再編の動き注目すべき動きとして、米国当局がAnthropicを「安全保障上の懸念」と指摘した法的局面で、競合にあたるOpenAI・Google・Microsoftの関係者が法廷文書でAnthropicを支持する異例の事態が発生した。AI業界の競争が「企業対企業」から「業界対規制当局」という新たな構図に移りつつあることを示す出来事として注目されている。 Bonkのような実用的なAIエージェントが大手インフラ企業から続々と登場し始めた今、開発現場でのAI活用は「実験」から「日常業務への統合」フェーズへと確実に移行している。元記事: Cloudflare Releases ‘Bonk’ – Autonomous Code Review Agent Built on Kimi K2.5

生成AI

Alibaba「Qwen 3.5 Small」90億パラメータで1200億級モデルに匹敵──小型モデル革命が加速

90億パラメータが「巨人」に挑む──Qwen 3.5 Smallの衝撃 Alibabaが開発するオープンソースLLMシリーズ「Qwen（千問）」の最新モデルQwen 3.5 Smallが、AIコミュニティに大きな衝撃を与えている。パラメータ数わずか90億（9B）でありながら、科学・医学・工学の専門知識を問う難関ベンチマークGPQA（Graduate-Level Google-Proof Q&A）ダイヤモンドにおいて、1,200億（120B）パラメータ規模のモデルと同等の性能スコアを記録したのだ。 GPQAダイヤモンドとは何か GPQAダイヤモンドは、生物学・化学・物理学の博士課程レベルの問題で構成される評価セットで、Googleによる検索でも簡単には正解できないよう設計されている。現在、AIモデルの「真の推論能力」を測る指標として業界標準的な位置づけを獲得しており、このベンチマークでの高スコアは単純な暗記や検索ではなく、深い概念理解を示す証左とされる。従来、このクラスのベンチマークで高得点を出すには、GPT-4oやClaude 3 OpusといったフロンティアモデルやMetaのLlama 3.1 405Bのような超大型モデルが必要とされていた。Qwen 3.5 Smallはその常識を覆した形だ。なぜ小型モデルがここまで強くなれたのか背景には、ポストトレーニング技術の急速な進化がある。2026年時点で主流となっているのは、従来のRLHF（人間フィードバックによる強化学習）に代わる新世代手法群だ。 GRPO（Group Relative Policy Optimization）：グループ単位での相対評価による効率的な強化学習 DAPO（Direct Alignment from Preference Optimization）：人間の選好データを直接活用した整合化 RLVR（Reinforcement Learning from Verifiable Rewards）：検証可能な報酬信号による強化学習これらの手法は、モデルの「思考プロセス」を洗練させることに特化しており、パラメータ数を増やさずとも推論品質を飛躍的に向上できる。いわば「筋肉量より神経効率」を鍛えるアプローチだ。日本市場・エッジAIへの影響 Qwen 3.5 Smallのような高効率小型モデルの台頭は、日本の産業界にも直結する話題だ。クラウドAPIへの依存を減らし、オンプレミスやエッジデバイス上での高精度AI推論が現実的な選択肢となる。医療・製造・金融など、データのクラウド送信に制約がある分野での活用が一気に広がる可能性がある。また、モデルの小型化はコスト削減にも直結する。GPU使用量の削減はカーボンフットプリントの低減にもつながり、サステナビリティの観点からも注目が集まっている。「スケーリング則の終わり」か、「新たな次元」かかつてAI性能はパラメータ数とデータ量に比例するという「スケーリング則（Scaling Law）」が支配的だった。しかし、Qwen 3.5 Smallのような事例が相次ぐ今、業界の視点は「いかに大きくするか」から「いかに効率的に学ばせるか」へと完全にシフトしつつある。 AlibabaはQwenシリーズをオープンソースで公開しており、研究者や開発者が自由に活用・改良できる点も普及の加速要因となっている。小型・高性能・オープンという三拍子が揃ったモデルの登場は、AIの民主化という大きな潮流をさらに推し進めるだろう。元記事: Qwen 3.5 Small (9B) Matches 120B-Scale Models on GPQA Diamond Benchmark

生成AI

GPT-5.4が100万トークンコンテキストと自律エージェント機能を引っさげてリリース——AI覇権争いが加速

2日間隔でのリリース——加速するAIモデル競争 OpenAIは2026年3月、GPT-5.4を正式リリースした。注目すべきはそのタイミングだ。GPT-5.3のリリースからわずか2日後という異例のスピードで、業界内ではGoogleとの競争激化による「駆け込みリリース」との見方が広まっている。最大の目玉：ネイティブなコンピュータ操作（Computer Use） GPT-5.4の最大の新機能は、ネイティブコンピュータ使用（Computer Use）だ。これは単なる「テキスト生成」を超え、モデルがWebブラウザの操作、フォーム入力、アプリケーション実行といった実際の作業を自律的に行えることを意味する。これまで人間の手が必要だったマルチステップのワークフローを、AIが単独でこなす「エージェント型AI」の実用化が本格的に始まったといえる。 100万トークン超のコンテキストウィンドウ GPT-5.4はThinkingとProの2バリアントで提供される。Thinkingは段階的な推論に最適化された思考型モデル、Proは開発者・パワーユーザー向けの最高性能モデルだ。両バリアントとも、入力コンテキストウィンドウが最大1,050,000トークン（約105万トークン）に拡張され、出力は最大128,000トークンを生成できる。日本語の技術文書や長大なコードベースでも、文脈を切らずに処理できる規模感だ。ベンチマーク性能：Claude Opus 4.6を上回り、Gemini 3.1 Proと互角独立ベンチマーク「Artificial Analysis Intelligence Index」（10項目の経済的実用タスクを重み付け平均）では、GPT-5.4 ProはClaude Opus 4.6を上回り、Gemini 3.1 Proと57点で同点タイに達した。特にコーディングとエージェント系タスクのサブインデックスではGPT-5.4がリードしている。なお、OSWorldベンチマーク（PCの実際の操作タスクを評価）では人間ベースライン72.4%に対し75%を記録しており、コンピュータ操作能力の高さを裏付けている。料金体系 ChatGPT Plus・Team・Proプランから利用可能。API利用時の料金は以下の通り。モデル入力（100万トークン）出力（100万トークン） GPT-5.4 $2.50 $15 GPT-5.4 Pro $30 $180 フロンティアモデルの差は縮小中——重要なのは「自分のワークフロー」への適合 2026年初頭のAIモデル群を俯瞰すると、GPT-5.4・Gemini 3.1 Pro・Claude 4.6はいずれも過去のモデルと比較して格段に高い性能を持つ。しかし、実用的なタスクにおけるモデル間の差は縮小してきており、「どのモデルが最強か」よりも「自分のワークフローやコストに合うモデルはどれか」という視点が重要になってきている。 Google Workspaceとの深い統合を持つGemini 3.1 Proや、コーディング・エージェント系を得意とするGPT-5.4 Proなど、用途に応じた選択が今後のAI活用の鍵となりそうだ。元記事: GPT-5.4 Launches with 1-Million-Token Context Window and Autonomous Multi-Step Workflows

Windows

2026年問題：Secure Boot証明書の失効に備えるための公式対応手順をMicrosoftが公開

Secure Boot証明書の2026年問題とは Microsoftは、2026年に発生するSecure Boot（セキュアブート）証明書の失効問題に対応するための公式ガイド「Secure Boot playbook」を公開した。2011年に発行されたSecure Boot関連の証明書が、2026年6月を皮切りに順次有効期限を迎えることが背景にある。 Secure Bootとは、PCの起動時にOSやブートローダーのデジタル署名を検証し、マルウェアや不正なソフトウェアによる改ざんを防ぐUEFIの機能だ。Windows 11の必須要件にもなっており、企業・個人を問わず広く使われている。失効後はどうなる？証明書が失効しても、Windowsは引き続き起動する。ただし、失効した証明書に依存していたセキュリティ保護の一部が適用されなくなる。具体的には、DBX（失効署名データベース）の更新や特定のセキュリティパッチが正しく機能しなくなる可能性があり、セキュリティ水準の低下を招く恐れがある。対象となるPCは？ 2024年以降に製造されたPCは、すでに2023年発行の新しい証明書が組み込まれており、対応不要だ。問題になるのは、古いUEFIファームウェアを搭載した旧世代のPCで、特に企業の現場では長期利用が多いため注意が必要だ。必要な対応手順 Microsoftが公開したプレイブックでは、以下の対応フローが案内されている。現状確認 — デバイスのUEFIファームウェアバージョンと、搭載されているSecure Boot証明書のバージョンを確認するファームウェア更新の確認 — PCメーカー（OEM）が2023年証明書対応のファームウェアアップデートを提供しているか確認する手動更新の実施 — アップデートが提供されている場合、Windows Updateまたはメーカーのサポートページからファームウェアを更新するエンタープライズ環境での管理 — Microsoft IntuneやConfigMgrなどのデバイス管理ツールを活用して、組織内の対象デバイスを一括把握・対応する企業IT担当者への影響日本の企業環境でも、PCの長期運用は珍しくない。特にWindows 10の延長サポート終了（2025年10月）を控えた移行期にあたるため、ハードウェアの棚卸しと並行してSecure Boot証明書の確認を進めることが望ましい。期限まで時間的な余裕があるうちに対応デバイスを洗い出し、ファームウェア更新の計画を立てておくことを強くお勧めする。元記事: Secure Boot playbook for certificates expiring in 2026

Windows

Microsoft、Windows 11の大規模改善を正式発表——タスクバー移動・Copilot縮小・File Explorer高速化など

Microsoft、Windows 11の「長年の不満」にようやく正面から向き合う Microsoftは、Windows 11に対してユーザーが長年にわたって指摘してきた問題点を解消する大規模なアップデートを正式に発表した。2026年4月以降、Windows Insider Program（ベータテストプログラム）を通じて段階的に提供される予定だ。主な改善点タスクバーの移動が可能に Windows 11でもっとも批判を受けてきた仕様変更のひとつが、タスクバーを画面の上部や左右に移動できなくなった点だった。Windows 10では自由に配置できたこの機能が、Windows 11では廃止されていた。今回の発表では、この要望に応える形でタスクバーの移動機能が復活する見込みだ。 Copilot統合の大幅縮小 Windows 11ではAIアシスタント「Copilot（コパイロット）」がOSに深く組み込まれ、意図しない場面で起動するなどとして不満の声が多かった。今回の改善では、CopilotのOS統合が大幅に縮小される。AIを積極的に活用したいユーザーには引き続きオプションとして提供しつつ、不要なユーザーへの押しつけを減らす方向に舵を切った形だ。 File Explorerの高速化ファイル管理の要であるFile Explorer（ファイルエクスプローラー）のパフォーマンス改善も発表された。大量のファイルを扱う業務ユーザーやクリエイターにとって、体感できるレベルでの速度向上が期待される。広告の削減スタートメニューやエクスプローラー内に表示される推奨アプリや広告についても削減が予定されている。有料OSでの広告表示はかねてより批判が強く、今回の対応はユーザーの声を反映したものといえる。「Microslop」批判への回答ネット上では品質低下を揶揄して「Microslop（マイクロスロップ）」と呼ぶ声も一部で見られるほど、Windows 11への批判は根強かった。今回の発表はそうした声への直接的な回答とも受け取れ、Microsoftがユーザー体験の改善を最優先課題として位置づけたことを示している。展開スケジュール改善は2026年4月以降、まずWindows Insiderチャンネル経由で提供が開始され、その後一般ユーザーへ段階的に展開される予定だ。日本国内のユーザーも同時期に利用できるとみられる。長年のフラストレーションに応える今回の大型改善が、Windows 11の評価を大きく塗り替えるか、今後の展開が注目される。元記事: Microsoft announces major Windows 11 updates designed to fix biggest flaws

Azure

AKS、Ubuntu 24.04が正式対応＆ブルーグリーンノードアップグレードがプレビュー公開

AKS、Ubuntu 24.04 GAとブルーグリーンアップグレードで運用の幅が広がる Microsoftは2026年3月、Azure Kubernetes Service（AKS）において複数の重要なアップデートを発表した。なかでも注目は、Ubuntu 24.04のGA（一般提供）昇格と、ブルーグリーン方式のノードプールアップグレードのパブリックプレビュー開始の2点だ。 Ubuntu 24.04がKubernetes v1.32以降の標準ノードOSに Ubuntu 24.04（Noble Numbat）が、Kubernetes v1.32以降を使用するAKSクラスターの標準ノードOSとして正式採用された。主な改善点は以下のとおり。 Containerd 2.0同梱: コンテナランタイムが最新世代に刷新され、起動速度と安定性が向上起動時間の短縮: ノードの起動プロセスが最適化され、スケールアウト時のレイテンシが改善カーネルハードニング強化: セキュリティ設定がデフォルトで強化されており、本番環境への適用が安心しやすくなった Ubuntu 20.04から22.04への移行でつまずいた経験を持つ組織にとっても、今回は標準パスとして提供されるため、スムーズな移行が期待できる。ブルーグリーンアップグレードで無停止運用が現実的にこれまでノードプールのアップグレード中は断続的なワークロード影響が生じることがあったが、ブルーグリーン方式の導入によって状況が大きく変わる。ブルーグリーンアップグレードでは、既存のノードプール（Blue）を稼働させたまま、新しいバージョンのノードプール（Green）を並行して立ち上げ、切り替えを行う。移行が完了するまでBlue側はトラフィックを受け持ち続けるため、アップグレード中のダウンタイムをほぼゼロに抑えられる。この手法は、金融・医療・ECなど可用性要件の高い本番環境での採用が特に期待される。現在はパブリックプレビュー段階であり、正式採用前に検証環境での試験を推奨する。その他の主なアップデート Kubernetes新パッチ版の提供開始: v1.32.11、v1.33.7、v1.34.3が利用可能に KubernetesLTS版v1.28の非推奨化: サポート対象バージョンへの移行を早急に検討すること Azure Linux、GPU対応を拡充: NVIDIA A100・H100・H200 VMもサポート対象に OpenTelemetry（OTLP gRPC）のパブリックプレビュー: Azure Monitorとの連携がより柔軟に Ciliumをv1.18.6に更新: CVE-2025-64715およびCVE-2026-26963に対処 FlatcarコンテナLinuxの廃止予告: 2026年6月8日にプレビュー終了。移行計画が必要まとめ AKSはUbuntu 24.04の正式採用でセキュリティと性能の基盤を強化しつつ、ブルーグリーンアップグレードで運用時の柔軟性を大幅に高めた。Kubernetes v1.28のEOLも控えており、クラスターのバージョン管理を早めに見直しておきたいタイミングだ。元記事: Azure Kubernetes Service: Ubuntu 24.04 GA and Blue-Green Node Pool Upgrade Preview

Azure

Microsoft Foundry「Priority Processing」がGA——プロビジョニング不要でSLA保証のAI推論を実現

Microsoft Foundry、遅延に敏感なAIワークロード向け「Priority Processing」を正式提供開始 Microsoftは、クラウドAI開発プラットフォーム「Microsoft Foundry（旧Azure AI Foundry）」において、Priority Processing（優先処理）機能の一般提供（GA）を発表した。リアルタイム性が求められるAIアプリケーションのレスポンスタイムを大幅に改善する新機能だ。プロビジョニング不要でSLA保証のパフォーマンス Priority Processingの最大の特徴は、プロビジョニング済みスループット（PTU）を事前確保しなくても、SLA（サービスレベルアグリーメント）に裏付けられたパフォーマンスが得られる点にある。従来、AIモデルの安定した推論速度を確保するにはPTUの事前購入が必要だった。これはコストと計画の両面で企業にとって負担となっていた。Priority Processingはこの制約を取り除き、従量課金モデルのまま優先的なリソース割り当てを受けられる仕組みを提供する。チャットbotからコパイロットまで——インタラクティブAI体験に最適この機能が特に威力を発揮するのは、ユーザーがリアルタイムで操作するシナリオだ。具体的には以下のようなユースケースが想定される：カスタマーサポートチャットbot — 問い合わせへの即時応答 AIコーディングアシスタント — コード補完や提案のリアルタイム表示コパイロット型アプリケーション — ドキュメント作成支援や検索拡張生成（RAG）音声AIエージェント — 自然な会話フローを維持するための低レイテンシー処理 Adobe・Harveyなど先進企業がすでに導入 GA前のアーリーアクセス段階から、すでに複数の有力企業が本機能を採用している。クリエイティブソフトウェア大手のAdobeは、AIを活用したデザインツールの操作感改善に活用。リーガルテック企業のHarveyは、法律専門家向けAIアシスタントの応答性向上に役立てている。両社とも「ユーザーが体感できるレベルでの応答速度改善が確認できた」とコメントしており、インタラクティブなAI体験の品質向上に直結する機能として評価されている。日本企業への影響国内でも、Azure OpenAI ServiceやMicrosoft Foundryを活用したAIソリューション導入が急速に広がっている。カスタマーサポートの自動化や社内向けコパイロット構築を進める企業にとって、追加のインフラ投資なしにエンドユーザー体験を向上できるPriority Processingは、ROI改善の観点からも注目に値する機能だ。 Microsoft Foundryのコンソールから即日有効化が可能で、既存のAzure OpenAI Serviceとの統合も容易とされている。元記事: Announcing Priority Processing in Microsoft Foundry for Performance-Sensitive AI Workloads

M365

Microsoft、SharePointの全面刷新を発表——「Discover/Publish/Build」の3軸に再設計、AI機能も統合

MicrosoftがSharePointの新UIを段階展開中——3年ぶりの大型刷新 Microsoftは2026年3月3日より、Microsoft 365上のSharePointを全面的にリデザインした「New SharePoint Experience」のパブリックプレビューを開始した。コラボレーション基盤として長年使われてきたSharePointが、より直感的かつAI活用を前提とした形に生まれ変わる。アプリバーを「3つのジョブ」で再設計最大の変化は左側のアプリバーの刷新だ。従来は統一的なナビゲーションが並んでいたが、新UIでは以下の5つのセクションに整理された。 Home — グローバルナビゲーションが有効な場合、企業イントラネットの入口として機能。Viva Connectionsで提供されていた体験がこのHomeサイトに統合される Discover — 従来のSharePointスタートページを置き換え。AIによるアクションで質問したり、フォロー中のサイトのアップデートをキャッチアップできる Publish — コミュニケーションサイトやニュース発信などのコンテンツ公開に特化 Build — ビジネスソリューションやカスタムアプリの構築に特化 OneDrive — 個人ファイル管理なお、グローバルナビゲーションが設定されていない場合はHomeではなくDiscoverが最初のアイコンとして表示される。 AI機能はCopilotライセンスが必要新UIにはAI連携ツールが統合されているが、利用にはMicrosoft 365 Copilotライセンスが必要となる点は注意が必要だ。SharePoint Admin Agentなど、管理者向けのAI支援機能も追加される予定。日本企業でCopilotライセンスを導入済みの組織にとっては、SharePointがより実用的なナレッジハブとして機能するようになる。展開スケジュールフェーズ時期パブリックプレビュー 2026年3月3日〜3月中旬ターゲットリリース 2026年4月末〜5月初旬一般提供（GA） 2026年5月初旬〜5月末有効化の方法新UIはデフォルトでは無効。SharePoint管理者またはグローバル管理者がSharePoint管理センターから手動で有効化する必要がある。手順は以下のとおり。 SharePoint管理センターにアクセス「設定 → SharePoint → New SharePoint experience」に移動「Enable the new SharePoint experience」チェックボックスをオン保存有効化後、ユーザーはアプリバー下部の「New SharePoint」トグルで新旧UIを切り替え可能。プレビュー期間中はいつでも旧UIに戻せる。旧「Featured Links」機能は2026年6月末に廃止新UIへの移行に伴い、旧来の「Featured Links」機能は2026年6月末に廃止予定。現在この機能を活用しているイントラネット担当者は、早めに新UIへの移行計画を立てておく必要がある。現在はプレビュー段階のため、本番環境への適用は一般提供開始後が推奨される。元記事: Microsoft introduces New SharePoint Experience

M365

Microsoft 365 Copilot「Wave 3」発表——ドキュメント内直接編集・カスタムエージェント構築でAIが「補助」から「自律」へ

Microsoftは「Microsoft 365 Copilot Wave 3」を発表し、AIアシスタントの役割を「補助（Assistance）」から「自律（Agency）」へと明確に転換させる新機能群を公開した。 Wave 3の主な新機能ドキュメント内での直接生成・編集これまでCopilotはサイドパネルやチャット経由でしか操作できなかったが、Wave 3ではWordやExcelなどのドキュメント内でコンテンツを直接生成・編集・改善できるようになる。ユーザーが文書を開いたまま、Copilotがその場でドラフトを書き換えたり、表を整形したりといった操作が可能になる。カスタムエージェントのキャンバス構築注目の新機能が「エージェントビルダー」だ。ユーザーはコードを書かずに、自分専用のAIエージェントをキャンバス上で構築できる。繰り返し発生する業務フロー——たとえば週次レポートの集計や、問い合わせメールの仕分け・返信——をエージェントとして定義しておけば、Copilotが自律的に処理を進める。「つまらない仕事」からの解放 Microsoftが今回のWave 3で強調しているのは、日常業務の中で最も退屈な作業をCopilotに委ねるというコンセプトだ。単なる質問応答ツールではなく、タスクを「任せきれる」エージェントとして機能させることで、ナレッジワーカーの生産性を底上げすることを目指している。「Wave」戦略で段階的に進化 MicrosoftはCopilotの機能強化を「Wave」と呼ばれるフェーズ単位でリリースしてきた。Wave 1でCopilotをMicrosoft 365アプリに統合し、Wave 2でプラグインやGraph Connectorによる外部データ連携を強化。そして今回のWave 3ではエージェント化が中心テーマとなる。日本企業においても、Microsoft 365のCopilotライセンスを導入済みの組織は増加傾向にある。Wave 3の機能が一般提供（GA）されれば、業務自動化の文脈で活用する企業が加速するとみられる。今後の展開 Wave 3の各機能は順次ロールアウト予定とされており、詳細なリリーススケジュールはMicrosoft 365管理センターのメッセージセンターを通じて通知される。エージェント機能はまず一部のテナントへのプレビュー提供から始まる見込みだ。 AIが「答える」だけでなく「動く」存在へと進化するCopilotの今後に、引き続き注目したい。元記事: Microsoft 365 Copilot “Wave 3” expands with more agentic AI control, eager to offload your most boring workloads

M365

Microsoft 365 E7「Frontier Suite」発表——AIエージェント時代のエンタープライズ向け統合SKU、月額$99で5月提供開始

Microsoft、AIエージェント統合の最上位プラン「Microsoft 365 E7 Frontier Suite」を発表 Microsoftは2026年3月9日、エンタープライズ向けの新たな最上位ライセンスプラン「Microsoft 365 E7 Frontier Suite」を発表した。2026年5月1日より、月額**$99/ユーザー**（年間契約）での提供が開始される予定だ。何が含まれるのか Frontier Suiteは、これまで個別に契約・管理する必要があった複数の主要プロダクトを一つのSKU（製品単位）にまとめたものだ。具体的には以下が含まれる。 Microsoft 365 E5 — エンタープライズ向けOfficeアプリ・セキュリティ・コンプライアンス機能のフル構成 Microsoft 365 Copilot — Word、Excel、Teams等に統合されたAIアシスタント機能 Agent 365 — 自律型AIエージェントをエンタープライズ環境で展開・管理するための新プラットフォーム Microsoft Entra Suite — ID管理・ゼロトラストアクセス・権限管理の統合スイートこれらを個別に契約した場合の合計コストと比較すると、Frontier Suiteは企業にとってコスト効率の高い選択肢となる可能性が高い。「Intelligence + Trust」というコンセプト製品名のサブタイトルにある「Intelligence + Trust（インテリジェンスと信頼）」は、Microsoftが強調する2つの柱を象徴している。AIによる業務効率化（Intelligence）と、エンタープライズが求めるセキュリティ・コンプライアンス・ガバナンス（Trust）を両立させることが、このスイートの設計思想だ。特にAgent 365の組み込みは今回の目玉であり、AIエージェントが単なる「チャットボット」を超えて業務プロセスを自律的に実行する時代への本格移行を示している。承認フローの自動化、データ分析の自動実行、クロスシステムの連携など、企業内の反復的なタスクをエージェントに委任できる環境が整う。日本企業への影響日本のMicrosoft 365ユーザー企業にとっても、このプランは無関係ではない。現在M365 E3やE5を利用している企業が、CopilotやEntra Suiteを追加導入しようとしている場合、Frontier Suiteへの移行がコスト・管理面で合理的な選択となりうる。ただし、月額$99（日本円換算で約15,000円前後）は相応のコストであり、特に中小規模の企業には導入ハードルが高い面もある。Microsoftがどのような移行支援策を打ち出すかも今後の注目点だ。今後のスケジュール提供開始は2026年5月1日。現在のM365契約からの移行パスや詳細な価格体系については、Microsoftの公式ドキュメントおよびパートナー経由での確認が推奨される。AIエージェントの本格活用を検討している企業は、このタイミングでライセンス戦略を見直す価値がありそうだ。元記事: Introducing the First Frontier Suite built on Intelligence + Trust

生成AI

Hugging FaceがHub全体をGit LFSからXetストレージへ移行——100万ユーザーを無停止で静かに移行した方法

Hugging Face、Hub全体をGit LFSからXetへ——20PBの静かな大移行 AIモデルのホスティングプラットフォームとして世界最大規模を誇るHugging Faceが、Hubのストレージ基盤を従来のGit LFS（Large File Storage）から自社開発のXetへと移行完了したことを発表した。移行の規模感 2025年1月に始まった移行プロジェクトは、わずか6ヶ月で以下の規模に達した。移行済みリポジトリ数: 50万件超移行データ量: 約20PB（ペタバイト）利用ユーザー数: 100万人以上報告されたGitHub Issue・フォーラム投稿: 数十件程度これほどの規模の移行にもかかわらず、ユーザーからの問い合わせがほとんどなかったことは注目に値する。2025年5月には新規ユーザーおよび組織に対してXetがデフォルトストレージとして採用されている。なぜGit LFSでは限界だったのか Git LFSはもともとソフトウェア開発用に設計されたファイルサイズ拡張の仕組みであり、数百GBから数TB級のAIモデルファイルを大量に扱うユースケースには設計思想が合わなかった。Xetはこれに対してコンテンツアドレス型ストレージ（CAS: Content Addressed Store）を採用し、ファイルをチャンク単位で管理することで重複排除・高速転送・並列ダウンロードを実現している。無停止移行を支えた2つの仕組み移行の成功を支えたのは、以下の2つの内部コンポーネントだ。 1. Git LFS Bridge 旧来のhuggingface_hubやhuggingface.jsなど、Xet非対応のクライアントが既存のAPIエンドポイント（/resolve）にアクセスした際、BridgeがXet側のチャンクデータをS3から再構成し、通常のLFSプロトコルと同じ形式のプリサインドURLとして返す。つまり、クライアント側でアップデートなしにシームレスにXet対応リポジトリのファイルへアクセスできる。 2. バックグラウンドコンテンツ移行非対応クライアントがファイルをアップロードすると、まずLFSストレージに保存され、その後バックグラウンドで自動的にXetへ移行される。この仕組みにより、「一斉切り替え（ハードカットオーバー）」を避け、既存ワークフローを壊さずに段階的移行が実現できた。設計の哲学チームが最初に定めた原則は明快だった。ハードカットオーバーは行わない XetとLFSファイルが1つのリポジトリに混在してよい移行中もダウンロード・アップロードをロックしないこれはユーザーへの影響ゼロを最優先にした判断であり、結果として多くのユーザーが移行に気づかないまま恩恵を受けることになった。技術スタックの補足 XetのクライアントライブラリはRust製で実装されており、hf-xetとして提供されている。Xet対応クライアントはファイルをコンテンツ定義チャンキング（Content Defined Chunking）で分割してアップロードし、ダウンロード時はCASからチャンク範囲情報を取得してS3から直接再構成する。ファイルメタデータの管理にはDynamoDBが使われている。今後の展開 Hugging Faceはこの移行をまだ「始まり」と位置づけており、今後数週間・数ヶ月でさらに積極的な移行を進めるとしている。日本のAI開発コミュニティにも広く普及しているHugging Face Hubだけに、大規模モデルのダウンロード速度改善など実質的なメリットが今後より顕著になってくるだろう。元記事: Migrating the Hub from Git LFS to Xet

生成AI

GradioのMCPサーバーが大幅強化——ローカルファイル対応・リアルタイム進捗通知など5つの新機能

HuggingFaceが開発するオープンソースのAI Webアプリフレームワーク「Gradio」が、バージョン5.38.0においてMCP（Model Context Protocol）サーバー機能を大幅に強化した。GradioはHugging Face Spaces上で数千ものMCPサーバーをホストしており、LLMエージェントとの連携基盤として急速に普及しつつある。今回のアップデートで追加された5つの主要改善点を紹介する。 1. ローカルファイルのシームレスな対応リモートのGradio MCPサーバーに画像・動画・音声ファイルを渡す際、従来はファイルを公開URLでアクセスできる場所にホストする必要があり、手間のかかる手動作業が発生していた。 Gradio 5.38.0では「File Upload MCPサーバー」が新たに追加され、エージェントがファイルを直接Gradioアプリにアップロードできるようになった。ファイル入力を必要とするツールがある場合、接続ドキュメントに自動でファイルアップロードサーバーの起動方法が表示される。 2. リアルタイムの進捗通知画像生成や動画処理など、処理に時間がかかるAIタスクでは、完了まで待ち続けるしかなかった。新バージョンではGradioがMCPクライアントへ進捗通知をストリーミング配信するようになり、処理状況をリアルタイムに確認できる。MCPツール開発者向けのガイドも提供されており、独自ツールへの実装も容易だ。 3. OpenAPI仕様を1行でMCPに変換既存のバックエンドAPIをLLMと連携させる際、これまでは各エンドポイントをMCPツールに手動でマッピングする必要があり、時間と手間がかかっていた。新機能「gr.load_openapi」を使えば、OpenAPI（REST APIの機械可読仕様標準）のスキーマを指定するだけで、Gradioアプリが自動生成される。さらにmcp_server=Trueを指定して起動するだけで、既存APIがMCPサーバーに早変わりする。元記事: Five Big Improvements to Gradio MCP Servers

生成AI

Hugging Face CLIが「hf」に刷新——より速く、より使いやすいコマンド体系へ

Hugging Face CLIが「hf」に生まれ変わった Hugging Faceは、同社のコマンドラインツール（CLI）を正式に huggingface-cli から hf へ改名したと発表した。長年にわたって開発者から待望されていたこの変更は、単なる名前の短縮にとどまらず、コマンド体系全体の整理・再設計を伴うものだ。なぜ改名されたのか huggingface-cli というコマンド名は、日常的に打ち込むには冗長すぎるという不満が根強かった。それ以上に大きな問題は、アップロード、ダウンロード、キャッシュ管理、リポジトリ管理など機能が追加されるにつれ、コマンド体系が雑然としてしまっていた点にある。新しいCLIは hf <resource> <action> という構文を採用。この「リソース → アクション」という予測可能な文法は、GitやDockerなど多くの開発者が慣れ親しんだパターンに倣ったものだ。コマンドの発見性が高まり、ヘルプを確認しながら直感的に操作を進められる。インストールと基本的な使い方最新版の huggingface_hub をインストールするだけで hf コマンドが使えるようになる。元記事: Say hello to hf: a faster, friendlier Hugging Face CLI ✨

生成AI

PythonでMCPサーバーを実装：GradioとAIで作るバーチャル試着ショッピングアシスタント

GradioのMCP統合でLLMに「超能力」を与える Python開発者にとって、LLM（大規模言語モデル）に外部ツールを持たせる方法の選択肢が増えてきた。Hugging Faceが公開したブログ記事では、オープンソースライブラリ「Gradio」のMCP（Model Context Protocol）統合を活用し、LLMからHugging Face Hub上の何千ものAIモデルを直接呼び出せるようにする仕組みが紹介されている。 MCPサーバーをGradioで簡単に実装 GradioのMCP統合が注目される理由の一つは、その実装のシンプルさだ。主な特徴として以下が挙げられる。 Python関数の自動変換: Gradioアプリの各APIエンドポイントは、MCPツールとして自動的に変換される。関数のdocstringがツールの説明文やパラメータ定義として活用されるリアルタイム進捗通知: 処理状況をMCPクライアントへストリーミング通知する機能が組み込み済みで、開発者側での実装が不要ファイルアップロードの自動処理: 公開URLや複数のファイル形式に対応したアップロード処理もサポート実装例：AIスタイリストで洋服を試着ブログ記事では具体的なユースケースとして「AIショッピングアシスタント」が紹介されている。オンラインショッピングで服を選ぶ際の「試着の手間」をAIが代替するという発想だ。このシステムは3つのコンポーネントで構成される。 IDM-VTON（拡散モデル）: 既存の人物写真に対して、別の衣服を着ているように見せるバーチャル試着AIモデル。Hugging Face Spaceで公開されている Gradio: MCPサーバーとして機能し、LLMとIDM-VTONモデルをつなぐブリッジ役 VS Code AIチャット: 任意のMCPサーバーを追加できるVS Codeの組み込みAIチャットをUIとして利用中核となるGradio MCPサーバーでは、vton_generationという関数を1つ定義するだけでよい。この関数は人物モデルの画像と衣服の画像を受け取り、IDM-VTONモデルを呼び出して試着結果の画像を生成する。元記事: Implementing MCP Servers in Python: An AI Shopping Assistant with Gradio

生成AI

OpenAIがオープンソースモデル「GPT OSS」を公開——117Bと21BのMoEモデル、Apache 2.0ライセンスで

OpenAI、待望のオープンソースモデル「GPT OSS」をリリース OpenAIが、オープンウェイト（重みを公開）のモデルファミリー「GPT OSS」を公開した。Hugging Faceのブログで発表されたこのリリースは、OpenAIがオープンソースエコシステムへ本格参入するという観点から、AI業界で大きな注目を集めている。 2種類のモデル構成 GPT OSSは以下の2モデルで構成される。 gpt-oss-120b：総パラメータ数117B（約1,170億）、アクティブパラメータ5.1B gpt-oss-20b：総パラメータ数21B（約210億）、アクティブパラメータ3.6B どちらも混合エキスパート（Mixture-of-Experts、MoE）アーキテクチャを採用しており、推論時に全パラメータを使用しないため、計算効率が高い。さらにMXFP4形式の4ビット量子化を適用することで、メモリ使用量を大幅に削減している。大型モデルのgpt-oss-120bはNVIDIA H100（80GB VRAM）1枚に収まり、小型のgpt-oss-20bは16GBのメモリで動作する。これはコンシューマー向けGPUや、エッジ・オンデバイスでの活用を強く意識した設計だ。日本国内でも手元のGPUサーバーや開発用PCで動かせる可能性が広がる。アーキテクチャの特徴 Token-choice MoEにSwiGLU活性化関数を組み合わせた構造各アテンション層にRoPE（回転位置エンコーディング）を採用、コンテキスト長は128K フルコンテキストとスライディングウィンドウ（128トークン）のアテンション層を交互に配置 GPT-4oと同じトークナイザーを使用（Responses API互換の新トークンも追加）推論能力（Chain-of-Thought）と推論努力レベルの調整に対応 Apache 2.0ライセンスと利用ポリシーライセンスはApache 2.0を採用しており、商用利用・改変・再配布が原則として自由に行える。付随する利用ポリシーは「適用法規の遵守」を求めるにとどまり、Meta LlamaシリーズのようなユーザーカウントによるTierや、Mistralの各種制限と比べてもシンプルな内容となっている。 OpenAIは「AIの恩恵を広く利用可能にする」というミッションに沿ったリリースと位置づけており、プライベートデプロイや社内ローカル環境での活用ニーズに応える狙いがある。推論・ファインチューニング環境主要な推論フレームワークはすでに対応済みだ。 transformers（Hugging Face） vLLM llama.cpp ollama Hugging FaceのInference Providers経由でAPIアクセスも可能で、CerebrasなどのプロバイダーをPython・JavaScriptから利用できる。また、Azure・DellなどのパートナーへのデプロイメントもHugging Faceプラットフォーム上でサポートされている。オープンソースAIの競争激化 Meta（Llama）、Mistral AI、Google（Gemma）などが先行するオープンソースモデル市場にOpenAIが参入したことで、競争はさらに活発化する見込みだ。特にApache 2.0という最も制約の少ないライセンスを選択した点は、企業・研究機関の双方にとって利用しやすい環境を整えるという強いメッセージとなっている。モデルは現在Hugging Face Hub上で公開されており、すぐに試せる状態にある。元記事: Welcome GPT OSS, the new open-source model family from OpenAI!

生成AI

複数GPU並列学習を簡単に組み合わせ可能に——HuggingFace「Accelerate ND-Parallel」詳解

大規模モデル訓練の複雑さを一気に解消 Hugging Faceは、マルチGPU環境での大規模モデル訓練を抜本的に簡略化する「Accelerate ND-Parallel」を発表した。データ並列（DP）、テンソル並列（TP）、コンテキスト並列（CP）、完全シャーディングデータ並列（FSDP）といった複数の並列化戦略を、わずか数行のコードで自由に組み合わせられる。従来の課題：並列化戦略の組み合わせは職人技だった数十億〜数百億パラメータ規模のLLM（大規模言語モデル）を複数GPUで訓練する場合、単一の並列化手法では対応しきれないケースが多い。たとえばデータ並列だけではGPUメモリの壁を突破できず、モデル並列だけでは通信オーバーヘッドが増大する。これらを効率よく組み合わせるには、高度な分散システムの知識が必要だった。 ParallelismConfig で並列度を宣言的に設定 ND-Parallelの核心は ParallelismConfig クラスだ。以下のように各並列化戦略の「次元数（degree）」を宣言するだけで、Accelerateが内部のデバイスメッシュを自動構築する。元記事: Accelerate ND-Parallel: A guide to Efficient Multi-GPU Training

生成AI

Hugging Face、コード不要でデータセットをAI処理できる「AI Sheets」をオープンソースで公開

Hugging Face、ノーコードAIデータ処理ツール「AI Sheets」を公開 Hugging Faceは2025年8月8日、データセットの構築・変換・エンリッチメントをコードなしで実行できるオープンソースツール「AI Sheets」を公開した。スプレッドシートライクなUIで、Hugging Face Hub上の数千のオープンモデルやOpenAIのgpt-ossなどを活用したデータ処理パイプラインを手軽に構築できる。スプレッドシート感覚でAIを活用 AI Sheetsの操作感はExcelやGoogle スプレッドシートに近い。新しい列を追加するとき、数式の代わりにプロンプトを書くだけでAIが処理を実行する。たとえば{{text}}のようにカラム名をテンプレート変数として埋め込むことで、各行のデータを参照した動的な処理が可能だ。処理結果のセルを手動で編集・承認することで、その編集内容がプロンプトのFew-shotサンプルとして自動的に追加される仕組みも備える。いわばプロンプトを対話的にチューニングしながらデータセット全体に適用していく、という開発体験を提供する。主なユースケース Hugging Faceが想定するユースケースは幅広い。モデル比較（Vibe Test）: 複数モデルの出力列を並べてLLM-as-a-Judgeで自動評価プロンプト改善: 顧客リクエスト処理など実務シナリオのプロンプトを実データで反復改善データ変換・クレンジング: 余分な句読点を除去する、フォーマットを統一するなど分類・分析: テキストのカテゴリ分類や主要アイデアの抽出データエンリッチメント: 住所から郵便番号を補完するなど（Webサーチ連携も可）合成データ生成: プライバシー上の理由で実データが使えない場合の代替データ作成ローカル実行とHub上での利用の両方に対応インストール不要でブラウザから即試せるHugging Face Spaces版に加え、GitHubリポジトリからローカル環境にデプロイすることも可能だ。モデルはHugging Face Hub経由のInference Providersか、ローカルモデルを選択できる。日本語データセット開発への応用も日本国内でも、LLMの評価ベンチマーク作成や日本語コーパスのクリーニング、社内向け合成データ生成など、機械学習エンジニアやデータサイエンティストが直面する「データ準備」の工程を大幅に省力化できるツールとして注目される。コードを書かずにAIを活用したデータパイプラインを組めるため、MLエンジニア以外のドメイン専門家でも扱いやすい点が特徴だ。ソースコードはGitHubで公開されており、オープンソースコミュニティからの貢献も受け付けている。元記事: Introducing AI Sheets: a tool to work with datasets using open AI models!

生成AI

ExecuTorch 0.7でジェネレーティブAIが「3年前のスマホ」でも動く時代へ――Arm KleidiAIの自動最適化が変えるエッジAIの常識

「最新フラッグシップだけのもの」という常識が崩れるスマートフォン上でLLM（大規模言語モデル）を動かすと聞けば、最新ハイエンド機の強力なCPU・GPU・NPUを思い浮かべるのが自然だろう。しかし、Armと Meta が共同で進める ExecuTorch 0.7 の登場により、その前提が大きく揺らいでいる。発売から3〜5年が経過したAndroidデバイスや、シングルボードコンピュータの定番 Raspberry Pi 5 でさえ、Llama 3.2を実用的な速度で動かせるようになってきたのだ。カギを握る「SDOT命令」――2015年から静かに普及していた技術今回の躍進を支えるのが、SDOT（Signed Dot Product）命令だ。Armv8.2アーキテクチャで導入されたこの命令は、8ビット整数ベクトルのドット積演算を効率よく実行できる。LLMの推論処理の大半を占める行列乗算は、内部的に膨大なドット積の繰り返しで成り立っており、SDOTはまさにその中核を加速する。 SDOTは実は2015年から順次Arm CPUに搭載されており、現時点で約30億台のArmベースデバイスが対応済み。全デバイスの72%がすでにこの命令をサポートしている計算になる。「最新チップ専用の機能」ではなく、手元にある大多数のスマートフォンに眠っていた能力だ。 KleidiAI × ExecuTorchで「設定不要の高速化」を実現 ArmのAIアクセラレーション層である KleidiAI は、XNNPack・MediaPipe・MNN・ONNX Runtime・llama.cppといった広く使われるEdge AIフレームワークに組み込まれ、開発者がコードを変更することなく性能向上を届けてきた。そのKleidiAIが、次期 ExecuTorch 0.7ベータ版でデフォルト有効化される。AndroidおよびクロスプラットフォームのアプリはExecuTorchとXNNPack経由でKleidiAIの最適化を自動的に享受でき、モデルの起動高速化・低レイテンシー・メモリフットプリント削減が「箱から出してすぐ」手に入る。昨年公開の量子化Llama 3.2 1Bでは、I8MM機能（Armv8.6以降）を活用したInt4行列乗算の最適化により、Galaxy S24+においてKleidiAI非適用比でプリフィル性能が20%以上向上した実績がある。数値に換算すると、プリフィル時に毎秒350トークン超、デコード時に毎秒40トークン超という水準で、未読メッセージの要約といったオンデバイスタスクをスムーズにこなせる性能だ。日本市場への示唆日本でも中古スマートフォン市場は拡大しており、数年前のAndroidデバイスを使い続けるユーザーは少なくない。ExecuTorch 0.7の登場は、こうしたデバイスでもプライバシー保護・オフライン動作・低遅延というオンデバイスAIの恩恵を受けられる可能性を広げる。IoT・産業機器向けにRaspberry Piを活用している現場にとっても、クラウドAPI不要で動くLLMの実装コストが大幅に下がることを意味する。まとめ ArmのKleidiAIとExecuTorchの統合は、ジェネレーティブAIの「動作する土台」を一気に広げる可能性を秘めている。性能競争が続くハイエンド端末だけでなく、すでに世界中に出回っている数十億台のデバイスをAIの活用フィールドに変える動き——その第一歩として、ExecuTorch 0.7のリリースは注目に値する。元記事: Arm & ExecuTorch 0.7: Bringing Generative AI to the masses

生成AI

AIを研究ツールに接続する「MCP for Research」— arXiv・GitHub・Hugging Faceを自然言語で横断検索

研究者の「プラットフォーム渡り歩き」問題をAIが解決学術研究では、論文を探すだけでなく、その実装コードやデータセット、関連モデルを複数のプラットフォームで横断的に調べる作業が欠かせない。arXivで論文を見つけ、GitHubで実装を探し、Hugging Faceで学習済みモデルを確認する——この繰り返しが研究者の時間を大量に奪っていた。 Hugging Faceが2025年8月に公開したブログ記事では、Model Context Protocol（MCP）を使ってAIをこれらの研究ツールに接続し、自然言語だけで横断的な文献調査を自動化するアプローチが紹介されている。 3段階の抽象レイヤー：手作業→スクリプト→MCP ブログでは、研究発見（Research Discovery）の自動化を3段階の抽象レイヤーとして整理している。第1層：手動リサーチ最も原始的な方法。論文をarXivで探し、著者名でGitHubを検索し、引用文献を手でたどる。体系的な文献調査には向かず、複数の研究スレッドを同時追跡するのはほぼ不可能だ。第2層：スクリプト自動化 PythonスクリプトでAPIを叩き、メタデータを収集・整理する。手動よりはるかに速いが、API仕様の変更やレートリミット、パースエラーで無音のまま失敗しやすく、人間の監視が必須だ。第3層：MCP統合 MCPは同じPythonツールをAIシステムから自然言語経由で呼び出せるプロトコル。たとえば「過去6カ月に公開されたTransformerアーキテクチャ論文で、実装コードと学習済みモデルが公開されているものを探して」と指示するだけで、AIが複数ツールを組み合わせて情報を収集・統合・評価してくれる。この第3層は「ソフトウェア3.0」的な発想とも言え、自然言語が実装言語になる世界を体現している。セットアップ方法 Hugging Faceは「Research Tracker MCP」を公式に提供しており、設定は簡単だ。 huggingface.co/settings/mcp にアクセス「research-tracker-mcp」を検索して追加 Claude Desktop、Cursor、Claude Code、VS Codeなど使用するクライアントに合わせてセットアップ注意点：万能ではない MCPによる自動化にも限界はある。スクリプト自動化と同様、人間の監視なしではエラーが起きやすく、実装品質によって結果の精度が大きく変わる。手動→スクリプト→MCPという下層の仕組みを理解しているほど、より良い活用ができると著者は強調している。なお、MCPはAnthropicが策定したオープン標準で、日本でもClaude CodeやCursorユーザーを中心に急速に普及しつつある。研究者だけでなく、情報収集を日常的に行うエンジニアやアナリストにとっても実用性の高い仕組みだ。元記事: MCP for Research: How to Connect AI to Research Tools