MicrosoftはBuild 2026(6月2〜3日、サンフランシスコFort Mason Center)において、Copilot+ PCのNPU(Neural Processing Unit)向けに最適化したオンデバイスAIモデル群をサードパーティ開発者へ開放することを正式に発表した。Windows AI Studio APIを通じた端末ローカル処理の実現に加え、社内製推論モデル「Project Athena」のお披露目、およびWindows 365 Developer Configurationのパブリックプレビュー開始も発表され、WindowsをAIオペレーティングシステムとして再定義する姿勢が鮮明になった。

NPUネイティブAI:オフラインで動くWindows AI基盤

Build 2026の最大の焦点は、Windows Copilot RuntimeのAPIをサードパーティアプリへ全面開放する点にある。Win32・UWP・WinUI 3アプリがWindows AI Studio APIを通じ、オンデバイスの言語理解・画像生成・リアルタイム音声書き起こしを数行のコードで呼び出せるようになる。データはクラウドに送出されないため、プライバシー保護・低レイテンシ・ランニングコスト削減という三つのメリットを同時に実現する。

対応NPUはQualcomm Snapdragon X・Intel Lunar Lake・AMD Ryzen AI 300シリーズ。Microsoftが公式に言及しているPhi-4-Silicon(38億パラメーター)はNPU向けに最適化した代表モデルで、メール要約や文書整形などをローカルで処理する。用途別に複数サイズのモデルが用意されており、テキスト分類・要約から文脈を踏まえたアプリ操作支援、さらに画像生成やコードデバッグまでカバーする構成だ。

LoRAカスタマイズで「業種特化AI」が現実に

注目すべきはモデルカスタマイズパイプラインの提供だ。合成データ生成とLoRA(Low-Rank Adaptation)を組み合わせ、Azure Machine LearningまたはローカルのWSL環境でベースモデルをファインチューニングできる。完成したアダプターはアプリと同梱してMicrosoft Storeで配布可能になる。

法務契約のレビュー支援・建築設計補助・科学記号の解析といった高度に専門化されたAIアシスタントを、従来のようにクラウドGPUを大量消費せずに提供できる点は、業務アプリ開発者にとって大きな転換点となる。

Project Athena:Microsoft独自の推論モデルが初披露

オンデバイスモデルと並行して、Microsoftは「Project Athena」と呼ばれる社内製推論特化モデルを披露した。複雑なクエリを段階的な推論チェーンに分解し、各ステップを外部知識ベースで検証しながら進めるアーキテクチャで、OpenAI o1やGoogle DeepMind Geminiの推論システムを直接意識した設計だ。Satya Nadella自らデモを行い、Microsoftがクラウドとエッジの両軸でAI能力の自前化を推進する姿勢を印象づけた。

Windows 365 Developer Configuration

開発者向けには、Windows 365 Developer Configuration(パブリックプレビュー)も発表された。クラウドPC上に開発環境を自動構成し、「数分でコーディングを開始できる」状態を提供するというもので、新メンバーのオンボーディングや複数プロジェクト間の環境切り替えでの活用が想定される。

実務への影響

日本のエンジニア・IT管理者が今すぐ動くべき点

1. データ主権の観点でオンデバイスAIを評価する 金融・医療・製造業など、クラウドへのデータ送信に社内規制がある現場では、NPUベースのオンデバイス処理は導入ハードルを大きく下げる。Copilot+ PC調達の意思決定において「NPU活用」を評価軸に加えるべき時期に来た。

2. Windows AI Studio APIを先行評価する Win32アプリが対象に含まれるため、既存のレガシーアプリ資産を活かしたAI化が視野に入る。API公開後は早期にドキュメントを読み、既存の業務アプリへの組み込み可能性を探ること。

3. LoRAカスタマイズのユースケースを洗い出す 業界固有のドメイン知識が求められる業務では、ファインチューニングによる専門化が費用対効果の高い選択肢になりうる。Azure MLの既存環境があれば比較的すぐに試せる体制が整う。

筆者の見解

オンデバイスAIという戦略の方向性は、Microsoftが今後取りうる選択の中でも本質をついていると感じる。プライバシーへの懸念が高まる中、クラウド依存を下げて端末上で完結する処理系を築くのは合理的だ。特に日本の大手エンタープライズは社外データ送信に慎重なケースが多く、この方向性は受け入れられやすいだろう。

Project Athenについては、今はまだデモの段階であり、実際のリリース後の精度・速度・API品質を見て改めて評価したい。「o1や大手モデルに匹敵する推論能力」という話はこれまでも何度か聞いてきたので、今回は実力が伴う形でデリバリーされることを期待している。Microsoftはプラットフォームの厚みとユーザーベースという本来の強みを持っている。NPUを活かしたオンデバイスAIエコシステムの整備はその強みを正面から活かせる戦略だ。絵に描いた餅で終わらず、開発者が実際に使いやすい形でAPIが揃っていくことに期待したい。


出典: この記事は Build 2026: Microsoft’s Windows AI Models, Copilot Super App, and Dev Setup Reset の内容をもとに、筆者の見解を加えて独自に執筆したものです。