NVIDIAとMicrosoftは、2026年6月2日に開催されたMicrosoft Buildにおいて、エージェンティックAIをWindowsデバイスからAzureクラウド、ローカル環境まで一貫して展開できる統合アクセラレーテッドコンピューティングスタックの拡張パートナーシップを発表した。NVIDIAのJensen Huang CEOがSatya Nadella CEOの基調講演に台北からライブ参加するかたちで、両社の本気度を印象づけた。
AIエージェント時代のWindowsを再定義——RTX SparkとDGX Station
今回の発表の目玉のひとつが、NVIDIAの新しいハードウェアラインアップだ。
RTX Sparkは、パーソナルAIエージェント専用として設計されたWindowsPC向けの新プラットフォームだ。1ペタフロップのAI演算性能と最大128GBのユニファイドメモリを搭載しながら、終日バッテリー駆動を実現。電源を抜いてもフルパフォーマンスを維持できる点が特徴で、CUDA、RTX、DLSS、TensorRTといったNVIDIAの30年以上の技術資産をそのまま活用できる。Microsoft Surface、ASUS、Dell、HP、Lenovo、MSIから今秋登場予定だ。
より上位の選択肢としてDGX Station for Windowsも発表された。NVIDIA GB300 Grace Blackwell Ultraデスクトップスーパーチップを搭載し、最大748GBのコヒーレントメモリと20ペタフロップス(FP4)の演算性能を持つ。1兆パラメータ規模のフロンティアモデルをオンプレミス環境で常時稼働させることが可能で、ASUS、Dell、GIGABYTE、HP、MSI、Supermicroから第4四半期に出荷予定とされている。
Microsoft Foundryでオープンモデルのエコシステムを拡大
エンタープライズ向けのエージェンティックAI基盤として、Microsoft Foundry上でのNVIDIAオープンモデルの展開が大幅に拡張された。
注目は新たに公開されたNemotron 3 Ultraだ。長時間推論が必要なコーディング・研究・エンタープライズワークフロー向けに設計されたオープンフロンティア推論モデルで、今月よりFoundry管理コンピュート上で利用可能となる。音声認識向けのNemotron 3.5 ASR、コンテンツ安全性のためのNemotron 3.5 Content Safetyも合わせて提供される。
また、物理AIのためのオムニモデルNVIDIA Cosmos 3(視覚推論・世界シミュレーション・行動生成を統合)や、企業向け気象予測・リスク分析に使えるNVIDIA Earth-2 AIウェザーモデルもMicrosoft Planetary Computer ProおよびFoundry経由で利用可能になる。
さらに、AnthropicのClaudeモデルがNVIDIA GB300 Blackwell UltraシステムのAzure上でネイティブ稼働するようになったことも発表された。数週間以内に顧客向けに提供開始予定とされており、OpenAIやAnthropicのモデルに加え、Hermes特殊エージェントも含めた複数モデルが、Foundry Agent Serviceのホスト型エージェントとして統合アイデンティティ・ガバナンス付きで利用できるようになる。
セキュリティバイデザインのエージェントランタイム「OpenShell」
見落とせないのがNVIDIA OpenShellの存在だ。自律型エージェントのための「セキュリティバイデザイン」なランタイムとして設計されており、GitHub CopilotおよびRTX Spark・DGX Station for Windowsの両方に組み込まれる。エージェントが長時間稼働・自律判断するようになった場合のセキュリティ境界をランタイムレベルで担保しようとする試みで、エンタープライズ展開における信頼基盤として機能することが期待されている。
実務への影響
日本のエンジニア・IT管理者にとって、この発表にはいくつかの実務的な示唆がある。
クラウド一択からの脱却が現実的に: RTX SparkやDGX Stationの登場により、AIエージェントのオンプレミス・エッジ実行が現実的な選択肢になってきた。クラウドレイテンシやデータ主権の観点からハイブリッド構成を検討している組織には、具体的な検討材料が生まれた。
Foundryをハブにしたモデル選択の自由: Microsoft Foundryは、NVIDIAのオープンモデル、Anthropicのモデル、OpenAIのモデルを同一プラットフォームで選択・組み合わせて使えるマーケットプレイスとして機能し始めている。特定モデルへのロックインを避けながら、Azure基盤のセキュリティとガバナンスを活用できる構成が現実的になった。
エージェント向けハードウェア選定の時代へ: AIモデルを「どこで動かすか」の議論が本格化している。1ペタフロップ級(RTX Spark)か20ペタフロップ級(DGX Station)か——ワークロードの規模とコストに応じたハードウェア選定が必要になってくる局面が来ている。
筆者の見解
今回のNVIDIA・Microsoft連携発表を見て感じるのは、「プラットフォームとしてのAzureが、AI時代の全体設計を本気で描き始めた」という印象だ。
個別モデルの性能競争は日進月歩で、今年最良のモデルが来年もベストとは限らない。その現実に対して、AzureはFoundryという「モデルを差し替え可能な器」を整えることで、プラットフォームとしての長期的な価値を担保しようとしている。この方向性は正しいと思う。企業がAzureに乗り続ける理由がより強固になった。
一方で、ハードウェア・モデル・ランタイムすべてを一気に発表した今回は、壮大な絵が描けてはいるが、「実際に日本企業が使い始めるまでの道筋」がまだ見えにくい。RTX SparkもDGX Stationも秋以降の出荷であり、Foundryのモデル提供も「数週間以内」という段階だ。発表の規模に見合うだけの実装サポート、日本語ドキュメントやパートナーエコシステムの整備を丁寧に進めてほしい。これだけの力があるのだから、絵に描いた餅で終わらせるのはもったいない。
出典: この記事は NVIDIA Partners With Microsoft on Unified Stack for Agentic AI Deployment の内容をもとに、筆者の見解を加えて独自に執筆したものです。