Microsoft Copilot Studioの2026年5月アップデートで、PCやWebアプリをAIが自律的に操作する「Computer-using agents」が正式リリース(GA)となった。同時に、エージェント型自動化を一元管理する新ビジュアルワークフローデザイナーとリアルタイム音声機能も発表されている。

Computer-using agentsとは何か

従来の業務自動化ツールはAPIの存在を前提としていた。データ連携にはAPIエンドポイントが必要で、レガシーシステムや外部ベンダーポータルなどAPIを持たないシステムは、手動対応か脆弱なスクリプト頼みになりがちだった。

Copilot StudioのComputer-using agentsはこの制約を突破するアプローチだ。AIエージェントがWebブラウザやデスクトップアプリのUIを直接操作することで、APIがないシステムへの自動化を実現する。

今回GAになったことで、エンタープライズ用途に求められる機能も強化された。具体的には以下の3点が加わっている。

  • 認証情報の安全な管理: クレデンシャルをより安全に取り扱う仕組みを追加
  • モデル選択の柔軟化: 自動化シナリオに応じて最適なAIモデルを選択可能
  • UI変更への耐性向上: 画面レイアウトが変わっても自動化が壊れにくい堅牢性を強化

さらにプレビューとして、Computer-using agentsをマルチステップのワークフローに組み込む機能も追加された。API連携・承認フロー・ビジネスロジック・UI操作を、1つの自動化システム内で組み合わせられるようになる。

新しいビジュアルワークフローデザイナー

今回のもう一つの柱が、リデザインされたワークフロービジュアルデザイナーだ(現在はEarly Release環境で利用可能)。

従来は複数のツールやサービスをまたいで自動化ロジックを構築する必要があったが、新しいデザイナーでは統一されたキャンバス上でエンドツーエンドのワークフローを設計できる。アクション・条件分岐・AI処理ステップがビジュアルで繋がるため、複雑な業務プロセスの全体像を把握しやすくなった。

特筆すべきは「エージェントノード」の概念だ。単純なif-thenロジックでは判断しきれない状況——複数の知識ソースを参照しながら推論が必要な場面——では、ワークフロー内にエージェントノードを配置してAIに判断を委ねられる。構造化された自動化の信頼性とAIの柔軟な推論能力を組み合わせる設計思想だ。

リアルタイム音声体験

5月アップデートではリアルタイム音声体験機能も追加された。Copilot Studioで構築したエージェントを音声インターフェースで利用できるようになり、カスタマーサポートや音声操作が自然なシナリオでの活用が期待される。

実務への影響

レガシーシステムを抱える日本企業への朗報

日本のエンタープライズIT環境では、数十年前に導入した基幹システムが現役で稼働しているケースが多い。これらのシステムはAPIを持たないことが多く、デジタルトランスフォーメーションの障壁となってきた。

Computer-using agentsのGAは、こうした環境に対する現実的な自動化手段として評価できる。全面的なシステム刷新なしに、AIがUIを介して既存システムを操作できる点は大きな実用価値がある。従来RPAが担ってきた領域に対して、より柔軟で保守しやすい選択肢が加わった形だ。

明日から使える実践ポイント

  • 自動化候補のリストアップ: APIがなくて手動対応になっている業務プロセスを洗い出す。ベンダーポータルへの定型入力作業などが典型例
  • ガバナンス設計を先に: UI操作型の自動化は権限範囲と監査ログの設計を事前に行う
  • 段階的な展開: まずシンプルで繰り返し性の高いプロセスから試験導入し、実績を積んでから複雑な業務へ拡張する
  • ハイブリッド自動化の検討: 新ビジュアルデザイナーでエージェントノードとAPI連携を組み合わせ、全体最適な自動化アーキテクチャを描く

筆者の見解

MicrosoftがCopilot Studioを「エージェント・オーケストレーター」として明確に位置づけてきた方向性は、評価できる転換だと思う。サイドバーでの補助的な会話から、業務プロセスそのものを自律的に動かすシステムへ——この移行は、AIが本当に業務価値を生み出すための必然的な進化だ。

Computer-using agentsはとりわけ日本市場での活用余地が大きい。APIを持たないレガシーシステムが大手企業に多く残っている日本の事情を考えると、この機能の登場は現実的な意味を持つ。

ただし、GAになったからといって即座に本番展開できるわけではない。UI操作型の自動化はシステム変更への感度が高く、画面構成が変わるだけで止まるリスクがある。エンタープライズ展開にあたっては、変更管理プロセスと可用性要件を事前に整理した上で、段階的に検証を重ねることを強く勧めたい。

Microsoftにはこのビジョンを実装の品質で証明してほしい。特に日本語対応と国内レガシー環境での動作安定性は、日本市場での普及を左右する重要な要素になる。技術的なロードマップは整ってきた。あとはその実力を実際の現場で見せてほしい。


出典: この記事は What’s new in Copilot Studio: May 2026 updates — Computer-using agents and real-time voice の内容をもとに、筆者の見解を加えて独自に執筆したものです。