Azure API ManagementにA2A API管理機能がプレビュー公開――エージェント間通信にもポリシー・Entra ID・Application Insightsを統一適用

MicrosoftがAzure API Management（APIM）のA2A（Agent-to-Agent）API管理機能をプレビュー公開した。AIエージェント同士が互いのAPIを呼び合うマルチエージェント構成において、既存のポリシーエンジン・Microsoft Entra ID・Application Insightsによるオブザーバビリティをそのまま適用できる。

A2A（Agent-to-Agent）通信とはなにか

従来のAPIは「人間のアプリケーションがバックエンドサービスを呼ぶ」構造を前提としていた。生成AI時代に入ってからは、AIエージェント自身が別のAIエージェントのAPIを呼び出す「A2A通信」が当たり前になりつつある。

オーケストレーター役のエージェントが「検索専門エージェント」「要約専門エージェント」「コード生成専門エージェント」をそれぞれAPIとして呼び出すマルチエージェント構成は、すでに多くのプロダクションシステムで見られる形だ。

問題は、こうしたエージェント間通信が「API管理の対象外」になりがちだったことにある。セキュリティポリシーが適用されない、誰がどのエージェントを呼んだか追跡できない、コストが見えない——この三重苦が現場で静かに積み重なっていた。

APIMがA2A通信を管理できるようになった

今回のプレビューにより、Azure API ManagementはA2A通信を「通常のAPIと同じ扱い」で管理できるようになる。

主な機能は以下のとおりだ：

既存のポリシーエンジンをそのまま適用: レート制限・IP制限・JWT検証・キャッシュなど、APIMに積み上げてきたポリシー資産がA2A通信にも適用される
Microsoft Entra IDによるID管理: エージェント同士の認証もEntra IDで一元管理できる。Managed IdentityやService Principalを活用したNHI（Non-Human Identity）管理と自然に組み合わせられる
OpenTelemetry GenAI意味規則に対応したトレース: エージェント実行のトレースをOpenTelemetry形式でApplication Insightsへ記録し、API呼び出しとエージェント実行を相関分析できる

OpenTelemetry GenAI意味規則の重要性

OpenTelemetry（OTel）は分散トレーシングの業界標準だが、そのGenAI向け拡張として「GenAI意味規則（Semantic Conventions）」が整備されつつある。モデル名・プロンプトトークン数・コンプリーショントークン数・エラー種別などをOpenTelemetryのスパン属性として記録する標準仕様だ。

APIMがこの規則に対応したことで、Application Insightsダッシュボード上でエージェントの動きを可視化できるようになる。「あのAPIが遅い」と思ったら実はその裏で呼ばれているエージェントがボトルネックだった、という調査が格段にやりやすくなる。

実務への影響

マルチエージェント構成の本番運用がようやく現実的に

これまで「エージェントを本番に出す」には不安要素が多かった。特に「エージェント間でどんな通信が起きているか追えない」「コストが読めない」「認証をどう設計するか」の3点が障壁だった。

APIMのA2A管理機能はこの3点を一度に解決する。APIMをエージェント間通信の管制塔として置くことで、既存のAPI管理基盤がそのままマルチエージェント時代にも使える。

NHI管理との組み合わせが鍵

エージェントをNHIとして適切に管理する仕組みと組み合わせることで、Just-In-Timeアクセス制御や最小権限原則をAI時代にも維持できる。「このエージェントは何のAPIにアクセスしてよいか」を人間が設計し、APIMのポリシーとEntra IDで強制する——これが本来あるべき姿だ。

常時アクセス権を与えるのではなく、必要なときだけ必要な権限を付与するゼロトラスト原則は、エージェントが増えれば増えるほど重要になる。

コスト管理も忘れずに

Application InsightsへのOTelトレースはトークン使用量も記録できる。エージェントがエージェントを呼ぶチェーンが深くなると、トークンコストが静かに積み上がる。最新のAPIM v2 tierではAnthropicのMessages APIへのllm-emit-token-metric対応も追加されており、Claude系モデルを裏で使う構成でもコスト可視化が可能になっている。

筆者の見解

エージェントが人間の代わりにAPIを呼ぶ世界は、もう「近未来の話」ではない。APIMをAIゲートウェイとして実際に運用する中で感じてきた「エージェント間通信は野良になりがち」という課題に、MicrosoftがAPIMという既存資産で正面から答えを出してきたことは評価したい。

特にEntra IDをエージェントの認証・認可基盤として使えることの意義は大きい。これは「エージェントの管制塔としてのMicrosoft Entra ID」という長期戦略の一環として見ると筋が通っている。AIモデルの性能を競う土俵とは別に、「エージェントが安全に動作するプラットフォーム」を提供する競争ではMicrosoftのインフラ・ID管理・セキュリティの強みが生きる。この路線を正面から磨き続けてほしい——それがMicrosoftの戦い方として正しいと思っている。

ひとつ注意点を挙げるとすれば、プレビュー段階でプロダクションへの適用を検討する場合、OTelトレースのサンプリング設定とApplication Insightsへのデータ送信コストを慎重に設計すること。全トレースを垂れ流すとInsightsのコストが想定外に膨らむ。本番導入前にサンプリング率とカスタムダッシュボードの設計をセットで行うことを強くお勧めする。

出典: この記事は Preview: Govern, Secure, and Observe A2A APIs with Azure API Management の内容をもとに、筆者の見解を加えて独自に執筆したものです。

A2A（Agent-to-Agent）通信とはなにか#

APIMがA2A通信を管理できるようになった#

OpenTelemetry GenAI意味規則の重要性#

実務への影響#

マルチエージェント構成の本番運用がようやく現実的に#

NHI管理との組み合わせが鍵#

コスト管理も忘れずに#

筆者の見解#