Azure SREエージェントが正式GA——運用自動化の新時代へ

Microsoftは、サイト信頼性エンジニアリング(SRE)業務をAIが自律的に支援するサービス「Azure SREエージェント」の一般提供(GA)を開始した。プレビュー期間中にMicrosoft社内チームや早期顧客とともに磨き上げた本製品は、日々の運用における調査・トリアージ・ナレッジ化を自動化する。

「自分たちの問題を解くために作った」

開発チーム自身が自社の運用課題を解決するために構築したという点が、このエージェントの特徴だ。リグレッションの調査、エラーの日次トリアージ、そして調査結果の再利用可能なナレッジへの変換——これらすべてをSREエージェントが担っている。

GAでの主要アップデート

再設計されたオンボーディング セットアップ当日から即戦力になることを設計目標に掲げた。コード、ログ、インシデント、Azureリソース、ナレッジファイルを単一のガイド付きフローで接続できる。

ディープコンテキスト——環境の専門家に育つエージェント ログ・コード・ナレッジへの継続的アクセスと、調査をまたいだ永続メモリを持つ。誰も質問していないときもバックグラウンドで環境を探索し続け、ルーティング設定・エラーハンドラー・デプロイ構成を自律的に把握する。前回の調査で何が効いたかを記憶し、誰も気づいていなかった運用上のインサイトを浮かび上がらせる。

注目の機能群

機能 概要

自動調査(能動・受動) スケジュール実行でインシデント化前に問題をキャッチ。ICM・PagerDuty・ServiceNowと連携し、発生したインシデントを自動ピックアップ

高速な根本原因分析(RCA) コードとコンテキストを理解し、ランタイムエラーを原因コードに結びつける。調査を重ねるごとに精度が向上し、MTTR(平均修復時間)を短縮

MCPコネクター経由のワークフロー自動化 Azure・監視ツール・チケッティングシステムなど複数プラットフォームをまたいだコンテキストスイッチを排除。単一の場所からオーケストレーション

カスタムPythonツール 任意のHTTP APIを呼び出すPythonツールを記述し、社内APIや外部サービスと連携可能

スキル&プラグイン ドメイン固有のナレッジを教えるスキルを追加、またはプラグインマーケットプレイスからワンクリックでインストール

日本の現場への示唆

SREという概念はGoogleが提唱して以来、大規模サービスを運用する企業を中心に国内でも普及が進んでいる。Azure SREエージェントは、専任のSREチームを持ちにくい中規模組織でも、AIによる自律的な運用支援を実現できる可能性を持つ。PagerDutyやServiceNowとのインテグレーションは、既存の日本企業の運用フローとも親和性が高い。

GA版は現在利用可能で、ドキュメントや料金情報はAzure公式サイトで確認できる。


元記事: What’s new in Azure SRE Agent in the GA release