Microsoft Agent Framework 1.2.2:AIエージェントがマルチモーダル文書を自動解析、Durable Workflowも本格強化
AIエージェントが「添付ファイルを読んで理解する」能力を得た。2026年4月29日、Microsoftは Microsoft Agent Framework v1.2.2 をリリースし、ファイル添付の自動解析機能とDurable Workflowの大幅強化を届けた。エンタープライズ現場でのエージェント活用が本格化する中、このリリースは実運用に直結する内容を多く含んでいる。 Azure AI Content Understanding:マルチモーダル解析の民主化 最大の目玉は、新アルファパッケージ agent-framework-azure-contentunderstanding だ。 これは Azure AI Content Understanding との統合を提供するコンテキストプロバイダーで、エージェントに渡されたファイル添付を自動解析し、構造化された結果をLLMのコンテキストに注入する。対応フォーマットは幅広く、ドキュメント・画像・音声・動画をカバーする。 実装面での特徴も実用的だ: マルチドキュメントセッション管理:複数ファイルにわたる解析状態を保持し、「先ほどの3つのファイルを比較して」といった会話が成立する AnalysisSection によるフィルタリング:必要な解析結果だけを取り込む粒度制御 自動登録ツール:list_documents / get_analyzed_document がフレームワーク側で自動登録される これまでは「ファイルをエージェントに渡す → エージェントが読む」という処理をアプリ側でゼロから実装する必要があったが、このパッケージによって コンテキスト注入の重労働がフレームワーク側に吸収される。開発チームが本来の業務ロジックに集中できる。 Durable Workflow:会話履歴が途切れなくなった agent-framework-foundry-hosting では、ホスト型 Durable Workflow への完全な会話履歴伝播が追加された。 具体的には Workflow.as_agent() のエンドツーエンド配線が実現し、マルチターンの WorkflowAgent 呼び出しで 共有状態が呼び出しをまたいで保持される ようになった。list[Message] 入力をDeclarativeなstart executorで受け付け、Enum 値のPowerFxシンボルシリアライズも修正されている。 エンタープライズ用途では、長時間にわたるプロセスを複数ステップに分割して実行するシナリオが多い。ワークフローの途中でコンテキストが失われるのは致命的で、これまではアプリ側での状態管理が必要だった。今回の強化により、その煩雑さが大幅に軽減される。 見逃せない破壊的変更 v1.2.2 には 破壊的変更(BREAKING CHANGE) が1件含まれている。 agent-framework-orchestrations において、オーケストレーションの終端出力が AgentResponse に標準化された。Workflow.as_agent() は最終回答のみを返すようになり、逐次承認フロー(with_request_info)と並行実行フロー(intermediate_outputs=True)が同一の出力コントラクトに揃えられた。 既存コードでオーケストレーション出力を直接パースしている実装は修正が必要になる。アップグレード前に必ず python-1.2.1...python-1.2.2 の差分を確認してほしい。 その他の修正 OpenTelemetry ストリーミング可観測性の修正:ストリーミング使用時にスパンが正しくネストされない問題を解消(#5552) file_search 引用の修正:アシスタントメッセージ履歴のラウンドトリップを壊していた問題を解消。Responses APIが input_file を拒否する現象がなくなる(#5557) 実務への影響 AIエージェント開発者・アーキテクト向け ...