Azure OpenAI Service

Azure AI Foundry Agent ServiceにDeep Research登場！

Azure AI Foundry Agent ServiceにDeep Research登場！この記事の内容 Azure AI Foundryのエージェントサービスに「Deep Research」機能が追加されました従来のDeep Researchと異なり、SDK/API経由で自社アプリへの組み込みが可能になりました O3-DeepResearchモデルとBing Searchを組み合わせたマルチステップパイプラインで動作します Logic AppsやAzure Functionsと連携したマルチエージェントシステムの構築に活用できます 2025年7月時点でリミテッドパブリックプレビューとして提供中です Azure AI FoundryとエージェントサービスとDeep Research Azure AI Foundryは、Azure上のさまざまなAIサービスを統合的に扱えるハブのようなサービスです。その中には、プログラミングによってAIエージェントを簡単に作成できる「エージェントサービス」が含まれています。これまで、OpenAIのモデルを直接利用してRAG（Retrieval-Augmented Generation）の仕組みを自作したり、Bing Searchと連携させたりするには、開発者が自分で連携コードを記述する必要がありました。Azure AI Foundryのエージェントサービスを使えば、そうした機能が初めから組み込まれており、より簡単に高度なエージェントを構築できます。今回、このエージェントサービスに「Deep Research」機能が加わったことで、その能力がさらに強力になりました。従来のDeep Researchとの違い：SDKとAPIとしての提供 Copilot for Microsoft 365の「リサーチャー」など、すでに同様の機能を利用している方もいるかもしれません。しかし今回の発表で最も重要な点は、SDKとAPIを通じて提供されるという点です。これは、開発者が自身のアプリケーションや既存の社内システムに、Deep Researchの機能を直接組み込めることを意味します。「自動運転できる車」そのものではなく、その中核となる「自動運転エンジン」という部品が提供されるイメージです。このエンジンを使えば、既存の車はもちろん、バイクや三輪車にさえ自動運転機能を搭載しようと試みることができます。 Deep Researchが「部品」として提供されることで、以下のような環境への統合が可能になります。 CLIツールや日々の自動化タスクインターネットに接続されていない社内システム既存のWebアプリケーションやバックエンドサービス Deep Researchエージェントの仕組みとアーキテクチャ Deep Researchエージェントは、主に以下の要素で構成されています。要素役割 O3-DeepResearchモデルリサーチ処理の中核を担う専用モデル Bing Search 最新かつ高品質な情報を取得するためのグラウンディングマルチステップパイプライン段階的なプロセスで精度の高い回答を生成処理の流れは以下のとおりです。 1. クエリの意図解釈ユーザーからの検索クエリに対し、GPT-4やGPT-4oモデルを利用して質問の意図を明確化し、リサーチの範囲を定義します。 2. Bing SearchによるWebグラウンディング最新のWebから関連情報を幅広く収集します。この際、古かったり無関係だったりするコンテンツは除外され、高品質な情報源のみが選別されます。 3. O3-DeepResearchモデルによる横断的な分析収集したすべての情報源を横断的に思考・分析・統合します。単なる要約ではなく、段階的な推論を行い、新たな発見があれば方向転換も行いながら、より深い洞察を導き出します。 ...

Azure AI Foundry AgentでMCP ServerをToolとして利用可能に

Azure AI Foundry AgentでMCP ServerをToolとして利用可能にこの記事の内容 Azure AI Foundry AgentがMCP（Model Context Protocol）Serverをツールとして利用できる新機能がプレビューとして公開されましたツール定義にタイプ MCP を指定するだけで、任意のMCPサーバーをエージェントに組み込めますエージェントはMCPクライアントとして動作し、Microsoft Learnなどの外部ドキュメントを直接参照できます利用にはサポートリージョンの確認と、セキュリティ・認証面の考慮が必要ですバージョンアップが活発なため、公式ドキュメントを常に参照することが重要です Azure AI Foundry Agentとは Azure AI Foundryは、Azure上でAIアプリケーションを効率的に構築・利用するためのサービス群です。OpenAIのサービスをデプロイして使うことはもちろん、AIエージェントの作成も手軽に行えます。このプラットフォームの強力な機能のひとつが、エージェントに「ツール」を定義できる点です。ツールを活用することで、エージェントは学習済みデータからのみ回答を生成するのではなく、外部の情報を参照（グラウンディング）して、より正確な応答を返せるようになります。従来は開発者が個別に組み合わせていたRAG（Retrieval-Augmented Generation）のような仕組みが、使いやすいAPIとして提供されています。新機能：MCP ServerがToolとして正式対応従来のツールとしてはBing Searchなどが代表的でした。今回のプレビューアップデートにより、新たにMCP Serverがツールとして正式に対応しました。 Azure AI Foundry AgentがMCPのクライアントとして機能することで、任意のMCPサーバーをわずか数秒でインポートできます。サーバー側のツール定義にも自動で追従し、エンタープライズ向けの機能も利用可能です。設定はエージェントの定義において、ツールのタイプとして MCP を指定するだけで完了します。 { "type": "MCP" } この設定を行うことで、エージェントは質問に対してMicrosoft Learnのドキュメントを直接参照し、信頼性の高い情報に基づいた回答を返せるようになります。Foundry Portalからも動作を確認できます。利用上の注意点この強力な機能を活用するにあたり、いくつか押さえておくべき注意点があります。サポートリージョンを確認するこの機能はまだプレビュー段階であり、すべてのリージョンで利用できるわけではありません。East US 2のような主要リージョンがまだサポート対象外の場合もあります。利用を開始する前に、必ず公式ドキュメントでサポートリージョンを確認してください。セキュリティと認証 MCPサーバーを外部サービスとして利用する際は、セキュリティを十分に考慮する必要があります。コスト: 利用するサービスによっては、意図しないコストが発生する可能性がありますデータの取り扱い: 信頼できる組織がホストしているMCPサーバーでなければ、情報漏洩のリスクが伴います認証: 外部との通信には認証が不可欠です。シナリオに応じて、必要な認証スキームを組み込むことが可能です公式にセキュリティのベストプラクティスに関するドキュメントも公開されているため、導入前には必ず目を通しておくことをお勧めします。実践的なヒント：プロンプトのカスタマイズエージェントの性能を最大限に引き出すために、プロンプトを工夫することも有効です。たとえば以下のように指示を追加することで、回答のフォーマットを柔軟に制御できます。日本語と英語の両方で回答を出力してください。このようなカスタムプロンプトをエージェントに設定することで、ニーズに合った応答を得られるようになります。 ...

Azure AI SpeechにVoice Live API登場！その他更新沢山。

Azure AI SpeechにVoice Live API登場！その他更新沢山。この記事の内容 Azure AI Speechの最新アップデートとして「Voice Live API」がパブリックプレビューで公開されました Voice Live APIを使うと、音声で対話するAIエージェント（ボイスエージェント）を簡単に構築できます 150言語・600以上の音声に対応し、GPT-4oなどの生成AIモデルをバックエンドとして選択できますビデオ翻訳サービスやHDボイスのGAなど、Voice Live API以外にも多数のアップデートがあります Azure AI Agent ServiceやSemantic Kernelとのシームレスな統合も実現しています Voice Live APIとは Microsoft Buildの開催に合わせて、Azure AI Speechに多数の新機能が発表されました。その中でも特に注目すべき機能が「Voice Live API」です。このAPIはパブリックプレビューとして公開されており、音声で対話するAIエージェント（ボイスエージェント）を構築するために特化しています。ユーザーの発話を認識し、その内容に応じて自然な音声で応答を返す、いわゆるSpeech-to-Speechの対話を実現します。テキストベースのチャットボットはすでに広く普及していますが、Voice Live APIによってよりスムーズで自然な音声対話が可能なエージェントの構築が現実のものとなります。特に顧客対応シナリオでの活用が期待されます。 Voice Live APIの主な特徴リアルタイムで自然な音声対話 Voice Live APIは遅延なくスムーズな会話を実現します。ユーザーが話しかけると、その内容を即座に認識してAIが応答を生成し、自然な音声で返答します。多言語サポート 150の言語に対応しており、グローバルな利用が可能です。豊富な音声オプションとカスタマイズ 600以上の音声から選択でき、性別・年齢・国籍など多様な音声スタイルが用意されています。さらに独自のカスタムボイスを作成することも可能です。アバター連携話す内容に合わせて動くアバターと組み合わせることもできます。バックエンドの生成AIモデル応答内容の生成には、バックエンドで動作する生成AIモデルが利用されます。ビルトインモデルとして以下がサポートされています。 GPT-4 Real-Time GPT-4o mini Real-Time GPT-4 GPT-4o mini さらにファインチューニングにも対応しており、特定のドメイン知識（例：店舗の営業時間・定休日・予約内容など）を学習させることで、より専門的な対話が可能になります。自然な会話を支える追加機能 Voice Live APIにはリアルな会話体験を実現するための機能が多数搭載されています。ノイズ抑制: 周囲の雑音を除去し、クリアな音声入力を実現エコーキャンセル: スピーカーからの音声が再入力されることを防止割り込み検知: ユーザーが話し始めたことを検知して、自然な会話の流れを維持他サービスとの統合 Voice Live APIはAzureの各種サービスやフレームワークとシームレスに統合できます。 ...