Microsoft Foundryエージェントに「記憶」が宿る——Memory機能の有償化と、エンタープライズ自動化が変わる本当の意味

AIエージェントが「前回の会話を覚えている」——この一見シンプルな能力が、エンタープライズAI活用の成否を左右する時代が来た。Microsoft Foundry Agent Serviceが提供する「Memory（プレビュー）」機能が、2026年6月1日以降に有償化されることが正式に発表された。セッションをまたいでユーザーの好みや文脈を自動的に抽出・保持・再活用するフルマネージドのメモリ基盤だ。GAを目前に控えた今、エンタープライズでの本格導入を検討するタイミングが来ている。

短期メモリと長期メモリ、何が違うのか

AIエージェントのメモリには大きく2種類ある。

短期メモリ（Short-term memory）は現在のセッション内の会話履歴を保持するもので、多くのエージェントフレームワークが既に実装している。「先ほど言ったように」という発言の文脈をエージェントが理解できるのはこの仕組みのおかげだ。

長期メモリ（Long-term memory）はセッションや端末をまたいで知識を保持する。「このユーザーは乳製品アレルギーがある」「月次レポートは英語で欲しいと言っていた」——こうした情報をセッションが終わっても保持し続けるのが長期メモリの本質だ。

Foundry Agent ServiceのMemory機能はこの長期メモリに特化している。

3フェーズで動く自動メモリ処理

Memory機能は以下の3フェーズで自律的に動作する：

抽出（Extraction）: 会話からユーザーの好み・事実・文脈を自動抽出して保存
統合（Consolidation）: LLMが類似・重複メモリをマージし、矛盾する情報（新しいアレルギー情報など）を解決して最新状態を維持
検索（Retrieval）: 必要なタイミングで最も関連性の高いメモリを検索して会話に反映

この処理はすべてマネージドで提供される。開発者はベクターDBの運用やメモリ整合性管理に頭を悩ませる必要がない点は、実務上かなり大きなメリットだ。

価格体系——プレビュー中に使い倒せ

プレビュー期間（〜2026年6月1日）は無料。6月以降の価格は以下の通り：

種類価格

短期メモリ $0.25 / 1,000イベント

長期メモリ $0.25 / 1,000メモリ / 月

月単位で積み上がる長期メモリのコストは、ユーザー規模が大きい場合に予想外の金額になりやすい。プレビュー期間中に実際の利用量を計測し、本番導入後のコスト試算を済ませておくことを強くすすめる。

実務での活用ポイント

今すぐ検討すべき3つのシナリオ

1. 社内ヘルプデスクエージェント ユーザーごとの環境・権限・過去の問い合わせ内容を記憶することで、「また最初から説明する」コストを削減できる。問い合わせのたびに同じ情報を入力し直す無駄は思った以上に大きい。

2. カスタマーサポート自動化 顧客ごとの契約内容・過去トラブルの経緯を長期保持し、担当者が変わっても文脈が引き継がれる体験を実現できる。

内部業務エージェント（承認フロー・レポート生成等）担当者の好みや判断パターンを学習させることで、エージェントの精度が時間とともに向上する。定型的なやり取りをメモリに蓄積すれば、都度の指示が不要になる部分が増えていく。

設計上の注意点

Foundry IQのナレッジベース（組織共有のドキュメント）とMemory（個人ユーザー文脈）は用途が根本から異なる。設計段階で「これはOrg-wideの知識か？User-specificな文脈か？」を明確に分離することが、コスト最適化と精度維持の両面で効いてくる。

また、メモリ内容はユーザーのプライバシーデータにもなりうる。Microsoft Entra IDと組み合わせてメモリストアへのアクセス制御を適切に設計することは必須だ。エージェントが誰のメモリにアクセスできるか、という認可設計を最初から組み込んでほしい。

筆者の見解

この機能がGAに近づいたことは、エンタープライズ向けAIエージェント基盤としてのFoundryが着実に成熟している証だと思う。

エージェントが「記憶を持つ」ことは、単なる利便性の向上ではない。これは自動化の質が根本から変わることを意味する。従来のRPA的な自動化は「決まった手順を繰り返す」ものだった。Memoryを持つエージェントは「経験を積みながら継続する」自動化になる。ユーザーが何度も同じ好みを伝えなくていい世界は、業務効率の観点からも意義が大きい。

Non-Human Identity（NHI）の管理と組み合わせて考えると、このメモリ機能はさらに重要な意味を持つ。エージェントがユーザーコンテキストを正確に保持・活用できれば、人間の介入が必要なシーンをさらに減らし、承認フローや判断処理のより大部分をエージェントに委ねられるようになる。業務効率のボトルネックは常に「人間の関与」にある。その関与を減らす仕組みが、プラットフォームレベルで整ってきている。

Foundryは「どのAIモデルを動かすか」という選択と、「エージェントの記憶・認証・オーケストレーションをどう管理するか」という基盤の両方を提供している。この方向性は長期的に正しい。基盤をしっかり固めて、その上で動かすモデルや能力を選べる構成は、技術の進化が速い今の時代に柔軟性が高い。プレビュー期間のうちに実際に手を動かして、自社の業務フローにどう組み込むか検証しておく価値は十分にある。

出典: この記事は Memory in Microsoft Foundry Agent Service (preview) — Pricing and GA timeline announced の内容をもとに、筆者の見解を加えて独自に執筆したものです。

短期メモリと長期メモリ、何が違うのか#

3フェーズで動く自動メモリ処理#

価格体系——プレビュー中に使い倒せ#

実務での活用ポイント#

今すぐ検討すべき3つのシナリオ#

設計上の注意点#

筆者の見解#