Anthropicは、同社のManaged Agentsプラットフォームに新機能「Dreaming」を追加することを発表した。エージェントがアイドル状態のとき、過去のセッションログを非同期で自律的にレビューしてパターンを蓄積し、次回の実行精度を自動的に高める仕組みだ。
「Dreaming」とは何か
Dreamingは、人間が睡眠中に記憶を整理・定着させるプロセスをAIエージェントに模倣させた機能だ。通常、AIエージェントはセッション単位で動作し、前回の実行から何かを「学ぶ」ことはない。しかしDreamingが有効なエージェントは、タスクを持たないアイドル時間に過去の会話ログ・実行履歴・エラーパターンを非同期で処理し、「次にどう動くべきか」の文脈知識を積み重ねていく。
この処理はバックグラウンドで行われるため、本番タスクの実行を妨げない。蓄積されたパターンは次回セッション開始時に参照され、同じ失敗を繰り返さない、ユーザーの好みに沿った出力を出しやすくなる、といった改善として現れる。
技術的な背景:「推論時の自己改善」という新パラダイム
従来のAIシステムが「賢くなる」方法は主にファインチューニング(追加学習)だった。これはモデルの重みそのものを書き換えるため、コストが高く、リグレッションリスクも伴う。
Dreamingが採用するアプローチは異なる。モデル重みは変えず、文脈情報として蓄積するという設計だ。技術的には、過去ログをサマリ化したメモリやパターンデータを構造化して保存し、エージェントが起動するたびにその知識を文脈として注入する。モデル自体は変わらないが、エージェントとして振る舞う際の「経験値」は確実に積み上がっていく。
このアーキテクチャは「Managed Agents」というホスティングサービスだからこそ実現できる。ステートフルなセッション管理・ログの永続化・非同期処理のオーケストレーションを、Anthropicのインフラが丸ごと担う。
実務への影響
Dreamingが実稼働環境に投入されたとき、日本のIT現場で最初に恩恵を受けるのは長期間・高頻度で動かすエージェントだ。具体的には以下のようなユースケースが考えられる。
- カスタマーサポート自動化: 繰り返し発生する問い合わせパターンを学習し、回答精度が時間とともに向上する
- インフラ運用エージェント: 障害対応の過去ログから「この症状はあのコマンドで解決した」というパターンを蓄積し、MTTR(平均復旧時間)を短縮
- コードレビュー・CI/CDエージェント: プロジェクト固有のコーディング規約やよくある指摘事項を自動学習し、レビューの精度がプロジェクトに最適化されていく
導入検討時に確認すべき点もある。どのログがDreamingの対象になるか、蓄積されたパターンの透明性はどう担保されるかを事前に把握しておくことが重要だ。特に機密情報を扱う業務エージェントでは、どのデータが「学習」に使われているかを明確にしないと、コンプライアンス上の問題が生じる可能性がある。
筆者の見解
このDreaming機能は、AIエージェントの設計思想における重要な転換点を示している。
これまでのエージェント議論は「いかに精度の高い指示(プロンプト)を与えるか」に偏りがちだった。しかしDreamingが指し示す方向は逆だ。エージェント自身が運用の中で改善し続けるループをどう設計するかという問いへのシフトである。AIエージェントが自律的に判断・実行・検証を繰り返しながら精度を高めていく——この方向性こそが、今後のエージェント活用の本流になると筆者は見ている。
一方で、気になる点もある。自己改善が「ブラックボックスの深化」にならないかという問題だ。エージェントが何を学んだかを人間が追跡・検証できる仕組みが伴わなければ、運用担当者は「なぜ今日は昨日と違う動作をするのか」に困惑することになる。Anthropicには、透明性の担保をDreamingの設計に組み込んでほしい。
また、単一のエージェントが自分のログだけを学習し続ける設計には構造的な限界もある。単一モデル・単一視点での自己評価は、そのエージェント固有のバイアスを強化するリスクを持つ。Dreamingが真の価値を発揮するためには、複数エージェントによる相互検証や、外部からの評価軸の導入が今後の課題になるだろう。
AIエージェントが「使い捨ての道具」から「運用の中で育つ仕組み」へと進化する流れは、日本のIT現場に大きな変革をもたらす可能性がある。その前提として、エージェントをきちんと「運用設計する」スキルを今から磨いておくことが、エンジニアにとっての次の必須課題になる。
出典: この記事は Anthropic will let its managed agents dream の内容をもとに、筆者の見解を加えて独自に執筆したものです。