AIエージェント開発が加速するなか、コーディング支援ツールの最新版が「目標達成まで自走する」仕組みを実装した。単なるバージョンアップではなく、AIが自律的にループで作業し続けるというパラダイムを、開発ツールのレイヤーで具現化した重要なアップデートだ。

「目標を渡したら完了まで任せる」─ /goal コマンドの意義

今回のアップデートで最も注目すべきは /goal コマンドの追加だ。

これまでのインタラクティブなAI利用では、ユーザーが都度指示を出し、AIが応答するというラリー形式が主流だった。/goal完了条件を一度設定すると、AIがターン間をまたいで作業し続けるという仕組みで、この前提を根本から変える。

実行中は経過時間・ターン数・トークン消費数がオーバーレイで表示され、プロセスの透明性を保ちながら自律稼働が続く。インタラクティブモード・-p オプション・リモートコントロールのいずれでも動作するため、自動化パイプラインへの組み込みも容易だ。

ハーネスループの実用化

エージェントが「判断 → 実行 → 検証」をループで繰り返す仕組みは、AI活用の次フロンティアとして注目されてきた。/goal は、こうした自律ループを外部でスクリプトを書かずにネイティブ実装できる最初の例の一つだ。

長時間かかるリファクタリング、大量ファイルの解析、テストが通るまでの繰り返し修正——これらを「完了条件を渡して離席する」形で処理できるようになる意味は大きい。

エージェントビューで「複数AI同時稼働」を管理

claude agents コマンドで表示されるエージェントビューは、実行中・承認待ち・完了の全セッションを一覧できる機能だ(リサーチプレビュー)。

複数の並行タスクをAIに振り、状況を俯瞰管理する——というマルチエージェント運用が現実的な選択肢になってきたことを示している。「AIに仕事をさせながら、自分は別の判断をする」という働き方を、ツールが後押しし始めた形だ。

フック・MCP周りの地味に重要な改善

continueOnBlock の追加

PostToolUse フックの新オプション continueOnBlocktrue にすると、フックが処理をブロックした際にその理由をAIにフィードバックしてターンを継続させられる。

自動化パイプラインでのエラーハンドリングが大幅に柔軟になる。フックが「このファイルは変更禁止」と返したとき、AIが自力で代替手段を考えながら作業を続けられる設計だ。

CLAUDE_PROJECT_DIR の伝播

MCP stdio サーバーに CLAUDE_PROJECT_DIR 環境変数が渡されるようになり、プラグイン設定からも ${CLAUDE_PROJECT_DIR} を参照できる。ポータブルな設定ファイルが書きやすくなり、チーム共有の構成管理がシンプルになる。

APIキー設定時の機能制限

ANTHROPIC_API_KEY 等が設定されている場合、Remote Control・スケジュール・通知設定が無効化される。一見不便に見えるが、セキュリティポリシーとの整合性を保つための実装だ。企業環境でAPIキーを一括管理しながら個人アカウントの機能を混在させない、という意図が読める。

実務への影響

エンジニアが今すぐ試せること

  • /goal で長時間タスクを委任する: 「全テストが通るまでリファクタリングを続けろ」「このAPIドキュメントを読んで実装せよ」といった完了条件を設定し、実際に離席して結果を待ってみる
  • continueOnBlock で自動化パイプラインを堅牢化する: セキュリティチェックやレビューフックが走る環境で、ブロック時の挙動をAIが自律的に処理できるよう設計する
  • エージェントビューでマルチタスク運用を体験する: 複数の独立したタスクを並列でエージェントに割り当て、ボトルネックがどこに生まれるかを観察する

IT管理者・チームリーダーへの示唆

x-claude-code-agent-id / x-claude-code-parent-agent-id ヘッダーと OTEL スパンへの agent_id 追加は、マルチエージェント実行のトレーサビリティを可能にする布石だ。どのエージェントがどの親タスクから派生したかを追跡できれば、監査・コスト管理・セキュリティポリシー適用が現実的になる。企業導入を検討する際のインフラ要件として今から注目しておきたい。

筆者の見解

今回のアップデートで最も重要なのは、「AIに指示を出し続ける人間」から「目標を渡して結果を受け取る人間」へのシフトを、ツールのレイヤーで促進し始めたという点だ。

AIエージェントが本質的な価値を発揮するのは、人間が確認・承認を都度求められる設計ではなく、自律的に判断・実行・検証を繰り返すループを実現したときだ。/goal コマンドはその方向への明確な一歩だと捉えている。

ただし、自律稼働が長くなるほど「何をやっているかわからない」ブラックボックスリスクも増す。エージェントビューのような可視化機能や、トレーサビリティのための agent_id 伝播が同時に整備されているのは、この懸念への現実的な回答だ。設計として筋が通っている。

「AIが勝手にやりすぎる」不安と「もっと任せたい」期待のバランスをどう取るか——これはツールの問題であり、組織設計の問題でもある。承認フローの粒度や権限管理が今後どう進化するかが、エンタープライズ採用の鍵になると見ている。

自律エージェントの時代は、思ったより早く来ている。


出典: この記事は Anthropic Introduces ‘Dreaming’ — Persistent Memory Consolidation for Managed Agents の内容をもとに、筆者の見解を加えて独自に執筆したものです。