AIエージェントの「ハーネス」はサンドボックスの外に置け——本番スケールを支える設計原則

AIエージェントを本番環境に投入するとき、「エージェントハーネスをどこで動かすか」という設計判断がセキュリティ・コスト・スケーラビリティのすべてを決定する——そんな実践的な知見が、エンジニアコミュニティで注目を集めている。

エージェントハーネスとは何か

エージェントハーネスとは、LLM（大規模言語モデル）を駆動するループのことだ。「プロンプトを送る→レスポンスを受け取る→ツール呼び出しを実行する→結果をフィードバックする→繰り返す」という一連のサイクルを管理する仕組みである。すべての本番AIエージェントにはこのハーネスが存在する。問題は、これをどこで動かすかだ。

二つのアーキテクチャ：内側か外側か

ハーネスをサンドボックス内に置く場合

コードが動くコンテナと同じ場所にループが存在する。LLM呼び出しもコンテナ内から行われ、ツール呼び出し（Bash実行、ファイル読み書き等）もローカルで実行される。スキルやメモリ（コンテキスト）はコンテナ内のファイルシステムに置かれる。

個人の開発マシンで動かす場合、この構成が最もシンプルで導入が楽だ。市販のエージェントフレームワークをそのまま使えるし、ファイルシステムを前提とした既存のスキルやメモリ機能もそのまま動く。

ハーネスをサンドボックス外に置く場合

ループはバックエンドで動く。ツールを実行する必要が生じたときだけ、APIを通じてサンドボックスを呼び出す。ループはサンドボックスの中には入らない。この設計は複雑度が上がるが、本番の多ユーザー環境では明確な優位性を持つ。

外部ハーネスが持つ3つの優位性

1. クレデンシャルがサンドボックスに入らない

LLM APIキー、ユーザートークン、データベースアクセス権——これらすべてをループ側（バックエンド）で保持できる。サンドボックスにはエージェントの作業に必要な環境だけが存在し、万が一エージェントが「脱走」しようとしても取れるものがない。複雑な権限モデルの実装も不要になる。

2. サンドボックスをアイドル時に停止できる

エージェントの処理時間の多くは、実はサンドボックスを必要としない——思考中、API呼び出し中、CI待機中。ハーネスが外にあれば、コマンド実行が必要なときだけサンドボックスを起動し、アイドル時には停止できる。コスト最適化の観点からも大きな差になる。

3. サンドボックスが「家畜」になる

セッション途中でサンドボックスが死んでも、ループが新しいサンドボックスをプロビジョニングしてそのまま継続できる。ハーネスが内側にある場合、サンドボックスがセッションそのものなので、これが失われるとセッション全体が終了する。

複数エンジニアが同じエージェントを使う多ユーザー構成では、スキルやメモリの共有が「分散ファイルシステム問題」ではなく「共有データベース問題」に変わる。前者は本質的に難しく、後者は解決済みの問題だ。

解決すべき課題：耐久実行（Durable Execution）

外側ハーネス構成の最大の課題は、長時間動き続けるループの耐久性確保だ。エージェントセッションは数分から数時間に及ぶ。デプロイ、スケールイベント、インスタンス障害——これらを乗り越えてループが生き続けなければならない。Temporalのような耐久実行フレームワークの採用が、現実的な選択肢として浮上してくる。

実務への影響

日本企業でAIエージェントを本番導入しようとしている場合、この設計判断は非常に重要だ。

個人利用・PoC段階では、内側ハーネス構成で十分だ。市販のエージェントフレームワークやクラウドIDEのAI機能がこの構成を採用しており、すぐに動かせる。

一方、チーム・組織での本番利用を考えるなら、外側ハーネス構成への移行を視野に入れるべきだ。特に以下の場合は早めに検討する価値がある：

複数のエンジニアが同じエージェントを共有する
エージェントが機密情報（APIキー、DB接続情報等）にアクセスする
セッションが数時間以上継続する可能性がある
アイドルコストの削減が求められる

筆者の見解

ハーネスの設計場所——この問いは、AIエージェントが「ツール」から「インフラ」に昇格したことを象徴している。

個人のラップトップで動かすエージェントは、シンプルな内側ハーネスで十分だし、それで大きな価値が得られる。問題はそこから先だ。エージェントを組織のインフラに組み込み、複数人が共有し、24時間365日動かし続けようとしたとき、設計の甘さがセキュリティインシデントや可用性問題として噴出する。

筆者が注目しているのは、「ループを自律的に動かし続ける仕組み」そのものだ。エージェントが自分で判断・実行・検証を繰り返しながら走り続けるループ——これこそが次のフロンティアだと考えている。単発の指示→応答というモデルは、人間の認知負荷を本質的には下げていない。ループが止まらずに走り続けてこそ、本当の意味での自律性が生まれる。

外側ハーネス設計は、そのループをインフラとして堅牢に動かすための基盤になる。「砂場の中にいるエージェント」から「砂場を使うエージェント」へ——この概念の転換が、本番AIエージェント設計の核心だと思う。

PoC的な成功体験を経たなら、次のステップとして組織スケールを見据えた設計への投資を検討してほしい。その際に本稿で解説した原則が、判断の軸として機能するはずだ。

出典: この記事は The agent harness belongs outside the sandbox の内容をもとに、筆者の見解を加えて独自に執筆したものです。

エージェントハーネスとは何か#

二つのアーキテクチャ：内側か外側か#

ハーネスをサンドボックス内に置く場合#

ハーネスをサンドボックス外に置く場合#

外部ハーネスが持つ3つの優位性#

1. クレデンシャルがサンドボックスに入らない#

2. サンドボックスをアイドル時に停止できる#

3. サンドボックスが「家畜」になる#

解決すべき課題：耐久実行（Durable Execution）#

実務への影響#

筆者の見解#