Hugging Faceは2026年5月25日、AIエージェント開発の現場で混乱しがちな専門用語を整理した実践的用語集を公式ブログで公開した。Claude Code、Codex、Hermes Agentといった実在のツールを具体例に挙げながら、「ハーネス(harness)」「スカフォールド(scaffold)」「エージェント(agent)」に実用的な定義を与える内容だ。

なぜ今、用語の整理が必要なのか

この用語集の発端はICLR 2026での出来事だ。同イベントに参加したHugging Faceの研究者が「ハーネスとスカフォールドについて多くの説明を聞いたが、どれも一致しなかった」とSNSに投稿したことが反響を呼んだ。

AIエージェントの分野は技術の進化が速く、用語の意味が人によって・フレームワークによって異なるまま使われている。これは入門者だけでなく、第一線の実践者にとっても混乱の元になっていた。

3つの核心概念:モデル・スカフォールド・ハーネス

モデル(Model)

LLM本体のこと。テキストを受け取り、テキストを返す——それだけだ。Claude、GPT、Qwen、DeepSeekなどが該当する。単体では会話の記憶もなく、ループもなく、ツールを「呼びたい」という意思表示はできても実際には何も実行しない。モデルはあくまで思考エンジンにすぎない。

スカフォールド(Scaffolding)

モデルに「世界の見え方」を与える行動定義レイヤーだ。具体的には次の要素で構成される:

  • システムプロンプト
  • ツールの説明文
  • モデルの応答パース方法
  • ステップをまたいだ記憶(コンテキスト管理)

学習時にも推論時にも機能する。モデルが「なんのために、どんな手段で動くか」を規定するのがスカフォールドだ。

ハーネス(Harness)

エージェントの実行エンジン。モデルを呼び出し、ツール呼び出しを処理し、「いつ止まるか」を決める。スカフォールドがモデルに何をすべきかを教えるのに対し、ハーネスはそれを実際に動かす。

ここが重要なポイントだ。Claude Codeは自社ドキュメントで「Claude Codeは、Claudeを囲むエージェンティックハーネスとして機能する」と明言している。つまりClaude Code自体がハーネスの実装例であり、LLM(Claude)を包んで自律的に動作する実行層なのだ。

ハーネスとスカフォールドの違いを一言で言うと

概念 役割 例

スカフォールド モデルへの「指示書と環境」 システムプロンプト、ツール記述

ハーネス 指示書に従いエージェントを「実際に走らせる機構」 ツール実行、ループ制御、終了判定

Claude CodeやCodexはこれら両方を「ハーネス全体」として扱う設計が多い。訓練パイプラインを構築する場面では両者を厳密に区別する必要がある。

ハーネスエンジニアリングという新しい専門領域

用語集は「ハーネスエンジニアリング(harness engineering)」を新しい専門分野として位置づけている。設計上の問いは次のとおりだ:

  • エージェントはいつ止まるか?
  • エラーをどう処理するか?
  • 暴走を防ぐガードレールをどこに置くか?

これはコーディング補完ツールの設計とは質的に異なる課題だ。自律的に動くエージェントを本番で動かすには、ハーネスレベルの設計がシステム全体の信頼性を左右する。

実務への影響:日本のエンジニアに必要な視点

用語の混乱がプロジェクトを殺す

「エージェントを作る」「LLMを組み込む」といった会話の中で、実はチームメンバーが別の概念を指していることがある。スクラムでいえば「完了の定義」が揃っていない状態だ。このHugging Faceの用語集は、チーム内の語彙統一のための出発点として使える。

Claude CodeやCodexを使いこなすなら、ハーネスの概念は必須

これらのツールは「会話型AIアシスタント」ではなく「エージェンティックハーネス」だ。ユーザーの指示をモデルに投げるだけでなく、ツール呼び出し・ファイル操作・コード実行・ループ継続といった一連の実行サイクルを管理している。この理解なしに「なぜこう動くのか」を把握することはできない。

自社エージェント構築を検討しているチームへ

スカフォールドとハーネスを設計する段階では、次の問いを早期に答えておくべきだ:

  • モデルはどのツールを使えるか(スカフォールドのツール記述)
  • エージェントはどこで止まるか(ハーネスの終了条件)
  • 失敗時のフォールバックは何か(ハーネスのエラーハンドリング)

また、Claude CodeやCodexはプロバイダーのモデルに密結合しているのに対し、Hermes AgentやAntigravity CLIは任意のモデルを差し込める設計だ。自社構築時はこのモデル依存性の設計判断が後から大きく響く。

筆者の見解

「ハーネスループ」という概念が、今のAIエージェント開発で最もホットなテーマだと確信している。単発の指示→応答ではなく、エージェントが自律的にループで判断・実行・検証を繰り返し続ける設計——これが本物の自律エージェントの姿だ。Hugging Faceが今回整理した用語集は、まさにこの世界を正確に語るための語彙を提供している。

「副操縦士型」のAI(確認を繰り返すタイプ)と「自律エージェント型」(目的を伝えれば自走するタイプ)は、設計哲学として根本的に異なる。ハーネスエンジニアリングとは、後者を現実に動かすための技術的基盤だ。この区別を曖昧にしたまま「エージェントを作った」と言っても、それは副操縦士を少し自動化しただけかもしれない。

日本のエンジニアにとって今必要なのは、情報を追いかけ続けることではなく、実際にこれらのツールを使い倒してハーネスの設計思想を体で覚えることだと思う。用語を知ることはその第一歩だが、知識を実践に結びつけるまでが本当のゴールだ。


出典: この記事は Harness, Scaffold, and the AI Agent Terms Worth Getting Right の内容をもとに、筆者の見解を加えて独自に執筆したものです。