AIエージェント同士がペアプログラミングする時代へ

ClaudeとCodexという2つのAIエージェントを、まるで人間のペアプログラマーのように協調させたら何が起きるか——そんな発想から生まれたCLIツール「loop」が注目を集めている。

開発者のAxel Delafosse氏は、コードレビューエージェントを構築する中で興味深い現象を発見した。ClaudeとCodexを並列で動かしてレビューさせると、両者が異なるフィードバックを出すこともあるが、同じ指摘をした場合は非常に強いシグナルになるという。チームでは両者が合意したフィードバックには100%対応するルールを設けるほどだ。

マルチエージェントは「人間のチームワーク」を模倣する

Cursorの研究チームが長時間稼働する coding エージェントの研究で明らかにしたように、優れたエージェントワークフローは人間の協調作業に似た構造を持つことが多い。メインのオーケストレーターがワーカーにタスクを割り振る形は、現実のチーム運営と重なる。Claude Codeの「Agent teams」やCodexの「Multi-agent」機能も同様の思想で設計されている。

「loop」の仕組み

loop は極めてシンプルなCLIツールだ。

  • tmux 上で claudecodex を並列起動
  • 両エージェント間を繋ぐブリッジ機能により、エージェント同士が直接対話できる
  • イテレーションをまたいでコンテキストを保持
  • 人間もループに参加でき、介入・質問への回答・フォローアップが可能

インタラクティブなTUIをそのまま実行するため、自動化に閉じず人間が自然に作業に加われるのが特徴だ。

残る課題:人間レビューとの接続

エージェントにループさせると予想以上の変更が生じることがあり、品質的には歓迎だが人間によるレビューを難しくするという課題もある。氏はいくつかの未解決の問いを挙げている。

  • 作業を複数のPRに分割すべきか?
  • PLAN.md をGitで共有すべきかPR説明に含めるべきか?
  • スクリーンショットや動画を「作業証明」として添付すべきか?

ベンダーロックインを避けながら複数エージェントを活用

現在、複数のエージェントハーネスを使う動機は様々だ——ベンダーロックインの回避、オープンソースへの貢献、サブスクリプションの最大活用、そして異なる視点や強みの獲得。Delafosse氏は「マルチエージェントハーネスアプリは、エージェント間通信をファーストクラスの機能として扱うべき」と主張する。

AIエージェントの未来は、魔法のような全自動ではなく、人間のチームワークに近い協調作業の形をとるのかもしれない。

ソースコードは GitHub で公開されている。


元記事: Agent-to-agent pair programming