AIエージェント同士がペアプログラミングする時代へ
ClaudeとCodexという2つのAIエージェントを、まるで人間のペアプログラマーのように協調させたら何が起きるか——そんな発想から生まれたCLIツール「loop」が注目を集めている。
開発者のAxel Delafosse氏は、コードレビューエージェントを構築する中で興味深い現象を発見した。ClaudeとCodexを並列で動かしてレビューさせると、両者が異なるフィードバックを出すこともあるが、同じ指摘をした場合は非常に強いシグナルになるという。チームでは両者が合意したフィードバックには100%対応するルールを設けるほどだ。
マルチエージェントは「人間のチームワーク」を模倣する
Cursorの研究チームが長時間稼働する coding エージェントの研究で明らかにしたように、優れたエージェントワークフローは人間の協調作業に似た構造を持つことが多い。メインのオーケストレーターがワーカーにタスクを割り振る形は、現実のチーム運営と重なる。Claude Codeの「Agent teams」やCodexの「Multi-agent」機能も同様の思想で設計されている。
「loop」の仕組み
loop は極めてシンプルなCLIツールだ。
- tmux 上で
claudeとcodexを並列起動 - 両エージェント間を繋ぐブリッジ機能により、エージェント同士が直接対話できる
- イテレーションをまたいでコンテキストを保持
- 人間もループに参加でき、介入・質問への回答・フォローアップが可能
インタラクティブなTUIをそのまま実行するため、自動化に閉じず人間が自然に作業に加われるのが特徴だ。
残る課題:人間レビューとの接続
エージェントにループさせると予想以上の変更が生じることがあり、品質的には歓迎だが人間によるレビューを難しくするという課題もある。氏はいくつかの未解決の問いを挙げている。
- 作業を複数のPRに分割すべきか?
PLAN.mdをGitで共有すべきかPR説明に含めるべきか?- スクリーンショットや動画を「作業証明」として添付すべきか?
ベンダーロックインを避けながら複数エージェントを活用
現在、複数のエージェントハーネスを使う動機は様々だ——ベンダーロックインの回避、オープンソースへの貢献、サブスクリプションの最大活用、そして異なる視点や強みの獲得。Delafosse氏は「マルチエージェントハーネスアプリは、エージェント間通信をファーストクラスの機能として扱うべき」と主張する。
AIエージェントの未来は、魔法のような全自動ではなく、人間のチームワークに近い協調作業の形をとるのかもしれない。
ソースコードは GitHub で公開されている。