「トークンマキシング」の罠——AIコーディングツールの生産性は本当に上がっているのか

AIコーディングツールが普及するにつれ、「どれだけトークンを使ったか」を生産性の指標にする風潮が広まりつつある。シリコンバレーでは「大きなトークン予算を持つ開発者は生産的だ」という空気さえ生まれているが、本当にそうなのだろうか。最新の調査データは、その前提に鋭い疑問を突きつけている。

「受け入れ率80%」の裏側にある現実

エンジニアリング分析プラットフォームを提供するWaydevのCEO、アレックス・チルセイ氏によれば、同社の顧客（50社・エンジニア1万人超）では、AIが生成したコードの受け入れ率が80〜90%に達しているという。一見すると目覚ましい数字だ。

しかし問題はその後に起きる。受け入れたコードを数週間のうちに書き直す「コードチャーン（code churn）」が急増しており、実際の定着率は10〜30%にまで下がるという。つまり、最初に「OK」を押したコードの7〜9割が後でひっくり返されているわけだ。

GitClearが今年1月に公開したレポートも同様の傾向を示している。AIツールの頻繁な利用者は非利用者と比べてコードチャーンが平均9.4倍に達しており、ツールが提供する生産性向上効果の2倍以上を相殺しているとしている。エンジニアリング分析のFaros AIが2年間のデータをもとにまとめた2026年3月のレポートも、同じ結論に近い結果を示している。

「何を測るか」が生産性を定義する

この問題の本質は、指標の設計にある。

トークン消費量は「AIの使用量」というインプットの指標に過ぎない。本来問われるべきはアウトカム——つまり「どれだけ価値あるコードが本番に届いたか」「バグが減ったか」「ユーザーへの価値提供速度が上がったか」だ。

管理職にとって見えやすい「コード受け入れ率」や「生成コード行数」は、短期的には増加を示す。しかし、見えにくいコードチャーンのコストが積み重なると、チーム全体のスループットは実質的に低下しかねない。何を測るかが、現場の行動を規定する——古典的な管理論の教訓が、AI時代に再び鋭さを取り戻している。

実務での活用ポイント

1. コードチャーン率を可視化する Git履歴を解析し、「承認後に書き直されたコードの割合」を定期的に計測する仕組みを作ろう。GitClear、Waydev、Faros AIのようなエンジニアリングインテリジェンスツールが選択肢になる。AtlassianがDXを1,000億円規模で買収したことからも、この市場の注目度がわかる。

2. AIツールの使い方自体を見直す 「とりあえずAIに書かせて後で直す」という使い方は、チャーンを増やす典型パターンだ。仕様・制約・既存コードのコンテキストをプロンプトに十分盛り込み、一発で使えるコードを引き出す「問い方の設計」に投資する価値がある。

3. レビュー文化を変える AI生成コードに対して「とりあえず承認」するレビュー習慣は危険だ。「このコードが3週間後も生きているか」という視点でレビューする文化と、それを支えるガイドラインの整備が急務になっている。

4. チームごとのROIを測定する AIツールのコスト（トークン料金）と、チャーンによる手戻りコストを合算してROIを算出してみる。トークン予算が大きいチームほど生産性が高いとは限らない、という事実が見えてくるはずだ。

筆者の見解

正直に言えば、この話には「そうだよな」という感覚がある。

AIコーディングツールを使い始めた当初、「こんなにコードが出てくる」という興奮は確かにあった。しかし実際に価値が出ているのは、ツールとのやり取りをきちんと設計できているとき——つまり、何を作るかを自分の中で整理した上でAIに問いかけているときだ。逆に「なんとなく聞いてみる」使い方は、コードは出てくるが後始末が増える。

トークン予算を競い合う「トークンマキシング」は、かつての「コード行数競争」と本質的に同じ過ちを繰り返している。インプット指標にフォーカスすると、人間の行動がそこに引き寄せられてしまう。

AIエージェントの本当の価値は「コードをたくさん生成すること」ではない。人間の認知負荷を下げ、判断と検証にフォーカスできる環境を作ること——そのための道具として正しく使うことが、これからのエンジニアに求められるスキルだ。

「どれだけ使ったか」ではなく「何を作れたか」。ここに立ち返ることが、AIツール活用の次のステージに進む鍵になると思っている。

出典: この記事は ‘Tokenmaxxing’ is making developers less productive than they think の内容をもとに、筆者の見解を加えて独自に執筆したものです。

「受け入れ率80%」の裏側にある現実#

「何を測るか」が生産性を定義する#

実務での活用ポイント#

筆者の見解#

「受け入れ率80%」の裏側にある現実

「何を測るか」が生産性を定義する

実務での活用ポイント

筆者の見解