AIコーディングツールが普及するにつれ、「どれだけトークンを使ったか」を生産性の指標にする風潮が広まりつつある。シリコンバレーでは「大きなトークン予算を持つ開発者は生産的だ」という空気さえ生まれているが、本当にそうなのだろうか。最新の調査データは、その前提に鋭い疑問を突きつけている。
「受け入れ率80%」の裏側にある現実
エンジニアリング分析プラットフォームを提供するWaydevのCEO、アレックス・チルセイ氏によれば、同社の顧客(50社・エンジニア1万人超)では、AIが生成したコードの受け入れ率が80〜90%に達しているという。一見すると目覚ましい数字だ。
しかし問題はその後に起きる。受け入れたコードを数週間のうちに書き直す「コードチャーン(code churn)」が急増しており、実際の定着率は10〜30%にまで下がるという。つまり、最初に「OK」を押したコードの7〜9割が後でひっくり返されているわけだ。
GitClearが今年1月に公開したレポートも同様の傾向を示している。AIツールの頻繁な利用者は非利用者と比べてコードチャーンが平均9.4倍に達しており、ツールが提供する生産性向上効果の2倍以上を相殺しているとしている。エンジニアリング分析のFaros AIが2年間のデータをもとにまとめた2026年3月のレポートも、同じ結論に近い結果を示している。
「何を測るか」が生産性を定義する
この問題の本質は、指標の設計にある。
トークン消費量は「AIの使用量」というインプットの指標に過ぎない。本来問われるべきはアウトカム——つまり「どれだけ価値あるコードが本番に届いたか」「バグが減ったか」「ユーザーへの価値提供速度が上がったか」だ。
管理職にとって見えやすい「コード受け入れ率」や「生成コード行数」は、短期的には増加を示す。しかし、見えにくいコードチャーンのコストが積み重なると、チーム全体のスループットは実質的に低下しかねない。何を測るかが、現場の行動を規定する——古典的な管理論の教訓が、AI時代に再び鋭さを取り戻している。
実務での活用ポイント
1. コードチャーン率を可視化する Git履歴を解析し、「承認後に書き直されたコードの割合」を定期的に計測する仕組みを作ろう。GitClear、Waydev、Faros AIのようなエンジニアリングインテリジェンスツールが選択肢になる。AtlassianがDXを1,000億円規模で買収したことからも、この市場の注目度がわかる。
2. AIツールの使い方自体を見直す 「とりあえずAIに書かせて後で直す」という使い方は、チャーンを増やす典型パターンだ。仕様・制約・既存コードのコンテキストをプロンプトに十分盛り込み、一発で使えるコードを引き出す「問い方の設計」に投資する価値がある。
3. レビュー文化を変える AI生成コードに対して「とりあえず承認」するレビュー習慣は危険だ。「このコードが3週間後も生きているか」という視点でレビューする文化と、それを支えるガイドラインの整備が急務になっている。
4. チームごとのROIを測定する AIツールのコスト(トークン料金)と、チャーンによる手戻りコストを合算してROIを算出してみる。トークン予算が大きいチームほど生産性が高いとは限らない、という事実が見えてくるはずだ。
筆者の見解
正直に言えば、この話には「そうだよな」という感覚がある。
AIコーディングツールを使い始めた当初、「こんなにコードが出てくる」という興奮は確かにあった。しかし実際に価値が出ているのは、ツールとのやり取りをきちんと設計できているとき——つまり、何を作るかを自分の中で整理した上でAIに問いかけているときだ。逆に「なんとなく聞いてみる」使い方は、コードは出てくるが後始末が増える。
トークン予算を競い合う「トークンマキシング」は、かつての「コード行数競争」と本質的に同じ過ちを繰り返している。インプット指標にフォーカスすると、人間の行動がそこに引き寄せられてしまう。
AIエージェントの本当の価値は「コードをたくさん生成すること」ではない。人間の認知負荷を下げ、判断と検証にフォーカスできる環境を作ること——そのための道具として正しく使うことが、これからのエンジニアに求められるスキルだ。
「どれだけ使ったか」ではなく「何を作れたか」。ここに立ち返ることが、AIツール活用の次のステージに進む鍵になると思っている。
出典: この記事は ‘Tokenmaxxing’ is making developers less productive than they think の内容をもとに、筆者の見解を加えて独自に執筆したものです。