Amazonが社内でAI利用状況をスコアリングし従業員間でランキング表示していた「AIリーダーボード」を廃止した。スコアを上げることが目的化し、本来の生産性向上から外れた使い方が横行したためだ。

なぜAIリーダーボードを導入したのか

企業がAI活用を推進する際、「どれだけAIを使っているか」を可視化・競争させる手法は一見合理的に見える。Amazonもその発想から、社内AIツールの使用状況をスコアリングしてランキング表示するシステムを導入した。目標は明快で、AI活用の底上げと組織全体の生産性向上だ。

何が問題になったか

ところが、リーダーボードはすぐに逆効果を生み出した。従業員たちはスコアを稼ぐために意味のない形でAIを使い始めた。本当に効果的な活用かどうかにかかわらず、数字を上げることが目的になってしまったのだ。

これは組織心理学でいう「グッドハートの法則」の典型例だ——「指標が目標になった瞬間、それは良い指標ではなくなる」。AIの場合、「プロンプト送信回数」「トークン消費量」といった量的データは測定しやすい反面、本来の成果(品質向上・業務効率化)との乖離が生じやすい。Amazonはこの問題を認識し、スコアランキングの仕組みそのものを廃止する判断を下した。

実務への影響——日本企業はAI活用KPIをどう設計すべきか

この件は日本のIT現場にとっても対岸の火事ではない。多くの日本企業が「AI活用率の向上」を重点目標に掲げており、似たような指標設計を検討中のところも少なくない。

避けるべきKPI設計

  • AIツールのログイン回数・送信回数によるランキング
  • トークン消費量や使用時間の可視化競争
  • 「AIを使ったかどうか」のみを問うバイナリな評価

検討すべきKPI設計

  • AIを活用した業務の成果物品質(コードレビュー通過率、ドキュメント品質スコア等)
  • 業務完了にかかった時間の変化(AI活用前後の比較)
  • 従業員自身がAI活用の効果を報告する定性サーベイと定量指標の組み合わせ

重要なのは「AIを使ったという行為」ではなく「AIを使って何が良くなったか」を測ることだ。AI活用の底上げには動機付けと仕組みの両方が必要であり、「使わなくていい」という免罪符を与えると形骸化する。組織としてAIで効果を出した事例を共有し、「こう使えば成果が出る」という実践的なパスを示すことが本質だ。

筆者の見解

Amazonのこの判断は正しい。数字のランキングで競わせるアプローチが機能しないことは、少し考えれば予想できた範囲だ。一方で、「AI活用度を組織的に上げたい」という問題意識自体は正しい方向であり、指標設計の失敗と目的の正しさは切り分けて考えるべきだろう。

今の時代、エンジニアがAIを積極的に活用しないこと自体がリスクだと思っている。AIを使いこなせる人とそうでない人の生産性差は今後さらに広がっていく。だからこそ、組織としてAI活用を後押しする仕組みは必要だし、「使わなくてもいい」という空気を作ることは避けるべきだ。

ただし手段として「リーダーボードで競わせる」のは最悪の方法だった。人間は計測された指標をハックする生き物だ。スコアが目的になった瞬間に仕組みは壊れる。正しいアプローチは、「使えばこう成果が出る」という体験を組織内で設計・共有すること。AIを使った方が明らかに楽で速くて良い成果が出る——そういう状況を先に作ることが、KPI設定よりも優先されるべきことだろう。数字は後からついてくる。まず成功体験を設計せよ、というのがAmazonの失敗から学べる最大の教訓だ。


出典: この記事は Amazon scraps AI leaderboard to stop workers chasing usage scores の内容をもとに、筆者の見解を加えて独自に執筆したものです。