AIで生産性爆上がりのはずが……PyPIデータが語る現実

「バイブコーディング(vibe coding)」やAIエージェントツールの愛好者たちは、「生産性が2倍、10倍、いや100倍になった!」と声高に主張する。実際、ある開発者はAIを活用してWebブラウザをゼロからフルスクラッチで構築してしまったという話まで出てきた。

しかし、懐疑的な視点を持つ人々はこう問いかける。「では、そのAIアプリとやらはどこにある?」

開発者が保守的に見ても2倍生産的になったとするなら、作られるソフトウェアの量も2倍になっているはずだ。その「AI効果」は一体どこで確認できるのか。

PyPIデータで検証する

Answer.AIのAlexis Gallagher氏とRens Dimmendaal氏は、この問いに答えるためPythonの中央パッケージリポジトリ「PyPI(Python Package Index)」のデータを分析した。PyPIは大規模かつ公開データであり、ソフトウェア生産量の変化を観測するのに適した指標と言える。

分析結果は明確だ。ChatGPT登場(2022年11月)前後でパッケージ総数の増加トレンドに明確な変化は見られない。月次の新規パッケージ数にいくつかのスパイクは存在するが、これらはスパムやマルウェアの氾濫によるものであり、genuine(本物の)パッケージ創出ではない。

「本物の」パッケージで見ると?

単なるパッケージ数では不十分という批判も当然ある。そこで分析チームは別の指標を採用した。2025年12月時点でダウンロード数上位1万5000パッケージを対象に、誕生年ごとのコホートに分け、各コホートの「リリース頻度(update releases)」の中央値を時系列で追跡した。

結果は「まあ……そうかも?」というものだった。

ChatGPT登場後に生まれたパッケージは、最初の1年間のリリース頻度が年13回と、2014年生まれ(年6回)と比較して確かに高い。しかし、この上昇トレンドはChatGPT登場よりも前の2019年頃から始まっており、GitHub ActionsなどのCI(継続的インテグレーション)ツールの普及と時期が一致する。AIの恩恵と断言するには根拠が弱い。

さらに、「パッケージが古くなるほどリリース頻度が下がる」傾向はAI時代になっても変わっていない。AIが長期的なメンテナンスを活性化させているという証拠は見当たらない。

AIパッケージに限れば話は別

興味深いのは、パッケージをAI関連かどうかで分類した場合だ。AIに関連するパッケージには明確な「AI効果」が現れているのに対し、そうでないパッケージにはほとんど変化がない。

これは何を意味するのか。AIはAIそのものを開発するための生産性は押し上げているが、ソフトウェア開発全体のパラダイムシフトにはまだ至っていない可能性が高い。

日本の開発者へのインプリケーション

日本国内でもAIコーディングツール(GitHub Copilot、Cursor等)の活用が急速に広まっている。個々の開発者レベルでの体感的な生産性向上は確かに報告されているが、それが「作られるソフトウェアの総量」という巨視的な指標に反映されるまでには時間がかかるのかもしれない。あるいは、AIによる生産性向上は新たなソフトウェア創出よりも、既存システムの改善・技術的負債の解消に充てられているという解釈も成り立つ。

AIの生産性革命は本当に起きているのか。データが追いつくまで、議論はまだ続きそうだ。


元記事: So where are all the AI apps?