AIが書いたGitHubイシューは「ゴミ」——Flaskの生みの親Armin RonacherがLLM生成バグ報告の害悪を告発

Flask・Jinja2の生みの親であるArmin Ronacherが、自身のプロジェクト「Pi」に寄せられるAI生成GitHubイシューの品質問題について、2026年5月24日に公開批判を展開した。「最も腹立たしいのは、自分の言葉ではない問題報告だ」と彼は率直に語る。

何が起きているのか

オープンソースのメンテナーたちが直面しているのは、ユーザーがAIに丸投げして生成させたバグ報告の洪水だ。Ronacherはこれを「スロップ（slop）」と呼ぶ。観察された問題はそこにあるのに、LLMを通した瞬間に別物になってしまう。

具体的に何が壊れるかを列挙すると：

根本原因の的外れな推測 — 自信満々だが実際には当てずっぽう
偽の最小再現手順（fake minimal repro） — 実際には再現しないコードが貼られる
間違ったコードへの類推 — 隣接するが無関係なコードを参照
関係あるかわからないエラークラスの長大リスト — 量で品質を偽装

「信頼できる情報ゼロ、確信だけ満載」という最悪の組み合わせが、メンテナーの調査コストを爆発させている。

RonacherはOSSに何を求めているか

Ronacherの要求はシンプルだ。AIで装飾した分析より、人間が実際に目撃したことを4行で教えてほしい：

私はこのコマンドを実行した
こうなると期待した
こうなった
正確なエラーまたはログはこれだ

「あなた自身の声で書かれたイシュー」だけを求める——これがメンテナーの本音だ。

日本のエンジニア・IT管理者への影響

この問題は海外の話ではない。日本の開発現場でも、コーディングエージェントやAIアシスタントを使って社内ツールのバグ報告や外部OSSへのイシュー提出を行うケースが増えている。

今すぐ実践できるヒント：

AIに「分析」させるな。「整形」させろ。 自分で観察した事実をまず箇条書きにし、AIにはその文章を整える程度に留める
再現手順はローカルで確認してから貼る。 AI生成の再現コードはそのままコピーしない
プロンプトに「根本原因を推測するな」と明示する。 LLMはデフォルトで原因まで語ろうとする。それを止める指示が必要
チームのイシューテンプレートにAI利用ガイドラインを追加する。 「観察事実のみ記載」「AI分析を含めない」を明文化する

OSSへのコントリビューション機会が増えている今、日本のエンジニアがスロップ報告を出さないようにすることは、国際的な信頼にも直結する。

筆者の見解

この問題の本質は「AIを使うこと」ではなく、「人間が観察をサボるためにAIを使っていること」だと思っている。

AIは自分が実際に何も見ていないのに根本原因を「推測」する。当然の話だが、見ていないものは推測しかできない。そこに高い確信度で語る言語モデルの性質が組み合わさると、まるで分析したかのような体裁の「役立たずレポート」が完成する。

AIエージェントが本当に強いのは、ループで動き続けながら自ら検証・確認できる場面だ。今議論されているような「ユーザーが問題をAIに投げて、AIが一発で分析してイシューを書く」というフローはエージェント設計として最も脆弱な形だ。AIが自分で環境を再現して試せる仕組みがなければ、出てくるのは想像の産物でしかない。

Ronacherの主張は正しい。そして彼が示した4行のフォーマットは、AI時代においても変わらない「良いバグ報告」の本質を突いている。AIツールの普及が進むほど、人間が「自分で何を観察したか」を正確に言語化するスキルの価値は上がる。AIに語らせる前に、自分が何を見たかを把握する——その習慣を崩さないでいたい。

出典: この記事は Quoting Armin Ronacher の内容をもとに、筆者の見解を加えて独自に執筆したものです。

何が起きているのか#

RonacherはOSSに何を求めているか#

日本のエンジニア・IT管理者への影響#

筆者の見解#

何が起きているのか

RonacherはOSSに何を求めているか

日本のエンジニア・IT管理者への影響

筆者の見解