Big4会計事務所のKPMGが昨年10月に公開したエージェントAIの業界レポートに、大量のAIハルシネーションが含まれていたことが明らかになった。Engadgetが2026年6月13日に報じた。

なぜこのレポートが問題になっているのか

KPMGは「Total Experience: Redefining Excellence in the Age of Agentic AI」と題したレポートを2025年10月に公開。エージェントAIを活用して顧客対応を革新している企業事例を紹介する内容だった。KPMGはDeloitte、PwC、EYとともに「Big Four」と称される世界最大規模の専門サービス・会計事務所グループの一角であり、そのレポートは業界や学術研究者から高い信頼性を持つ情報源として引用される存在だ。

GPTZeroとFinancial Timesの調査ポイント

AI生成コンテンツ検出ツールのメーカーGPTZeroが実施した調査によると、レポート内45件の引用のうち、実在するソースを正確に指していたのはわずか5件だったという。内訳は以下の通り。

  • 正確な引用: 5件
  • タイトルを言い換えたり架空の要素を追加: 28件
  • 実在を確認できないほど曖昧な記述: 12件

記事中の主張の約半数も「捏造または誤帰属」と報告されている。GPTZeroはこうしたAIによる架空文献生成を「バイブ・サイティング(vibe citing)」と命名した。この調査結果はFinancial Timesも独自に検証・確認している。

具体的な誤りとして報告された事例を紹介する。

  • KPMGは「エミレーツ航空がモバイルチャットボット『Sara』を立ち上げ、乗客との会話や予約変更が可能」と記載した。しかし実際のSaraは2023年公開のAI非搭載モバイルアシスタントであり、予約変更機能も持っていなかった
  • UBS(スイスの大手投資銀行)が「投資助言・リスク管理・コンプライアンス監視にわたってエージェントAIを統合した」と記述されたが、UBS広報は「事実と異なる」と明確に否定した
  • スイス連邦鉄道(SBB)が「リアルタイム状況や炭素排出量をもとに旅行の計画・予約・最適化を支援するAIエージェントを導入した」とされたが、SBB広報担当者は「正確ではない」とコメントした

GPTZeroのCEO Edward Tian氏は、Big4のような権威ある組織が誤りの多いレポートを公開することで「情報の井戸を汚染し、二次的なAIハルシネーションを誘発する連鎖が起きる」と警告している。KPMGはレポートを取り下げ、「公開に至った状況を審査中」とコメントした。

日本市場での注目点

KPMGのような国際的なコンサルティング大手のレポートは、日本国内でも経営層向けの提案資料や研究論文で頻繁に引用される。今回のケースが示すのは、権威ある発行元だからといって内容の正確性が保証されるわけではないという事実だ。

国内のコンサルや事業会社がAI活用の根拠としてBig4レポートを引用する際には、出所をたどって一次情報を確認する習慣が従来以上に重要になっている。「どのAIツールで生成されたか」「人間によるファクトチェックのプロセスが入っているか」という問いが、情報リテラシーの新たな基準になりつつある。

筆者の見解

今回の一件で問題の本質は「AIがハルシネーションを起こした」という事実そのものではなく、組織としての検証プロセスが機能しなかった点だ。KPMGほどの企業がレポートを公開するまでには、通常であれば複数のレビュープロセスが存在するはずである。

GPTZeroが指摘するように、AIツールが「過剰に要求に応えようとした」ことが発端だとしても、それを防ぐ仕組みを設計するのは人間の責務だ。「AIが間違えた」で終わらせるのは短絡的であり、むしろ「AIを使うからこそ、出力の検証設計が必要だ」という方向に議論を進めるべきだろう。

エージェントAIの普及が加速するなか、生成した情報をそのまま外部公開しないという当たり前のガバナンスを組織的に実装できるかどうかが、今後の信頼性を左右する。ツールの問題ではなくプロセスの問題——この事例はその典型として長く語られることになるだろう。


出典: この記事は A report on the benefits of AI was reportedly full of AI hallucinations の内容をもとに、筆者の見解を加えて独自に執筆したものです。