WikipediaがAI生成コンテンツを禁止——7,100万記事を抱える百科事典の決断

インターネット最大の百科事典であるWikipediaが、大規模言語モデル(LLM)を使ったコンテンツの生成・書き直しを全面禁止するポリシーを導入した。英語版Wikipediaには現在7,100万件以上の記事が掲載されており、その品質を守るための措置だ。

禁止の背景——ボランティア編集者たちの懸念

Wikipediaは、LLMの利用が同サイトの核心的な原則を「しばしば侵害する」として禁止を明文化した。この決定はWikipediaのボランティア編集者コミュニティによる投票で支持されたものだ。

AI利用はWikipedia編集者の間で長らく論争の種となっていた。AIが生成する文章は表面上は流暢でも、引用された出典に基づかない内容を含んだり、文章の意味を微妙に変えてしまうリスクがある。新ポリシーはこの点を明確に指摘している。

「LLMはあなたが求めた以上のことをして、引用された出典で裏付けられていない内容に文章の意味を変えてしまうことがあるため、注意が必要です」

例外として認められる2つのユースケース

全面禁止とはいえ、以下の2つのケースに限りAIの利用が認められている。

  • 翻訳補助 — 外国語コンテンツの翻訳に際してAIを補助的に使用すること
  • 軽微なコピー編集の提案 — 自分の文章に対してLLMに基本的な校正提案をさせること。ただし、AIが独自のコンテンツを追加せず、人間によるレビューを経た上での採用に限る

Wikipedia創設者ウェールズ氏のスタンス

Wikipediaの創設者ジミー・ウェールズ氏はかねてからAI活用に慎重な姿勢を示してきた。昨年BBCに対し、「絶対にないとは言わないが、少なくとも短期的には使わない。最新のモデルもWikipediaの基準からはまだ全く十分ではない」と語っている。

ChatGPTがWikipediaの月間訪問者数を上回った現実

皮肉なことに、ChatGPTは昨年Wikipediaの月間サイト訪問者数を上回ったと報じられている。AIが基本的な情報収集の手段として急速に普及する一方で、AIは「ハルシネーション(幻覚)」と呼ばれる誤情報を生成するリスクを抱えている。ウェールズ氏はこの状況を「混乱(a mess)」と表現していた。

日本語版Wikipediaへの影響は?

今回の禁止ポリシーは英語版Wikipediaが採択したものだが、他言語版の編集コミュニティにも影響を与える可能性がある。日本語版Wikipediaにも独自の編集ガイドラインがあるため、今後の動向が注目される。AIと信頼性の高い百科事典の共存という課題は、世界中のコミュニティが直面している問題だ。


元記事: Wikipedia bans AI-generated content in its online encyclopedia