米ミシシッピ州北部連邦地方裁判所で、原告・被告双方の弁護士がAIが生成した架空の判例を訴訟書類に引用していたことが発覚し、シャリオン・エイコック上席連邦地方判事が裁判を中止、関与した弁護士4名全員を失格処分にするという前代未聞の制裁命令を下した。

何が起きたのか

事件の発端は、弁護士トム・ウィザーズとミシシッピ州アバディーン市の間で起きた未払い法律費用をめぐる契約紛争だった。訴訟そのものは一般的な民事案件だったが、両陣営の弁護士が裁判資料を作成するにあたり生成AIを使用し、実在しない判例を「引用」して法的主張を行っていたことが明らかになった。

エイコック判事の制裁命令は厳しい言葉で綴られている。「本法廷はまたもやAIハルシネーションを含む裁判所への申立に対処する負担を負わされた」と記し、「検証なきAI使用が蔓延するこの時代において、本件は『ゴム印』として機能することのリスクを示す典型例だ」と断じた。

弁護士AI利用問題を頻繁に報道するロブ・フロイト弁護士は、この件を「AI誤りの喜劇」と表現し、「実質的に2人の依頼人がChatGPT(または何らかのLLM)に自分自身と戦わせるためにお金を払っていた」と指摘している。

制裁の内容

判事が下した処分は以下の通り:

  • 裁判の中止:進行中の手続きをすべて停止
  • 弁護士4名全員の失格処分:事件から排除
  • 2名に2年間の出廷禁止:当該法廷への出廷を2年間禁止
  • 罰金:各弁護士の責任度に応じて1,000〜3,500ドルの罰金

ハルシネーション問題は繰り返されている

この事件は決して孤立したケースではない。404 Mediaが報じてきた一連の事例と同じパターンを踏んでいる。弁護士によるAIハルシネーション問題は全米の裁判所で急増しており、先週もニューヨーク州の裁判官が複数の弁護士を架空判例引用を理由に叱責したばかりだ。

今回の特異性は「双方」が同じ過ちを犯していた点にある。通常は一方の弁護士が架空判例を引用し、相手方から指摘を受けて発覚するパターンが多い。しかし今回は双方が同様の不正を行っていたため、互いに指摘する立場になく、裁判官が直接問題を発見する事態となった。

実務への影響:日本のIT現場・法務部門への示唆

法務・コンプライアンス担当者へ

日本でも法律事務所や企業法務部門での生成AI活用は急速に広がっている。今回の事件が示す教訓は明確だ。AIが生成した法的引用・判例は必ず一次情報で検証する運用フローを確立すること。「AIが書いたから正確だろう」という前提は通用しない。

特に判例検索・文書作成AIツールを導入している組織は、出力内容のダブルチェックを人間のレビュアーが行う工程を省略しないよう、ワークフロー設計を見直す好機だ。

AI活用推進担当者へ

この事件はしばしば「だからAIは使うべきでない」という結論に使われるが、それは誤読だ。問題はAIを使ったことではなく、AIの出力を「ゴム印」として検証なしに使ったことにある。生成AIツールを組織展開する際は、ツール選定と同等かそれ以上のエネルギーを「検証ステップの設計」に投入する必要がある。

筆者の見解

この事件を技術的に読み解くと、問題の本質はハルシネーションそのものではなく、「AIの出力を人間が確認しないまま本番運用に流す設計」にある。

私がAIエージェントの設計で一貫して重視しているのが「検証ループ」だ。AIが自律的に動作する仕組みを作るとき、出力→検証→修正→再実行というループを設計に組み込まないと、エラーが増幅されたまま最終アウトプットに到達してしまう。今回の弁護士たちは、まさにこの検証ループを持たない運用でAIを使った。

「AIを使わなかったことにしよう」という方向に逃げるのは現実的ではない。法律の世界でも技術の世界でも、AIを使わないことが競争劣位になる時代はすでに来ている。重要なのは「AIを使うかどうか」ではなく、「AIの出力をどう検証する仕組みを持つか」を組織として定義できているかどうかだ。

今の時代に「AIを積極的に使わない」こと自体が問題なのと同様に、「AIを使うが検証しない」ことも同等に問題だ。ツール導入と運用設計はセットで考えなければならない。裁判所が繰り返し同じ判断を下さざるを得ない状況は、法曹界全体の運用設計の成熟度を問うているとも言える。


出典: この記事は Judge Learns Both Sides Used AI, Cancels Trial, Kicks Everyone Off the Case の内容をもとに、筆者の見解を加えて独自に執筆したものです。