採用プロセスへのAI活用が急速に広がる中、見落とされていたリスクが論文として可視化された。求職者が履歴書作成にLLMを使い、企業側が同じLLMでスクリーニングする——この「AI対AI」の構図が、人間の書いた応募書類を組織的に不利にする可能性が実証された。
何が明らかになったか
Jiannan Xuら(2025年8月、arXiv)の研究チームは、大規模な対照実験を設計した。主要な商用・オープンソースLLM複数種を対象に、「同一モデルが生成した履歴書」「人間が書いた履歴書」「別モデルが生成した履歴書」をスクリーニングさせ、合否傾向を比較した。
結果は鮮明だった。
- 自己優先バイアスは67〜82% ——モデルは人間の書いた履歴書より自分が生成したものを一貫して高く評価した
- 同一LLM使用者の書類通過率は23〜60%高い ——24職種のシミュレーションで、採用側と同じモデルを使った応募者が等しい能力でも有意に有利だった
- 最も不利なのは営業・経理など業務系職種 ——技術系より文章表現の比重が高いポジションで格差が大きかった
- シンプルな介入で50%超の抑制が可能 ——モデルの自己認識能力を狙った介入で、バイアスを大幅に低減できることも示された
なぜこのバイアスが生まれるのか
LLMは学習データと生成パターンを持つ。自分の出力には「自分らしい語彙・文体・論理構造」が刻まれており、それを評価基準として読み込むと自然に高評価を与える傾向がある。いわば「自分の文章を採点したら甘くなる」という構造的な問題だ。
これは意図的な不正ではなく、モデルアーキテクチャに起因する特性であるため、プロンプトで「公平に評価してください」と指示するだけでは解消されない。
日本の現場への影響
日本では新卒一括採用・ES(エントリーシート)選考という独自の慣行がある。この文化とAIスクリーニングの組み合わせは、海外以上に問題をはらむ可能性がある。
採用担当者が今すぐ確認すべき点:
- スクリーニングに使うLLMと、求職者が使いやすいLLMが一致していないか確認する ——特定のAIサービスを社内ツールとして案内しているケースは要注意
- ESや履歴書の評価基準を明文化する ——「LLMが書いたかどうか」ではなく「どの能力を評価するか」を先に定義すると、バイアスの影響を構造的に抑えられる
- 複数モデルを評価に組み合わせることを検討する ——単一モデルに一任せず、異なるモデルの評価を並走させて差異を見る方法は現実的な対策になる
- 定期的な「ヒューマンレビューのサンプリング」を仕組みとして組み込む ——AIスクリーニング後の書類をランダムに人間が再評価し、システム偏差を定点観測する
応募者の立場からは:
- 自分のESや職務経歴書にAIを使う場合、使うモデルを多様化しておくと特定モデル依存のリスクを分散できる(これは防衛策であり、「AI利用をやめろ」というメッセージではない)
公平性の枠組みを広げる必要性
AI倫理の議論はこれまで「性別・年齢・人種等の属性バイアス」に集中してきた。今回の研究が問うのは、それとは異なる次元の問題だ。「どのツールを使ったか」という選択が、能力と無関係に選考結果を左右するなら、これは新しいデジタルデバイドになりうる。
高価な有料LLMサービスを使えた応募者の方が選考を通りやすい——そういう構造が静かに形成される前に、採用基準の設計とAI選定の見直しが求められる。
筆者の見解
「禁止すれば解決する」という発想は、ここでも通じない。
すでに求職者はAIで履歴書を書いており、企業はAIでスクリーニングしている。この現実を否定するのではなく、「どう設計すれば公平に機能するか」を考えるフェーズに入っている。
この研究が示した「介入によって50%超のバイアス低減が可能」という知見は重要だ。問題は認識されており、技術的な解決策も存在する。あとはそれを実際の採用フローに実装できるかどうか、設計する側の意思次第だ。
もう一つ気になるのが、この問題の「見えにくさ」だ。採用の合否は個人の実力以外の要因が複合するため、バイアスが存在しても統計的に露出しにくい。今回のように大規模な対照実験を設計しなければ可視化できない類の問題だ。
AIを使った意思決定の仕組みを構築する際には、「使っている」だけでなく「どう使っているかを観測し続ける」仕掛けが不可欠だ。採用に限らず、コンテンツモデレーション・ローン審査・人事評価——LLMが評価する側と評価される側の両方に立つ場面では、今回の知見を意識した設計が求められる。
採用AIの公平性は、今後数年で規制と訴訟の焦点になる可能性がある。日本企業も「とりあえず使ってみた」から「説明責任を持って運用する」フェーズへの移行を、早めに進めた方がいい。
出典: この記事は AI Self-preferencing in Algorithmic Hiring: Empirical Evidence and Insights の内容をもとに、筆者の見解を加えて独自に執筆したものです。