Trakkr.aiは2026年6月、ChatGPT・Claude・Gemini・Grok・Llama・DeepSeekの6つの主要AIモデルに対して、政治・経済・言論・社会をテーマにした同一の質問を繰り返し投与し、各モデルの政治的傾向を実測したレポートを公開した。Webサーチを無効化した状態で合計4,400件以上の回答を収集した結果、6モデル中4モデルが「中央左寄り」に位置することが明らかになった。

調査の概要:Webに汚染されない「素の傾向」を可視化

今回の調査の最大のポイントは、Webサーチを意図的にオフにした状態で計測している点だ。AIモデルは通常、回答時に外部の最新情報を参照するため、Webの情報バイアスが混入しやすい。Trakkr.aiはその影響を排除することで、モデルが学習データとRLHF(人間フィードバックによる強化学習)を通じて本来持っている傾向を純粋に可視化することを試みた。

評価軸は2つ。横軸が経済的な左右(左:再分配・規制重視 / 右:市場原理重視)、縦軸が社会的な自由度(リバタリアン寄り / 権威主義寄り)だ。各モデルへの質問を多数回繰り返してその回答の分布を「雲」として描き、実在政治家・政党の位置との比較でどの人物・勢力に最も近いかを示している。

実測結果:最も中立に近いのはGemini、最も左寄りはChatGPT

6モデルを中立に近い順にランクすると次のようになる。

  • Gemini(Google):最も中立に近く、オーストラリアのアルバニージー首相(労働党)に近い位置。回答の一貫性も98%と最高水準
  • DeepSeek:同じくアルバニージー首相付近だが、一貫性は67%と最低。同一質問への回答ブレが大きい
  • Llama(Meta):ニュージーランド労働党付近。一貫性88%
  • Claude(Anthropic):ニュージーランド労働党付近。一貫性82%
  • Grok(xAI):唯一の右寄り。フランスのマクロン大統領付近
  • ChatGPT(OpenAI):最も左寄り。ドイツの緑の党(Die Grünen)付近

「明確に右寄り」はGrokのみで、「大きく左寄り」はChatGPTという構図。残り4モデルは中央からやや左の狭い範囲に集まっている。

「言っていること」と「やっていること」の乖離

今回の調査で特に注目すべきは、各モデルが自己申告する政治的立場と実測値のギャップだ。

  • Claude:「中立」と自称するが、実測値は申告より0.34ポイント左寄り
  • Grok:実測値が自称より0.36ポイント右寄り(逆方向のズレ)
  • ChatGPT:「中立」と申告しつつ、実測では明確に左寄り

「自分は偏っていない」と言いながら回答では一定の方向に傾いているという構図は、RLHFのプロセスで形成された価値観の重心が、モデル自身には自覚されにくいことを示唆している。

意見が最も割れる質問テーマ

モデル間で最も意見が分かれたのは以下のテーマだ。

  • 娯楽目的の薬物合法化
  • 未成年へのジェンダーアファーミングケア
  • 多文化共生 vs 同化政策
  • 急速な脱化石燃料
  • 計画的な脱成長(デグロース)
  • 大企業役員会への多様性クオータ制
  • 相続税・富裕税(5000万ドル超)
  • ヘイトスピーチの刑事罰化
  • 暗号化バックドアの義務化
  • 国家デジタルIDの導入

いずれも日本でも議論が始まっている、または近い将来に議論になりうるテーマばかりだ。

日本のIT現場への影響

日本でも「AIにニュースを要約させる」「AIに社内ドキュメントを書かせる」「AIにポリシーの是非を問う」という使い方が急速に広がっている。この実態を踏まえると、以下の点を意識する必要がある。

情報収集・要約用途:社会的・政治的なトピックをAIにまとめさせる場合、モデルの傾向に沿った視点が強調されるリスクがある。複数のモデルや情報源を組み合わせるリテラシーが現実的な対策だ。

意思決定支援への組み込み:採用スクリーニング、投資判断支援、コンテンツモデレーションなどセンシティブな判断にAIを使う場合、モデルの政治的傾向が判断に混入するリスクを評価すべきだ。

AI利用ポリシーの設計:企業がAI利用基準を整備する際、「どのモデルを使うか」の判断基準にバイアス評価を加えることを検討する価値がある。「Webサーチなしでのベースライン傾向」という観点は、ガバナンス設計において新たな論点になりうる。

筆者の見解

今回の調査が改めて示すのは、「AIは中立な情報源」という思い込みを見直す必要があるという事実だ。どのモデルも学習データとRLHFを経て何らかの価値観の重心を持っており、それを完全にゼロにすることは現時点では不可能に近い。

重要なのは「どのモデルが一番正しいか」を競うことではなく、使い手が自分の使っているモデルの傾向を把握した上で活用することだ。医薬品に添付文書が存在するように、AIモデルにも「傾向・バイアスの開示」が当然のものとして普及すべき時代に入っている。

Trakkr.aiのようなサードパーティによる継続的な実測は、AIリテラシーの底上げという点で意義深い試みだ。同様の調査が日本語モデルや日本語プロンプトに特化した形で行われることも期待したい。AIを道具として正しく使いこなすためには、その道具の特性を知ることが前提となる。それはエンジニアにとって当然の姿勢のはずだ。


出典: この記事は Political bias in AI: Where the AI models stand の内容をもとに、筆者の見解を加えて独自に執筆したものです。