ゲームデータがAIワールドモデルの学習に使われる時代へ──Origin Lab、Lightspeed主導で800万ドルを調達

Origin Labは2026年5月、ビデオゲーム会社が保有するデジタル資産をAIの「ワールドモデル」学習データとして販売できるマーケットプレイスを構築するため、Lightspeed Ventures主導で800万ドルのシード資金を調達した。SV Angel、Eniac、Seven Stars、FPVが参加し、Twitch共同創業者のKevin LinとCruise創業者のKyle Vogtもエンジェル投資家として名を連ねている。

ワールドモデルとは何か、なぜデータが不足しているのか

大規模言語モデル（LLM）はインターネット上の膨大なテキストデータを学習することで急速に進化した。しかし、AIがロボットを操作したり、物理空間内の物体の動きを予測したりするために必要な「ワールドモデル」の開発は、別の壁に直面している。物理世界の動作データが圧倒的に少ないのだ。

ヤン・ルカン（Meta AIチーフサイエンティスト）が率いるAMI Labsや、フェイフェイ・リーのWorld Labsなど、物理世界を理解するAIの開発を進める各社は、適切な学習データの調達に苦労してきた。現実世界でセンサーやカメラを使ってデータを収集する方法では、コストと時間がかかりすぎる。

ゲームが「物理シミュレーターの宝庫」である理由

Origin Labが着目したのは、ビデオゲームの本質的な特性だ。現代のゲームエンジンは、重力・摩擦・衝突・流体など、物理世界の法則を忠実に再現するシミュレーション環境を備えている。キャラクターの動き、物体の落下、車両の挙動──これらすべてが数値化されたデータとして存在する。

「AIシステムが物理世界の仕組みや物の動き方を理解するためのデータは、本質的にビデオゲームの中に存在する」と、共同CEOのAnne-Margot Rodde氏はTechCrunchに語っている。

Origin Labは単なるデータ仲介に留まらず、ゲームアセットをAIラボが扱えるフォーマットに変換する役割も担う。単純なレンダリング処理から、数時間分のウォークスルー映像の自動生成まで、変換の複雑さはデータの種類によって異なる。

ライセンス問題という「大人の事情」を解決する

ゲームデータへの関心はAIラボの間で以前からあったが、ライセンスと品質の問題が常に障壁になってきた。

2024年12月、OpenAIのSora（動画生成モデル）が人気ゲームのプレイ映像を無断で学習に使用していた疑惑が浮上し、業界で物議を醸した。AmazonもTwitchのストリーミング映像を学習データとして活用することへの関心を公言しているが、権利処理の複雑さは変わらない。

Origin Labはゲーム会社とAIラボ双方が参加するライセンス取引の基盤を構築することで、この「灰色地帯」を合法的なビジネスに転換しようとしている。ゲーム会社にとっては既存資産から新たな収益源を得られる。AIラボにとっては高品質かつ法的にクリアな訓練データを調達できる。

投資を主導したLightspeedの見方

今回の投資を主導したLightspeed VenturesのFaraz Fatemi氏は、Scale AIなどデータベンダーが主要AIラボへの供給で急成長を遂げた例を引き合いに出す。「データベンダーの収益拡大がいかに急激なものかを目の当たりにしてきた。主要ラボはどこもデータがボトルネックになっている」と語る。ゲーム業界とAI業界の両方に知見を持つ投資家が名を連ねている点は、このマーケットの現実的な需要を示している。

実務への影響

ゲーム会社・デベロッパー: 過去に作成した3Dアセット、モーションデータ、物理シミュレーションデータが新たな収益源になる可能性がある。自社IPの価値を見直す機会でもある。権利クリアな形でマネタイズできるプラットフォームが整備されつつあることは注目しておきたい。

AIエンジニア・研究者: ワールドモデル分野に関わる場合、今後こうしたデータマーケットプレイスが訓練データ調達の主要チャネルになっていく。データソースの多様化と品質評価の方法論を今から整理しておくべきだ。

企業のAI導入担当者: 現在の生成AIブームはテキスト・画像が中心だが、物理世界を扱うAI（ロボティクス、デジタルツイン、自動運転など）が次のフェーズに入りつつある。そのインフラ整備が進んでいることを把握しておきたい。

筆者の見解

今回のOrigin Labの取り組みで興味深いのは、「データ問題の解き方」の構造にある。

LLMの時代は、インターネット上の無数のテキストを半ば強引にかき集めることで成立してきた面があった。しかしそのやり方は権利問題と品質問題の両方で行き詰まりを見せている。OpenAIのSoraの件はその象徴的な出来事だった。

Origin Labが提案するのは、最初からライセンスを明確にした上でデータ取引を行う「正しい構造」だ。データ提供者には対価が支払われ、AIラボは法的リスクなく高品質なデータを使える。こういう仕組みが最初から整備されていればよかったわけで、遅まきながらもこの方向に進むことは評価できる。

ゲームという「物理シミュレーションの副産物」に着目したアイデアも面白い。ゲーム会社が膨大なコストをかけて作り上げた物理エンジンの恩恵を、AI開発が受ける形になる。一方でゲーム会社も既存資産から新たな収益を得られる。こういうWin-Winの構造設計は、データ経済の成熟を示すものだと思う。

ワールドモデルはロボティクスや自動運転の基盤技術として注目されている分野で、ここ1〜2年で急速に投資が集まっている。LLMでテキスト系AIが成熟しつつある今、次のフロンティアを考えるとき、物理世界を理解するAIは有力な候補の一つだ。Origin Labのようなデータインフラを担うスタートアップが正当な評価を受ける時代が来ていると感じている。

出典: この記事は Origin Lab raises $8M to help video game companies sell data to world-model builders の内容をもとに、筆者の見解を加えて独自に執筆したものです。

ワールドモデルとは何か、なぜデータが不足しているのか#

ゲームが「物理シミュレーターの宝庫」である理由#

ライセンス問題という「大人の事情」を解決する#

投資を主導したLightspeedの見方#

実務への影響#

筆者の見解#