Meta、社員のキーストロークをAI学習データに活用——コンピューター操作AIの「訓練データ不足問題」に業界が直面

社員の操作ログが「AIの教科書」に

Metaが、自社社員のマウス操作やキー入力を記録し、AIモデルの学習データとして活用する内部ツールを導入したことが明らかになった。これはコンピューターを自律的に操作するAIエージェント、いわゆる「コンピューター・ユース型エージェント」の精度向上を目的としたものだ。

Metaの広報担当者はTechCrunchへの取材に対し、「日常業務をコンピューターでこなすエージェントを構築するには、人間が実際にアプリケーションをどのように使うか——マウス移動、ボタンクリック、ドロップダウンメニューの操作など——のリアルなデータが必要だ」と説明した。センシティブな内容を保護するセーフガードは設けているとし、データは他の目的には使用しないとしている。

なぜ「操作ログ」が必要なのか

訓練データ枯渇という構造問題

生成AIの性能向上には大量の高品質な学習データが不可欠だが、インターネット上のテキストデータは既に多くが学習済みとなり、新規の高品質データの確保が業界全体の課題になっている。

コンピューター操作型エージェントは特に、「GUIをどう操作するか」という実際の行動データが必要だ。マウスカーソルがどこへ動き、何を見て、どこをクリックするのか——こうしたデータはWebをスクレイピングしても得られない。実際の人間の操作から収集するしかない。

企業コミュニケーションも「素材」に

こうした動きはMetaだけではない。先週はSlackアーカイブやJiraチケットといった企業内コミュニケーションが、廃業スタートアップのデータとして買い取られAI訓練に転用されているという報道も出ている。業界全体が、新たな訓練データソースを手探りで模索している状況だ。

実務への影響——日本のIT管理者・エンジニアが今知るべきこと

① 社員の行動ログ利用には同意設計が不可欠 Metaが社員のデータを使えるのは、社員という立場ゆえに同意取得や社内ポリシーの整備が可能だからだ。日本企業が社内で同様の取り組みをするには、就業規則・プライバシーポリシーの整備、労使協議が必須になる。社内AI活用の取り組みを進める際は、この観点を最初から設計に組み込んでおくべきだ。

② SaaS利用データの「学習利用」規約を確認せよ 利用しているSaaSサービスの利用規約が、操作ログやコンテンツをAI学習に使うことを許可しているか確認しておくことを強く勧める。とりわけ機密情報を扱うツールについては定期的な確認が必要だ。

③ コンピューター操作型AIは実用化段階に入りつつある 今回の取り組みが示すのは、「画面を見て自律的に操作するAIエージェント」の開発競争が本格化しているということだ。繰り返し作業の多い業務フローを持つ企業にとって、近い将来この種のエージェントが業務自動化の中心になる可能性がある。今のうちに自社の業務フローを可視化し、どこがエージェントに任せられるかを整理しておく価値がある。

筆者の見解

コンピューター操作型AIの発展という文脈では、操作ログの活用はロジカルな判断だ。「人間がどうGUIを操作するか」は確かにWebからは取れない。この課題自体は業界共通の問題であり、Metaが「自社社員」を使うというアプローチで解決しようとするのは理解できる。

ただ、ここで立ち止まって考えたいのはプライバシーの設計思想だ。「セーフガードがある」「他の目的には使わない」という声明は出ているが、社員がどこまで選択できるのか、実際にどのデータが取得・除外されているのかの透明性は十分ではない。雇用関係という非対称な力関係の中で「任意の同意」が真に成立するかは、慎重に見る必要がある。

より本質的な問いは、「誰が所有しているデータを使うのか」という軸だ。自社社員のデータを使うのは、外部のデータを無断利用するよりは正当性がある。しかし、その先に「社員の行動がモデルの中に組み込まれ、そのモデルが外部製品として販売される」という流れを透明化できているかどうかが、企業としての信頼性に直結する。

AIエージェントが「自律的にコンピューターを操作する」未来は確実に来る。重要なのはその能力の高さだけでなく、「誰のデータで、どのように作られたか」を問い続ける姿勢だ。日本のIT組織がこの種のエージェントを導入するにあたっても、ベンダーのデータ利用方針は調達判断の重要な要素として扱うべきだろう。

出典: この記事は Meta will record employees’ keystrokes and use it to train its AI models の内容をもとに、筆者の見解を加えて独自に執筆したものです。

社員の操作ログが「AIの教科書」に#

なぜ「操作ログ」が必要なのか#

訓練データ枯渇という構造問題#

企業コミュニケーションも「素材」に#

実務への影響——日本のIT管理者・エンジニアが今知るべきこと#

筆者の見解#