GitHub Copilotがユーザーデータをモデル学習に利用へ——オプトアウト期限を逃すと自動同意に

GitHub Copilotの利用データが学習に使われる——あなたは知っていたか？

MicrosoftのGitHub部門は、AIコーディングアシスタント「GitHub Copilot」の利用データを、モデルのトレーニングおよび第三者との共有に使用する方針を近く導入することを明らかにした。問題は、ユーザーが積極的にオプトアウトしない限り、自動的に同意したとみなされる点だ。

新方針の下では、GitHub CopilotのユーザーがIDEで入力したコード補完の要求・受け入れ・拒否といったインタラクションデータが、GitHubおよびMicrosoftのAIモデル改善に活用される可能性がある。さらに、このデータが「パートナー企業」との間で共有されることも示唆されている。

オプトアウトの手続き自体は用意されているが、期限を過ぎると自動的にオプトイン状態となる仕様であり、見落とすリスクが高い。

個人開発者はもちろん、企業でCopilotを導入しているIT管理者にとっては特に重大な問題だ。業務コード・独自アルゴリズム・機密ロジックが学習データとして外部に渡る可能性があり、知的財産の観点から慎重に判断が求められる。

日本でもGitHub Copilotの法人導入は急速に進んでいるが、今回の変更を受けて利用規約の再確認と、社内ガイドラインの見直しを行う企業が増えることが予想される。

現時点でユーザーが取れる行動は以下の通りだ。

OpenAI、Google、Microsoftなど主要AI企業がユーザーデータの学習利用を拡大する流れは続いており、GitHub Copilotも例外ではない。利便性と引き換えに、どこまでデータを提供するかの判断を、開発者一人ひとりが求められる時代になっている。

オプトアウト期限の詳細はGitHubの公式アナウンスで確認することを強く推奨する。