ChatGPTがついに「動く」AIへ——自律エージェント機能が正式統合

OpenAIは、ChatGPTに自律エージェント機能「ChatGPT agent」を統合すると発表した。これまで別サービスとして提供されていた「Operator」(ウェブブラウザ操作)と「Deep Research」(深掘り調査)の機能を一つのアーキテクチャに統合し、ユーザーの指示に応じてリサーチから実際のウェブ操作・資料作成までを連続して自律実行できるようになる。

何ができるのか

ChatGPT agentの最大の特徴は、「調べて終わり」ではなく「調べて動く」点にある。仮想ブラウザを内蔵しており、ウェブ上での情報収集、フォームへの入力、ファイルのダウンロード、さらにはスライド資料の作成といった一連の作業を、ユーザーが手を動かすことなく完結させることができる。

例えば「競合他社の最新製品情報をリサーチして、比較スライドを作って」という指示を出せば、ChatGPT agentが自律的にウェブを巡回して情報を収集し、そのままプレゼンテーション資料まで仕上げる——そういった使い方が想定されている。

Operator × Deep Research の統合という意味

Operatorは2025年初頭に公開された、AIがブラウザを操作して実際のウェブタスクをこなす機能だ。一方のDeep Researchは、複数のウェブソースを横断して深掘り調査レポートを生成する機能として好評を博してきた。

今回の統合により、これら2つの能力が「統一アーキテクチャ」のもとでシームレスに連携する。リサーチフェーズとアクションフェーズの間でコンテキストが途切れず、より複雑なマルチステップタスクにも対応できるようになった点が技術的な進化のポイントだ。

展開スケジュールと対象プラン

現在、ChatGPT Pro・Plus・Teamプランのユーザーに順次展開中だ。日本でもこれらのプランを契約しているユーザーであれば、ロールアウトが完了次第利用可能になる見込みだ。EnterpriseやEducationプランへの展開時期は別途アナウンスされる予定。

AIエージェント時代の本格到来

GoogleのProject Mariner、MicrosoftのCopilot Actionsなど、大手テック企業が一斉に「AIエージェント」機能の実用化を進めている。ChatGPT agentの登場は、LLM(大規模言語モデル)が「会話するだけのAI」から「代わりに動いてくれるAI」へと進化する流れをさらに加速させるものだ。

ビジネスユーザーにとっては、定型的な情報収集・資料作成業務の大幅な効率化が期待できる。一方で、AIが自律的にウェブにアクセスして操作を行う以上、セキュリティやプライバシーの観点からどこまでの権限を与えるかを慎重に判断する必要もあるだろう。


元記事: Introducing ChatGPT agent: bridging research and action