OpenAIが音声エージェントモデル「Realtime 2」を正式リリースした。設定可能な推論(Configurable Reasoning)機能を備えた新世代の音声AIモデルで、既存モデルの廃止スケジュール——GPT-4.5が6月27日、o3が8月26日——も合わせて公表された。
Realtime 2 — 「考えながら話す」音声エージェントの登場
Realtime 2の最大の特徴は「設定可能な推論」だ。
従来のリアルタイム音声モデルは、音声入力を受け取り素早く音声で返答することに最適化されていた。応答速度を最優先にする設計上、複雑な推論は苦手な領域だった。
Realtime 2はこの制約を克服し、タスクの複雑さに応じて推論の深さを調整できる。「単純な質問にはすぐ答え、複雑な判断が必要な場面では推論ステップを踏む」という柔軟な動作が可能になる。
音声エージェントの実用シナリオを考えると、この変化は大きい。コールセンター対応・音声ベースのカスタマーサポート・ハンズフリー操作が求められる製造や物流の現場など、「声で動く自律エージェント」の実現可能性が格段に高まる。
廃止スケジュール一覧
モデル 廃止日
GPT-4.5 2026年6月27日
o3 2026年8月26日
GPT-4.5は2025年に登場した大規模モデルだが、比較的短命な存在で終わる形だ。o3はOpenAIの推論特化モデルとして注目を集めたが、o4-miniなどの後継・派生モデルへの整理が進む中での廃止となる。
OpenAIはモデルの世代交代サイクルが速く、APIを業務利用している組織はモデルのライフサイクル管理を継続的に行う必要がある。
実務への影響 — 今すぐ確認すべきこと
GPT-4.5・o3 APIを直接利用している開発者・チームへ
モデル廃止後もAPIを呼び出し続けると、エラーが返ってアプリケーションが停止するリスクがある。本番環境への影響を避けるため、早急に移行計画を立てることを強く推奨する。
- GPT-4.5利用中 → 6月27日までに GPT-4o または GPT-4.1 系へ移行
- o3利用中 → 8月26日までに o4-mini または o3-mini へ移行
どちらも期限まで2〜3ヶ月の猶予があるが、本番環境の変更には検証期間が必要だ。「まだ時間がある」と先送りにせず、移行対象の棚卸しと影響範囲の確認を今週中に済ませたい。
Realtime 2の活用を検討したいシナリオ
- 音声インターフェースを持つアプリの高度化(単純QAから複雑判断への対応)
- コールセンター・サポート業務の部分自動化
- ハンズフリーが求められる製造・物流・医療現場での音声エージェント導入
- 視覚的なUI操作が困難なユーザー向けのアクセシビリティ強化
筆者の見解
Realtime 2の「推論付き音声エージェント」というコンセプトは、エージェント設計の観点から非常に興味深い。テキストベースのエージェントが主戦場だった中で、音声インターフェースに推論能力を持ち込むことは、エージェントが動ける「場所」を大きく広げる。キーボードが使えない現場、画面が見られない状況、マルチモーダルな操作が自然な文脈——そういった領域に自律エージェントが入り込む道が開けてくる。
一方で、モデルのライフサイクルの速さは開発者側の負担になりつつある。新モデルが出るたびに移行コストが発生し、「最新を追い続けるべきか」「安定して使い続けることを優先すべきか」という判断を常に迫られる。
AIの進化に追随することが戦略的に正しい組織もあれば、「使えるものを安定して使い続ける」ことを優先すべきフェーズの組織もある。自社のAI活用の成熟度を見極め、追いかけるものと安定させるものを意識的に分けることが、AIを組織に根付かせるための現実的なアプローチだと考えている。廃止スケジュールへの対応は「やらされ作業」ではなく、自社のAI依存度と活用方針を棚卸しする好機として捉えたい。
出典: この記事は OpenAI Model Release Notes: Realtime 2 and GPT-4.5 retirement の内容をもとに、筆者の見解を加えて独自に執筆したものです。