Alibaba Cloudは2026年6月1日、マルチモーダルエージェントモデル「Qwen3.7-Plus」を正式リリース(GA)した。テキスト専用フラッグシップのQwen 3.7 Maxと同等のエージェントバックボーンを維持しつつ画像・動画の入力理解を追加し、価格をMax比約6分の1に抑えた設計で、コスト効率を重視するエージェントパイプライン向けとして位置づけられる。

Qwen3.7-Plusとは何か

Qwen 3.7 Plusは「知覚するが生成しない」モデルだ。テキスト・画像・動画を入力として受け付け、出力はテキストのみ。スクリーンを読む、GUIのクリックターゲットを特定する、動画フレームの内容に回答する——といった認識タスクを担う。画像や動画そのものを生成する機能は持たない。

コンテキストウィンドウは100万トークン。エンドポイント名は qwen3.7-plus で、Alibaba Cloud Model Studio(DashScope)からOpenAI互換APIとして利用可能。提供リージョンは北京・シンガポール・米国バージニアの3拠点で、東京リージョンは現時点では非対応だ。

価格:低コストが最大の武器

モデル 入力(1Mトークン) 出力(1Mトークン)

Qwen 3.7 Plus $0.40 $1.60

Qwen 3.7 Max $2.50 $7.50

差額は歴然としている。入力コストは約6分の1、出力コストも約5分の1だ。キャッシュ済み入力は$0.04〜$0.08/1Mトークンと報告されているが、実際のレートはModel Studio上で確認すること。

マルチステップエージェントは本質的にトークン消費量が多い。判断・実行・検証のループを繰り返すアーキテクチャでは、1リクエスト単位の価格差が積み重なると大きなコスト差になる。この価格帯は、エージェントパイプラインを本番規模で稼働させたいチームにとって現実的な選択肢だ。

GUIグラウンディング性能:有望だが検証が必要

Alibabaが公開したベンチマーク「ScreenSpot Pro」では79.0を記録——同社発表では他社モデルを上回るスコアとされている。ただしこれはベンダー自身が自社ハーネスで実施した数字であり、「Qwen が Qwen を評価している」状態だ。独立した第三者機関Artificial AnalysisのIntelligence Indexでは164モデル中53位、推論速度は約52.9トークン/秒と報告されている。

GUIグラウンディング性能は、RPAや業務自動化との組み合わせで活用できる可能性がある。ただし本番投入の前には自社ユースケースでの実測評価が必須だ。

オープンソース路線からの転換:見逃せないシフト

QwenシリーズはこれまでHugging Faceでオープンウェイトを公開し、オープンソースコミュニティとの協調を武器にしてきた。しかしQwen 3.7 PlusはAPI限定のプロプライエタリモデルとして提供されており、オープンウェイト版は公開されていない。オープンウェイト版に関する情報は第三者による憶測であり、Alibabaによる公式確認はない。

この変化は戦略的な転換点を示唆している。「誰でも使えるベースモデル」から「Alibabaのプラットフォームで動かすモデル」へのシフトが進むなら、ファインチューニングやオフライン推論を前提とした利用計画は現時点では成立しない。

実務への影響

まずトークン消費試算を行う エージェントへの投入を検討するなら、自社ユースケースでの1日・1ヶ月あたりのトークン消費量を先に見積もること。低価格の恩恵は、消費量が多い用途ほど大きくなる。

独立検証を済ませてから本番投入 GUIグラウンディングスコアは有望に見えるが、自社環境・自社タスクでの実測は省けない。ベンダーベンチマークと実環境では乖離が生じることがある。

プロプライエタリ化の制約を把握する オープンウェイトが提供されない以上、ファインチューニング・ローカル推論・エアギャップ環境での利用は現時点では不可能だ。ベンダーロックインの許容範囲をアーキテクチャ設計の段階で確認しておきたい。

シンガポールリージョン活用の可否を確認する 日本での直接提供は現時点ではないが、シンガポールリージョン経由の利用は現実的だ。データガバナンス・契約上の要件を確認した上で判断してほしい。

筆者の見解

Qwen 3.7 Plusの登場で改めて実感するのが、エージェントパイプラインにとって「コストと性能のバランス」がいかに構造的な制約になっているかだ。ループを回せば回すほどトークンコストが積み上がる設計上、低価格モデルの選択肢が増えることは、エージェントシステムを現実のビジネス規模で動かしたい開発者にとって純粋にプラスの変化だ。

一方、今回の最も注目すべき変化はベンチマークスコアよりも「プロプライエタリ化」のシフトだと思う。Qwenシリーズはオープンソース路線を武器に急速にシェアを拡大してきたが、今回のPlusはAPI限定だ。中国AI各社が「まずオープンで普及させ、次にプロプライエタリで収益化する」フェーズに入りつつあるとすれば、調達戦略の前提を見直す必要が出てくる。

プレビューからGAまで18日というリリースペースは、モデル品質の成熟度論争はひとまず置いても、競合他社への圧力として機能する。AIエージェントの普及には「安く大量に動かせること」が欠かせない。そのピースを誰が担うかという競争は、日本企業のエンタープライズAI戦略にも直結する現実だ。ベンチマークは刺激的だが、自前評価と依存リスクの把握を並行して進めながら冷静に向き合うのが正しいアプローチだろう。


出典: この記事は Qwen 3.7 Plus: Alibaba’s Low-Cost Agent Model GA Release の内容をもとに、筆者の見解を加えて独自に執筆したものです。