中国のAI研究機関Z.aiが2026年6月16日にリリースしたGLM-5.2が、独立系ベンチマークのArtificial Analysis Intelligence Index(v4.1)においてオープンウェイトモデルの首位を獲得した。MITライセンスでの公開という点も注目を集めており、企業・研究者を問わず幅広い活用が期待されている。
GLM-5.2の技術仕様
GLM-5.2は753BパラメータのMixture of Experts(MoE)モデルで、アクティブパラメータは40Bとなっている。モデルサイズは約1.51TBと巨大だが、MoEアーキテクチャにより推論時のコンピューティングコストを抑える設計だ。
前バージョンGLM-5.1から最も大きく変わった点がコンテキストウィンドウの拡張で、20万トークンから100万トークンへと一気に5倍になった。長大なコードベースや技術文書を丸ごと読み込んで処理するようなユースケースで特に威力を発揮するはずだ。
なお、GLM-5.2はテキスト入力専用モデルであることに注意が必要だ。Z.aiはビジョン系モデルとして「GLM-5V-Turbo」を別系列で展開しているが、こちらはオープンウェイトでの公開はない。
ベンチマーク結果
Artificial Analysisによる評価では、GLM-5.2はIntelligence Indexスコア51を記録し、MiniMax-M3(44)、DeepSeek V4 Pro(44)、Kimi K2.6(43)を上回って首位に立った。
また、フロントエンドWeb開発タスクとエージェント的なコーディングワークフローを評価するCode Arena WebDevリーダーボードでは2位を記録。1位のClaude Fable 5に次ぐ位置につけた。画像入力なしのテキスト専用モデルがWebDev系のベンチマークでここまで上位に来るのは、従来の予想を覆す結果だ。
一方、出力トークン数の多さは課題として指摘されている。1タスクあたりの平均出力トークンが43,000と、GLM-5.1(26,000)やDeepSeek V4 Pro(37,000)を大幅に上回る。思考プロセスを長く展開する傾向があるとみられる。
価格と利用方法
OpenRouter経由で9プロバイダーから利用可能で、ほとんどのプロバイダーが入力$1.40/M・出力$4.40/Mで提供している。主要クローズドモデルと比較すると:
| モデル | 入力 | 出力 |
|---|---|---|
| GLM-5.2 | $1.40/M | $4.40/M |
| Claude Opus 4.5-4.8 | $5/M | $25/M |
| GPT-5.5 | $5/M | $30/M |
入力は約1/3、出力は約1/6という価格差は無視できない。ただし上述の通りGLM-5.2はトークン消費量が多めであるため、単純なコスト比較には注意が必要だ。
SVG生成テストの明暗
Simon Willison氏による実検証では、アニメーション付きSVG生成の結果に明暗が出た。「自転車に乗るペリカン」のプロンプトでは車輪のスポークやペダルが正確に描画され、アニメーションも破綻なく動作する高品質な出力が得られた。一方、同氏が前バージョンGLM-5.1で傑作と評した「電動キックスケーターに乗るバージニアオポッサム」の再挑戦では、クオリティが大幅に後退。アニメーションの実装すら行われなかったという。
同一モデル内でのタスク依存の品質ばらつきは、LLM全般に共通する課題でもある。本番利用の前に自社ユースケースでの評価が必須だ。
実務への影響
GLM-5.2のMITライセンス公開は、企業の自社ホスティング戦略において選択肢を広げる。特に以下のシナリオで検討価値がある:
- コスト重視のバッチ処理: ドキュメント要約や分類など、大量のテキスト処理タスクにおいて推論コストを削減できる可能性がある
- 長文脈処理が必要な場面: 100万トークンコンテキストは、大規模なコードベース解析や長大な仕様書の処理に対応する
- オンプレミス・プライベートクラウド展開: MITライセンスのため、データを外部に出せない業種での自社運用が法的にも整理しやすい
- WebDev系タスクのセカンドオピニオン: テキスト専用でも高スコアを出した事実は、フロントエンド開発補助での活用余地を示している
ただし1.51TBというモデルサイズは相当なGPUリソースを要求するため、自社運用には相応のインフラ投資が前提となる。まずはOpenRouter経由での試験運用から始めるのが現実的だ。
筆者の見解
オープンウェイト陣営が急速にクローズドモデルに追いつきつつある流れは止まらない、というのが率直な印象だ。GLM-5.2がIntelligence Indexで首位に立った事実は、「強いモデル=クローズド」という図式が崩れ始めていることを示している。
個人的に注目しているのはMITライセンスという選択だ。Apache 2.0より制約が少なく、商用プロダクトへの組み込みでも法的なハードルが低い。日本企業がAIをプロダクトに組み込んでいく際の選択肢として、ライセンス面での扱いやすさは実際の採用判断に影響する。
コスト面では、出力トークン量の多さが見かけの安さを相殺するケースがある点に注意したい。ベンチマークでの43,000トークン/タスクというのはかなり多い。使い方によっては期待ほどコストが下がらない可能性があるため、自社ワークロードでの実測が不可欠だ。
また、テキスト専用でWebDevリーダーボード2位というのは興味深い。「フロントエンド開発には画像入力が必要」という直感が必ずしも正しくないとすれば、モデル選定の前提を見直す必要があるかもしれない。実際のコーディング補助は、コードの文字列理解がほとんどを占めているという証左とも取れる。
中国勢のオープンウェイトモデルはコストパフォーマンスの面で着実に実力をつけている。自社のユースケースに合ったモデルを選び、実際に動かして検証するという姿勢が、今のAI活用では一番正しい行動だと思っている。
出典: この記事は GLM-5.2 is probably the most powerful text-only open weights LLM の内容をもとに、筆者の見解を加えて独自に執筆したものです。