PC Watch(2026年6月13日付、竹元かつみ氏報告)によると、中国のAIスタートアップMiniMaxが6月12日、約4,280億パラメータのオープンウェイトLLM「MiniMax M3」のモデルウェイトをHugging Faceで公開した。同モデルはすでに6月1日よりAPIとして提供を開始しており、今回はウェイト自体の一般公開となる。

MoE設計と独自アテンション機構「MSA」

MiniMax M3はエキスパート混合モデル(MoE)アーキテクチャを採用しており、総パラメータ数は約4,280億ながら、推論時にアクティブとなるパラメータ数は約230億に抑えられている。大規模モデルの表現力と推論コストの両立を図った設計だ。

最大の技術的特徴は独自開発の「MiniMax Sparse Attention(MSA)」。これにより最大100万トークンのコンテキストウィンドウを実現しつつ、前世代MiniMax M2と比べてプリフィル速度を約9倍、デコード速度を約15倍に向上。1Mトークン処理時のトークンあたり計算量も20分の1に削減したとされる。入力モダリティはテキスト・画像・動画に対応しており、追加アダプタなしにネイティブで処理できるマルチモーダルモデルでもある。

海外レビューのポイント:主要ベンチマーク結果

PC Watchの報告によると、MiniMax M3の主なベンチマーク結果は以下のとおり。

ベンチマーク MiniMax M3 Gemini 3.1 Pro

SWE-Bench Pro(コーディング) 59.0% 54.2%

MCP Atlas(MCPサーバーエージェント連携) 74.2% 69.2%

BrowseComp(ウェブ自律閲覧) 83.5% 85.9%

OSWorld-Verified(OS操作) 75.2% 76.2%

ソフトウェアエンジニアリング評価「SWE-Bench Pro」ではGemini 3.1 Proを約5ポイント上回る。一方、ウェブ自律閲覧(BrowseComp)やOS操作(OSWorld-Verified)ではわずかに届かず、全体として拮抗した水準にある。

注目点の一つは、MCPサーバーとのエージェント連携を測る「MCP Atlas」で74.2%を記録し、Gemini 3.1 Pro(69.2%)を5ポイント超えている点だ。

ライセンスとモデルサイズ

ライセンスは非商用であれば無償利用が可能。年間売上2,000万ドル未満の企業・個人による商用利用も、MiniMaxへの届け出と「Build with MiniMax」の表記のみで認められる。モデルウェイトはbf16フォーマットで約855GBだが、1-bit GGUFに圧縮すると約128GBまで削減できる。MiniMaxはより手頃なハードウェアでの動作を目指して、意図的にパラメータ規模を抑えた設計にしたと説明している。

日本市場での注目点

現時点で日本語公式サポートに関する情報は限られているが、オープンウェイトで研究・開発への転用が可能な点から、国内の研究機関・AIスタートアップ・個人開発者にとって注目に値する選択肢だ。

圧縮後128GBでも動作させるには高スペックのGPUを要するため、ローカル運用のハードルは依然として高い。現実的にはクラウドGPUサービス(Azure Machine LearningやAWS)上での活用が主流となるだろう。まず試すならAPIが先決で、すでに商用提供が始まっている。

筆者の見解

MiniMax M3で最も気になるのが、MCP Atlasにおけるエージェント連携性能だ。MCPはAIエージェントが外部ツールを呼び出しながら自律的にタスクを進めるための標準プロトコルであり、この指標の優位性は単なるコーディング能力とは別の実用価値を示す。エージェントループ——AIが判断・実行・検証を繰り返しながら自律駆動する仕組み——を設計・運用する文脈で、外部ツールとの連携性能は核心的なファクターになってきている。

オープンウェイトという点も重要だ。特定ベンダーのクローズドAPIに依存せず、自前の環境でチューニング・制御できることを求める企業や研究者にとって、トップクラスの性能をオープンウェイトで使えることは選択肢を実質的に広げる。

一点確認しておきたいのはライセンスだ。小規模商用利用には届け出のみで対応できるが、大規模商用用途には別途MiniMaxとの契約が必要になる。エンタープライズ導入を本格検討する前に、ライセンス条件を精査しておくことを勧める。


出典: この記事は Gemini 3.1 Proと互角、4,280億パラメータLLM「MiniMax M3」公開 の内容をもとに、筆者の見解を加えて独自に執筆したものです。