中国のAI企業MiniMaxが、オープンウェイトの大規模言語モデル「M3」を正式リリースした。100万トークンのコンテキストウィンドウ、フロンティアレベルのコーディング能力、画像・動画に対応したネイティブマルチモーダルを1つのモデルに統合した点が最大の特徴だ。

MSAアーキテクチャ——注意機構を根本から再設計

M3の核心技術は、MiniMaxが独自に提案したMSA(MiniMax Sparse Attention)にある。従来のフルアテンションが持つ「計算コストがコンテキスト長の二乗に比例して爆発する」という根本的な問題を、スパースアテンション(疎な注意機構)によって解決している。

MSAは、KVキャッシュをブロック単位で精密に分割し、メモリアクセスを連続的に保つ設計(KV outer gather Q方式)を採用。オープンソースのFlash-Sparse-Attentionと比較して4倍以上の演算効率を実現した。実際のスループットでは、100万トークンのコンテキストにおいてプリフィリング段階で9倍以上、デコーディング段階で15倍以上の高速化を達成。同コンテキスト長でのトークンあたり計算量は旧世代の1/20に抑えられている。

また、フルアテンションとのアブレーション比較では「大多数の能力においてフルアテンションと同等」とされており、精度を犠牲にせず効率化を実現している点は注目に値する。

コーディング・エージェント能力のベンチマーク

コーディング性能の指標として広く参照されるSWE-Bench Proでは**59.0%**を記録。GPT-5.5やGemini 3.1 Proを上回り、Opus 4.7に迫る水準とされる。SVGコード生成を評価するSVG-BenchではOpus 4.7を超えるスコアも出している。

エージェント評価のClaw-Evalでは最高スコアを獲得しており、自律的なタスク実行能力においても高い評価を得ている。

またMiniMaxは、実際の開発現場における「複数ターンの継続的なセッション」を模倣するインタラクティブユーザーシミュレーターを独自開発し、訓練に活用している。実ユーザーの挙動——要件の明確化、解決策の調整、中間結果に基づくイテレーション——をシミュレートすることで、単発タスク前提の評価フレームワークと実使用体験のギャップを埋める試みだ。

マルチモーダルとデスクトップ操作

画像・動画入力に対応するネイティブマルチモーダルに加え、デスクトップコンピューターを直接操作する能力も備えている。マルチモーダルベンチマークのOmniDocBenchではGemini 3.1 Proを上回るスコアを記録した。

実務への影響

オープンウェイトモデルとしてAPI提供されるため、自社インフラへのデプロイや独自ファインチューニングが可能という点が実務上の最大のメリットだ。クローズドソースのモデルでは難しい、機密データを扱う社内システムへの組み込みや、特定業務に特化したカスタマイズが現実的な選択肢になる。

100万トークンのコンテキストは、大規模コードベース全体を一度に読み込んだり、長期プロジェクトの議事録をすべて参照した回答生成など、これまでコンテキスト制限で諦めていたユースケースを開く。特にソフトウェア開発チームにとって、長期的な開発文脈を保持したままコードレビューや設計相談ができるエージェントの実現可能性が高まる。

APIはMiniMax Codeとトークンプランで既に利用可能であり、日本企業でも検証を始めるハードルは低い。

筆者の見解

MSAのアーキテクチャ設計には素直に関心を持った。100万トークンを実用的な速度で扱うための「計算効率を根本から見直す」アプローチは、スケーリングの王道であり技術的に筋がいい。単にコンテキスト長を伸ばすだけでなく、実際のデコーディング速度が15倍という数字は、実務投入を見据えた設計思想が感じられる。

ベンチマーク数値については、常に額面どおりに受け取るのは危険だ。評価セットへの最適化と実使用での体験には依然として乖離がある。ただ、インタラクティブユーザーシミュレーターを独自構築して「複数ターンの継続セッション」を訓練に組み込む取り組みは、その乖離を埋めようとする誠実な姿勢として評価できる。

オープンウェイトのモデルがクローズドソースのフロンティアモデルに迫る性能を持ち始めたことで、企業がAIをどこで動かすかという「インフラ選択の自由度」が本質的に変わってくる。自社データをクラウドに送らずに高性能モデルを動かせる未来は、日本のエンタープライズ市場においても無視できない選択肢になりつつある。

今の自分の開発フローを大きく変えようとは思わないが、オープンウェイトの世界でここまで来た、というのはエコシステム全体にとって良いことだ。競争が激しくなるほど、モデルの品質と効率が上がり、エンジニアが使える道具の幅が広がる。


出典: この記事は MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model の内容をもとに、筆者の見解を加えて独自に執筆したものです。