MiniMax M3は、MiniMaxが2026年6月1日にリリースしたオープンウェイトAIモデルです。これは、最先端のコーディング能力、最大1,000,000トークンのコンテキストウィンドウ、画像およびビデオ入力を処理し、デスクトップコンピューターすら操作できるネイティブなマルチモダリティという3つの要素を1つのシステムに統合した初のオープンウェイトモデルです。
この組み合わせが最大の特長です。これらのうち1つか2つをうまくこなすモデルは数多くあります。M3は、これら3つすべてを一度に実現することを目指し、自身のウェイトで実行できる初のモデルです。MiniMaxはまた、リリースから約10日以内にオープンウェイトと完全な技術レポートを公開することを約束しており、今日ここで紹介しているモデルは、まもなく自分でホストできるものとなります。Qwen 3.7のようなリリースを通してオープンウェイト競争を追ってきた方にとって、M3は次の大きな注目株であり、その発表の詳細はMiniMax M3の公式発表から直接得られたものです。
この記事では、M3がどのようなものであるか、MiniMaxが報告したベンチマーク、そのアーキテクチャがいかに長文コンテキストのコストを低く抑えるか、M3で何が構築できるか、そしてアクセス方法について解説します。
M3の独自性
ほとんどのフロンティアモデルでは、トレードオフを強いられます。強力なコーディング能力、巨大なコンテキストウィンドウ、あるいはマルチモーダル入力のいずれかを持つことはできますが、単一のオープンモデルでそのすべてを兼ね備えることは稀です。M3が訴えたいのは、もはや選択する必要がないということです。

以下に、3つの要素の統合を平易な言葉で説明します。
- 最先端のコーディング能力。M3は、オープンモデルだけでなく、コーディングおよびエージェントソフトウェアのベンチマークにおいて、最強のクローズドモデルと同等のレベルを目標としています。
- 100万トークンのコンテキスト。一度に最大100万トークンを供給できます。これは、大規模なコードベース、長文のドキュメントセット、あるいは積極的な切り詰めなしの完全なチャット履歴に相当します。
- ネイティブなマルチモダリティ。画像とビデオを入力として受け入れ、デスクトップコンピューターを直接操作できます。MiniMaxは、ローカルERPクライアントを開き、請求書を自動でバッチ入力するデモンストレーションを行いました。
オープンウェイトであるという点が、これらすべてを結びつける要素です。ウェイトが公開されている場合、機密性の高い作業のために自己ホストしたり、独自のドメインでファインチューニングしたり、呼び出しごとのベンダーロックインを回避したりできます。その自由度を最先端のコーディング能力と100万トークンウィンドウと組み合わせることは、これまで1つのパッケージには存在しなかった部分です。この方向への広範な分野の動きについては、2026年の中国LLM価格競争が、このようなモデルをオープンにする競争圧力をカバーしています。
重要な数字
MiniMaxはリリース時に一連のベンチマーク結果を公開しました。これらはベンダーが報告した数値であるため、独立した第三者のスコアではなく、MiniMax独自の測定値として扱ってください。その注意点を踏まえた上で、M3がどのような位置付けにあるかを示します。

注目すべき結果は、SWE-Bench Proで59.0%です。SWE-Bench Proは、実際のソフトウェアエンジニアリングタスクからなる、難しく汚染耐性のあるスイートです。その手法については、SWE-Benchプロジェクトサイトで詳しく読むことができます。MiniMaxは、M3がGPT-5.5とGemini 3.1 Proの両方を上回り、Claude Opus 4.7に近い成績を収めたと報告しています。オープンウェイトモデルとしては、これは強力な主張です。
M3がすべての面で優れているわけではありません。PostTrainBenchでは0.37を記録し、Opus 4.7(0.42)とGPT-5.5(0.39)にわずかに遅れをとっています。スコアボードに正直な差があることは、完全な圧勝よりも信頼性が高いと読み取れます。
MiniMaxがまだ公開していない詳細が1つあります。それは、パラメーター数とアクティブパラメーターの数値です。これらの数値は技術レポートとともに公開される予定であるため、現時点では正確なパラメーターあたりのコスト比較を計算することはできません。クローズドなフロンティアモデルとの直接比較を知りたい場合は、MiniMax M3 vs Opus 4.7 vs GPT-5.5をご覧ください。
MSAアーキテクチャを平易な言葉で解説
M3の効率性は、MiniMax Sparse Attentionの略であるMSAに由来します。標準的なアテンションは、すべてのトークンを他のすべてのトークンと比較するため、コンテキストが長くなるにつれてコストが急速に増加します。これが、従来のアーキテクチャでは100万トークンのウィンドウが高価になる理由です。

疎なアテンションは計算方法を変えます。すべてのトークンにアテンションする代わりに、各トークンはシーケンスの選択されたサブセットにアテンションします。MiniMaxの報告によると、これによりトークンあたりの計算量が、前世代モデルの約1/20に削減されます。この実用的な利点は、推論の2つのフェーズで現れます。
- プレフィル(プロンプトの読み取り)が9倍以上高速化。
- デコード(応答の生成)が15倍以上高速化。
それがなぜ重要なのでしょうか?長文コンテキストの作業は通常、処理が遅く費用もかかるため、チームはチャンク化や情報検索の回避策に頼りがちです。トークンあたりのコストが桁違いに下がることで、リポジトリ全体や大量の長文ドキュメントを直接モデルに供給することが、予算問題ではなく実用的な選択肢になります。また、速度の向上は、モデルが何度も読み取り、行動し、再び読み取るというエージェントループにおける遅延の低減も意味します。
実際に構築できるもの
M3は、モデルが長時間実行され、具体的な何かを生み出すような、長期的なエージェント作業のために構築されています。MiniMaxは、その多様性を示すいくつかのデモンストレーションを公開しました。
- 24時間CUDAカーネル最適化。M3は自律的にカーネルの最適化に取り組み、9.4倍の高速化を達成しました。
- 自律的な論文再現。18回のコミットを経て研究論文を再現し、23の実験図を生成するなど、複数のステップからなるプロセスを自律的に管理しました。
- コンピューター操作。ローカルERPクライアントを開いて請求書を一括入力するなど、デスクトップアプリケーションを直接操作できます。
これに対する製品ラッパーはMiniMax Codeであり、Agent Teamに多段階、並行、動的に調整可能なワークフローを追加します。注目すべきパターンの1つは、「プロデューサーと検証者」の対立的なハーネスループです。これは、一方のエージェントが作業を生成し、もう一方がそれを受け入れる前にチェックするものです。このループ内のチェック担当者の設計は、シングルパスのエージェントを悩ませるサイレントな失敗を減らす傾向にあります。
M3の上にエージェントを構築する場合、難しいのはモデル自体であることはほとんどありません。問題は、モデルとツール間の連携です。ツール呼び出しのスキーマがずれたり、引数が不正な形式で返されたり、1つの不適切な応答がワークフロー全体を停止させたりすることがあります。ここでAPIテストが真価を発揮します。ApidogでM3のツール呼び出し応答をキャプチャし、その構造を検証することで、本番環境に到達する前に壊れた関数呼び出しを検出できます。その作業の設計面については、エージェントワークフローツール接続:パターンと落とし穴で一般的な罠を解説しています。
M3へのアクセス方法
現在、MiniMaxには2つのアクセス方法があります。サブスクリプショントークンプランとAPIです。

サブスクリプショントークンプランには、月額トークン許容量が含まれています。
プログラムによるアクセスには、APIはOpenAIスタイルのチャット補完インターフェースを使用します。ベースURLはhttps://api.minimax.io/v1で、POST /chat/completionsを呼び出し、モデルIDはMiniMax-M3です。認証はヘッダー内のベアラートークンです。
POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json
生のHTTP、Anthropic SDK(MiniMaxの推奨ルート)、またはOpenAI SDKを介して呼び出すことができます。公式のMiniMax APIリファレンスには完全なスキーマが記載されています。
知っておくべき料金に関する2つの詳細があります。API呼び出しは、入力が512Kトークン以下の場合には標準料金で課金され、512Kを超える場合にはより高い長文コンテキスト料金が適用されるため、非常に大きなプロンプトは呼び出しあたりのコストが高くなります。また、2つのサービスティアがあります。標準(デフォルト)と優先です。MiniMaxはトークンあたりの正確な価格を公開していないため、予算を立てる前にドキュメントで現在の料金を確認してください。
動作するリクエストを使用したステップバイステップのセットアップについては、MiniMax M3 APIの利用方法をご覧ください。料金を支払わずに試したい場合は、MiniMax M3を無料で利用する方法で無料オプションを解説しています。キーを取得したら、アプリケーションコードを記述する前に、Apidogをダウンロードして最初のリクエストを送信し、応答の形式を検査してください。
他のオープンウェイトモデルとの比較
M3は、価格と機能で強く競争する中国の研究機関からの多くのオープンウェイトモデルがひしめき合う分野に参入します。現在の競合には、DeepSeek V4-pro、Qwen 3.7、Kimi k2.6、GLM-5.1が含まれます。それぞれがコーディング、推論、多言語作業において独自の強みを持っています。
M3の差別化要因は、単一のスコアではなく、その包括的な機能です。フロンティアレベルのコーディング能力、真の100万トークンウィンドウ、ネイティブなコンピューター操作を同じモデルで兼ね備えているオープンウェイトモデルはほとんどありません。最も近い競合モデルは1つの側面で優れている傾向があるのに対し、M3はこれら3つすべてに賭けています。とはいえ、技術レポートとオープンウェイトはまだ公開されていないため、独立したベンチマークが真の試金石となるでしょう。すでに他のオープンモデルを実行している場合、Qwen 3.7の概要は、M3が何と競争しているかを知る上で有用な参考資料となります。
FAQ
MiniMax M3はオープンソースですか?オープンウェイトモデルです。MiniMaxは2026年6月1日のリリースから約10日以内にモデルウェイトと技術レポートを公開することを約束しています。執筆時点ではまだウェイトは公開されていないため、今日ダウンロードして自己ホストすることはできません。MiniMaxがウェイトをオープンソース化すれば、独自のインフラストラクチャでM3を実行できるようになります。
コンテキストウィンドウはどれくらいですか?最大1,000,000トークンです。MSAアーキテクチャにより、トークンあたりの計算量が前世代モデルの約1/20に削減されるため、この規模のウィンドウが手頃な価格で利用可能になります。
MiniMax M3は無料ですか?直接的には無料ではありません。MiniMaxは月額20ドルから(Plus)のサブスクリプショントークンプランと、トークン単位で課金されるAPIアクセスを提供しています。MiniMax自体からは公式の無料ティアは発表されていませんが、MiniMax M3を無料で利用する方法では、利用可能な無料ルートが解説されています。
M3はClaude Opus 4.7とどのように比較されますか?MiniMaxが報告したベンチマークでは、M3はSWE-Bench Pro(59.0%)でOpus 4.7に迫り、SVG-Benchではこれを上回りますが、PostTrainBenchでは遅れをとっています(0.37対0.42)。これらはベンダーが提供する数値であるため、いずれかの単一の数値を確定事項として扱う前に、独立したテストの結果を待ってください。
ウェイトはいつ公開されますか?MiniMaxは2026年6月1日のリリースから約10日以内に、オープンウェイトと技術レポートの両方を公開することを約束しています。技術レポートでは、MiniMaxがまだ公開していないパラメーター数も補足されるはずです。
M3は画像やビデオを扱えますか?はい。M3はネイティブなマルチモダリティを備えており、画像とビデオの両方の入力を受け入れます。さらに一歩進んで、画面上の内容を記述するだけでなく、デスクトップアプリケーションを直接操作することもできます。
要約
MiniMax M3は、最先端のコーディング能力、100万トークンのコンテキストウィンドウ、およびネイティブなマルチモダリティを一つにまとめた初のオープンウェイトモデルです。MSAアーキテクチャにより長文コンテキストのコストが抑えられ、報告されたSWE-Bench Proスコアはクローズドなフロンティアモデルに近い位置にあり、オープンウェイトはリリース後数日以内に公開される予定です。正直なギャップ、未公開のパラメーター数、そしていくつかのベンチマークで遅れをとっている点は、独立した結果が出てくるにつれて注目すべきです。もしM3で構築する準備ができているなら、APIキーを取得し、Apidogで最初の呼び出しとツール応答をテストし、規模を拡大する前に小さく始めてください。
