Qu'est-ce que MiniMax M3 ? Le Premier Modèle de Codage Open-Source Frontier

Qu'est-ce que MiniMax M3 ? Un guide clair du modèle open-weight de MiniMax : contexte de 1 million de tokens, multimodalité native, SWE-Bench Pro 59 % et comment y accéder.

Ashley Innocent

Ashley Innocent

1 June 2026

Qu'est-ce que MiniMax M3 ? Le Premier Modèle de Codage Open-Source Frontier

Apidog pour les entreprises

Déploiement sur site

SSO & RBAC

Conforme SOC 2

Explorer Apidog Enterprise

MiniMax M3 est un modèle d'IA à poids ouverts que MiniMax a lancé le 1er juin 2026. C'est le premier modèle à poids ouverts à combiner trois éléments en un seul système : un codage de pointe, une fenêtre contextuelle allant jusqu'à 1 000 000 de jetons, et une multimodalité native qui gère les entrées d'images et de vidéos et peut même faire fonctionner un ordinateur de bureau.

Cette combinaison est le point essentiel. De nombreux modèles réussissent bien une ou deux de ces tâches. M3 est le premier que vous pouvez exécuter avec vos propres poids et qui vise à faire les trois à la fois. MiniMax a également promis de publier les poids ouverts et un rapport technique complet dans les 10 jours suivant le lancement, afin que le modèle dont vous lisez aujourd'hui devienne quelque chose que vous pourrez héberger vous-même peu après. Si vous avez suivi la course aux poids ouverts à travers des versions comme Qwen 3.7, M3 est la prochaine grande entrée, et les détails du lancement proviennent directement de l'annonce MiniMax M3.

Cet article explique ce qu'est M3, les benchmarks rapportés par MiniMax, comment son architecture réduit les coûts des longs contextes, ce que vous pouvez construire avec, et comment y accéder.

💡
Si vous envisagez d'intégrer M3 dans une application, vous voudrez un moyen d'inspecter ses réponses API et ses appels d'outils ; des outils comme Apidog simplifient cette étape, et nous y reviendrons.
bouton

Ce qui rend M3 différent

La plupart des modèles de pointe imposent un compromis. Vous pouvez avoir un codage performant, ou une énorme fenêtre contextuelle, ou une entrée multimodale, mais rarement les trois dans un seul modèle ouvert. L'argument de M3 est que vous n'avez plus à choisir.

Voici l'unification à trois volets en termes simples :

L'aspect poids ouverts est ce qui relie tout cela. Lorsque les poids sont publics, vous pouvez les héberger vous-même pour les travaux sensibles aux données, les affiner sur votre propre domaine et éviter le verrouillage fournisseur par appel. Combiner cette liberté avec un codage de pointe et une fenêtre d'un million de jetons est la partie qui n'existait pas auparavant dans un seul package. Pour comprendre comment le domaine évolue dans cette direction, la guerre des prix des LLM chinois de 2026 couvre la pression concurrentielle qui pousse des modèles comme celui-ci vers l'ouverture.

Les chiffres qui comptent

MiniMax a publié un ensemble de résultats de benchmarks lors du lancement. Ce sont des chiffres rapportés par le fournisseur, donc traitez-les comme les propres mesures de MiniMax plutôt que comme des scores tiers indépendants. Avec cette mise en garde, voici comment M3 se positionne.

Le résultat à retenir est le SWE-Bench Pro à 59,0 %. SWE-Bench Pro est une suite difficile et résistante à la contamination de tâches d'ingénierie logicielle réelles ; vous pouvez en savoir plus sur la méthodologie sur le site du projet SWE-Bench. MiniMax rapporte que M3 surpasse à la fois GPT-5.5 et Gemini 3.1 Pro sur ce test et se rapproche de Claude Opus 4.7. Pour un modèle à poids ouverts, c'est une affirmation solide.

M3 n'est pas en avance partout. Sur PostTrainBench, il obtient 0,37, légèrement derrière Opus 4.7 (0,42) et GPT-5.5 (0,39). Un écart honnête au tableau des scores semble plus crédible qu'un carton plein.

Un détail que MiniMax n'a pas encore divulgué : le nombre de paramètres et les chiffres des paramètres actifs. Ces chiffres sont attendus avec le rapport technique, donc pour l'instant, vous ne pouvez pas calculer de comparaisons exactes coût-par-paramètre. Si vous voulez une comparaison directe avec les modèles fermés de pointe, consultez MiniMax M3 vs Opus 4.7 vs GPT-5.5.

L'architecture MSA en termes simples

L'efficacité de M3 provient de l'MSA, abréviation de MiniMax Sparse Attention. L'attention standard compare chaque jeton à chaque autre jeton, de sorte que le coût augmente rapidement à mesure que votre contexte s'allonge. C'est ce qui rend les fenêtres d'un million de jetons coûteuses sur les architectures conventionnelles.

L'attention éparse change la donne. Au lieu de considérer tout, chaque jeton se concentre sur un sous-ensemble sélectionné de la séquence. MiniMax rapporte que cela réduit le calcul par jeton à environ 1/20e de celui de son modèle de génération précédente. Le bénéfice pratique se manifeste en deux phases d'inférence :

Pourquoi est-ce important pour vous ? Le travail sur de longs contextes est généralement lent et coûteux, ce qui pousse les équipes à utiliser des contournements de découpage et de récupération. Lorsque le coût par jeton diminue d'un ordre de grandeur, l'intégration d'un référentiel entier ou d'une pile de documents longs directement dans le modèle devient pratique au lieu d'être un problème budgétaire. Les accélérations signifient également une latence plus faible sur les boucles d'agents, où le modèle lit, agit et lit à nouveau plusieurs fois.

Ce que vous pouvez réellement construire

M3 est conçu pour les tâches d'agent à long terme, le genre où le modèle fonctionne pendant une longue période et produit quelque chose de concret. MiniMax a présenté quelques démonstrations qui en montrent l'étendue :

L'enveloppe produit pour cela est MiniMax Code, qui ajoute des fonctionnalités d'équipe d'agents, telles que des workflows multi-étapes, concurrents et dynamiquement ajustables. Un modèle à noter est la boucle de harnais contradictoire « Producteur plus Vérificateur », où un agent génère le travail et un autre le vérifie avant qu'il ne soit accepté. Cette conception avec vérificateur intégré a tendance à réduire les échecs silencieux qui affligent les agents à passe unique.

Si vous construisez des agents sur M3, la partie difficile est rarement le modèle ; c'est la connexion entre le modèle et vos outils. Les schémas d'appel d'outils dérivent, les arguments reviennent mal formés, et une seule mauvaise réponse peut bloquer tout un workflow. C'est là que les tests d'API prouvent leur valeur. Vous pouvez capturer les réponses d'appel d'outils de M3 et valider leur structure dans Apidog, afin de détecter un appel de fonction défectueux avant qu'il n'atteigne la production. Pour la partie conception de ce travail, le câblage des outils de workflow agentique : modèles et pièges couvre les pièges courants.

Comment accéder à M3

Actuellement, MiniMax propose deux voies : les plans d'abonnement par jetons et l'API.

Les plans d'abonnement incluent une allocation mensuelle de jetons

Pour un accès programmatique, l'API utilise une interface de complétions de chat de style OpenAI. L'URL de base est https://api.minimax.io/v1, vous appelez POST /chat/completions, et l'ID du modèle est MiniMax-M3. L'authentification se fait par un jeton bearer dans l'en-tête :

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

Vous pouvez l'appeler via HTTP brut, via le SDK Anthropic (la voie recommandée par MiniMax), ou via le SDK OpenAI. La référence API officielle de MiniMax contient le schéma complet.

Deux détails de tarification à connaître. Les appels API sont facturés à un tarif standard lorsque votre entrée est de 512K jetons ou moins, et à un tarif de contexte long plus élevé au-delà de 512K, donc les très grands prompts coûtent plus cher par appel. Il existe également deux niveaux de service : standard (par défaut) et prioritaire. MiniMax n'a pas publié de prix exact par jeton, alors confirmez les tarifs actuels dans la documentation avant de prévoir votre budget.

Pour une configuration étape par étape avec des requêtes fonctionnelles, consultez comment utiliser l'API MiniMax M3. Si vous préférez l'essayer sans payer, comment utiliser MiniMax M3 gratuitement couvre les options sans frais disponibles. Une fois que vous avez une clé, téléchargez Apidog pour envoyer votre première requête et inspecter la forme de la réponse avant d'écrire tout code d'application.

Comment il se compare aux autres modèles à poids ouverts

M3 arrive sur un marché encombré de modèles à poids ouverts, dont beaucoup proviennent de laboratoires chinois qui mettent l'accent sur le prix et les capacités. Les concurrents actuels incluent DeepSeek V4-pro, Qwen 3.7, Kimi k2.6 et GLM-5.1. Chacun a ses propres forces en matière de codage, de raisonnement et de travail multilingue.

Ce qui distingue M3 n'est pas un score unique ; c'est l'ensemble. Peu de modèles à poids ouverts associent un codage de pointe à une véritable fenêtre de 1M de jetons et à une utilisation native de l'ordinateur dans le même modèle. Les comparaisons les plus proches ont tendance à l'emporter sur un seul axe tandis que M3 répartit ses atouts sur les trois. Cela dit, le rapport technique et les poids ouverts ne sont pas encore disponibles, donc les benchmarks indépendants seront le véritable test. Si vous utilisez déjà un autre modèle ouvert, l'aperçu de Qwen 3.7 est un point de référence utile pour savoir contre quoi M3 est en concurrence.

FAQ

MiniMax M3 est-il open source ? Il est à poids ouverts. MiniMax a promis de publier les poids du modèle et un rapport technique dans les 10 jours suivant le lancement du 1er juin 2026. Au moment de la rédaction, ces poids ne sont pas encore sortis, vous ne pouvez donc pas les télécharger et les héberger vous-même aujourd'hui. Une fois que MiniMax aura mis les poids en open source, vous pourrez exécuter M3 sur votre propre infrastructure.

Quelle est la fenêtre contextuelle ? Jusqu'à 1 000 000 de jetons. L'architecture MSA est ce qui rend une fenêtre aussi grande abordable, car elle réduit le calcul par jeton à environ 1/20e de celui du modèle de génération précédente.

MiniMax M3 est-il gratuit ? Pas directement. MiniMax vend des plans d'abonnement par jetons à partir de 20 $/mois (Plus) et un accès API facturé par jetons. Il n'y a pas de niveau gratuit publié par MiniMax lui-même, bien que comment utiliser MiniMax M3 gratuitement présente les options sans frais disponibles.

Comment M3 se compare-t-il à Claude Opus 4.7 ? Selon les benchmarks rapportés par MiniMax, M3 se rapproche d'Opus 4.7 sur SWE-Bench Pro (59,0 %) et le bat sur SVG-Bench, tout en étant légèrement derrière sur PostTrainBench (0,37 contre 0,42). Ce sont des chiffres du fournisseur, alors attendez des tests indépendants avant de considérer un seul chiffre comme définitif.

Quand les poids sont-ils publiés ? MiniMax s'est engagé à publier les poids ouverts et le rapport technique dans les 10 jours environ suivant le lancement du 1er juin 2026. Le rapport technique devrait également fournir le nombre de paramètres, que MiniMax n'a pas encore divulgué.

M3 peut-il gérer les images et les vidéos ? Oui. M3 est nativement multimodal et accepte les entrées d'images et de vidéos. Il va également plus loin avec l'utilisation de l'ordinateur, en faisant fonctionner directement des applications de bureau plutôt que de simplement décrire ce qui est à l'écran.

En bref

MiniMax M3 est le premier modèle à poids ouverts à regrouper un codage de pointe, une fenêtre contextuelle d'un million de jetons et une multimodalité native en un seul endroit. L'architecture MSA réduit les coûts des longs contextes, le score SWE-Bench Pro rapporté le place près de la frontière fermée, et les poids ouverts sont attendus dans les jours suivant le lancement. Les lacunes honnêtes, le nombre de paramètres non divulgué et quelques benchmarks où il est à la traîne, méritent d'être suivis à mesure que les résultats indépendants arrivent. Si vous êtes prêt à construire dessus, procurez-vous une clé API, testez vos premiers appels et réponses d'outils dans Apidog, et commencez petit avant de passer à l'échelle.

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API