MiniMax M3: Das erste Open-Weight Frontier Coding Modell

Was ist MiniMax M3? Ein klarer Leitfaden zum Open-Weight-Modell von MiniMax: 1M-Token-Kontext, native Multimodalität, SWE-Bench Pro 59 % und wie man darauf zugreift.

Ashley Innocent

Ashley Innocent

1 June 2026

MiniMax M3: Das erste Open-Weight Frontier Coding Modell

Apidog für Unternehmen

On-Premises-Bereitstellung

SSO & RBAC

SOC 2 konform

Apidog Enterprise entdecken

MiniMax M3 ist ein KI-Modell mit offenen Gewichten, das MiniMax am 1. Juni 2026 veröffentlicht hat. Es ist das erste Modell mit offenen Gewichten, das drei Dinge in einem System kombiniert: Kodierung auf Frontier-Niveau, ein Kontextfenster von bis zu 1.000.000 Tokens und native Multimodalität, die Bild- und Videoeingaben verarbeitet und sogar einen Desktop-Computer bedienen kann.

Diese Kombination ist die Schlagzeile. Viele Modelle beherrschen ein oder zwei dieser Dinge gut. M3 ist das erste, das Sie mit Ihren eigenen Gewichten ausführen können und das darauf abzielt, alle drei gleichzeitig zu erledigen. MiniMax hat auch versprochen, die offenen Gewichte und einen vollständigen technischen Bericht innerhalb von etwa 10 Tagen nach dem Start zu veröffentlichen, sodass das Modell, über das Sie heute lesen, kurz darauf von Ihnen selbst gehostet werden kann. Wenn Sie das Rennen um offene Gewichte durch Veröffentlichungen wie Qwen 3.7 verfolgt haben, ist M3 der nächste große Eintrag, und die Startdetails stammen direkt aus der MiniMax M3 Ankündigung.

Dieser Artikel erklärt, was M3 ist, welche Benchmarks MiniMax gemeldet hat, wie seine Architektur die Kosten für lange Kontexte niedrig hält, was Sie damit bauen können und wie Sie Zugang erhalten.

💡
Wenn Sie planen, M3 in eine Anwendung zu integrieren, benötigen Sie eine Möglichkeit, seine API-Antworten und Tool-Aufrufe zu überprüfen; Tools wie Apidog vereinfachen diesen Schritt, und wir werden darauf zurückkommen.
Button

Was M3 anders macht

Die meisten Frontier-Modelle erzwingen einen Kompromiss. Sie können eine starke Kodierung, oder ein riesiges Kontextfenster, oder multimodale Eingaben haben, aber selten alle drei in einem einzigen offenen Modell. M3s Argument ist, dass Sie sich nicht länger entscheiden müssen.

Hier ist die dreifache Vereinigung in einfachen Worten:

Der Aspekt der offenen Gewichte verbindet all dies. Wenn Gewichte öffentlich sind, können Sie datensensible Arbeiten selbst hosten, auf Ihrer eigenen Domäne feinabstimmen und eine Anbieterbindung pro Aufruf vermeiden. Diese Freiheit mit Frontier-Kodierung und einem Millionen-Token-Fenster zu kombinieren, ist der Teil, der zuvor in einem Paket nicht existierte. Um ein Gefühl dafür zu bekommen, wie sich das breitere Feld in diese Richtung bewegt, behandelt der chinesische LLM-Preiskampf von 2026 den Wettbewerbsdruck, der Modelle wie dieses in die Öffentlichkeit drängt.

Die Zahlen, die zählen

MiniMax veröffentlichte zum Start eine Reihe von Benchmark-Ergebnissen. Dies sind vom Anbieter gemeldete Zahlen, behandeln Sie sie also als MiniMax' eigene Messungen und nicht als unabhängige Drittanbieter-Ergebnisse. Mit diesem Vorbehalt erfahren Sie hier, wie M3 abschneidet.

Das hervorzuhebende Ergebnis ist SWE-Bench Pro mit 59,0 %. SWE-Bench Pro ist eine anspruchsvolle, kontaminationsresistente Suite realer Software-Engineering-Aufgaben; mehr über die Methodik erfahren Sie auf der SWE-Bench Projektseite. MiniMax berichtet, dass M3 sowohl GPT-5.5 als auch Gemini 3.1 Pro übertrifft und nahe an Claude Opus 4.7 heranreicht. Für ein Modell mit offenen Gewichten ist das eine starke Behauptung.

M3 ist nicht überall führend. Auf PostTrainBench erreicht es 0,37 Punkte, leicht hinter Opus 4.7 (0,42) und GPT-5.5 (0,39). Eine ehrliche Lücke in der Anzeigetafel wirkt glaubwürdiger als ein glatter Durchmarsch.

Ein Detail, das MiniMax noch nicht bekannt gegeben hat: die Parameteranzahl und die Zahlen der aktiven Parameter. Diese Zahlen werden mit dem technischen Bericht erwartet, sodass Sie vorerst keine genauen Kosten-pro-Parameter-Vergleiche durchführen können. Wenn Sie einen direkten Vergleich mit der geschlossenen Frontier wünschen, siehe MiniMax M3 vs. Opus 4.7 vs. GPT-5.5.

MSA-Architektur einfach erklärt

Die Effizienz von M3 stammt von MSA, kurz für MiniMax Sparse Attention. Standard-Attention vergleicht jedes Token mit jedem anderen Token, sodass die Kosten schnell steigen, je länger Ihr Kontext wird. Das macht Millionen-Token-Fenster auf herkömmlichen Architekturen teuer.

Sparse Attention ändert die Berechnung. Anstatt alles zu beachten, achtet jedes Token auf eine ausgewählte Untermenge der Sequenz. MiniMax berichtet, dass dies die Berechnung pro Token auf etwa 1/20 des Modells der vorherigen Generation reduziert. Der praktische Nutzen zeigt sich in zwei Inferenzphasen:

Warum ist das für Sie wichtig? Lange Kontextarbeiten sind in der Regel langsam und teuer, was Teams dazu drängt, Chunking- und Retrieval-Workarounds zu nutzen. Wenn die Kosten pro Token um eine Größenordnung sinken, wird das direkte Einspeisen eines gesamten Repositories oder eines Stapels langer Dokumente in das Modell praktikabel, anstatt ein Budgetproblem zu sein. Die Geschwindigkeitsverbesserungen bedeuten auch eine geringere Latenz bei Agenten-Schleifen, bei denen das Modell viele Male liest, handelt und erneut liest.

Was Sie tatsächlich bauen können

M3 ist für langfristige Agenten-Arbeit konzipiert, bei der das Modell über einen längeren Zeitraum läuft und etwas Konkretes produziert. MiniMax lieferte einige Demonstrationen, die die Bandbreite zeigen:

Der Produkt-Wrapper dafür ist MiniMax Code, der Agent Team hinzufügt: mehrstufige, gleichzeitige und dynamisch anpassbare Workflows. Ein hervorzuhebendes Muster ist die „Producer plus Verifier“-Adversarial-Harness-Schleife, bei der ein Agent Arbeit generiert und ein anderer sie prüft, bevor sie akzeptiert wird. Dieses Prüfer-im-Kreislauf-Design neigt dazu, die stillen Fehler zu reduzieren, die Single-Pass-Agenten plagen.

Wenn Sie Agenten auf M3 aufbauen, ist der schwierige Teil selten das Modell; es ist die Verbindung zwischen dem Modell und Ihren Tools. Tool-Aufruf-Schemata driften ab, Argumente kommen fehlerhaft zurück, und eine einzige schlechte Antwort kann einen ganzen Workflow zum Stillstand bringen. Hier zahlt sich API-Testing aus. Sie können die Tool-Aufruf-Antworten von M3 erfassen und deren Struktur in Apidog validieren, sodass Sie einen fehlerhaften Funktionsaufruf abfangen, bevor er in Produktion geht. Für die Designseite dieser Arbeit deckt agentic workflow tool wiring: patterns and pitfalls die häufigsten Fallstricke ab.

Wie man auf M3 zugreift

Derzeit bietet MiniMax zwei Wege an: Abonnement-Token-Pläne und die API.

Die Abonnement-Pläne umfassen ein monatliches Token-Kontingent

Für den programmatischen Zugriff verwendet die API eine OpenAI-ähnliche Chat-Completions-Schnittstelle. Die Basis-URL ist https://api.minimax.io/v1, Sie rufen POST /chat/completions auf, und die Modell-ID ist MiniMax-M3. Die Authentifizierung erfolgt über einen Bearer-Token im Header:

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

Sie können es über rohes HTTP, über das Anthropic SDK (der von MiniMax empfohlene Weg) oder über das OpenAI SDK aufrufen. Die offizielle MiniMax API-Referenz enthält das vollständige Schema.

Zwei Preisdetails, die Sie wissen sollten. API-Aufrufe werden zu einem Standardtarif abgerechnet, wenn Ihre Eingabe 512K Tokens oder weniger beträgt, und zu einem höheren Langkontext-Tarif über 512K, sodass sehr große Prompts pro Aufruf mehr kosten. Es gibt auch zwei Service-Stufen: Standard (die Standardeinstellung) und Priorität. MiniMax hat noch keinen genauen Preis pro Token veröffentlicht, daher sollten Sie die aktuellen Tarife in der Dokumentation bestätigen, bevor Sie budgetieren.

Für eine Schritt-für-Schritt-Einrichtung mit funktionierenden Anfragen, siehe wie man die MiniMax M3 API verwendet. Wenn Sie es lieber kostenlos ausprobieren möchten, behandelt wie man MiniMax M3 kostenlos nutzt die kostenlosen Optionen. Sobald Sie einen Schlüssel haben, laden Sie Apidog herunter, um Ihre erste Anfrage zu senden und die Antwortstruktur zu überprüfen, bevor Sie Anwendungs-Code schreiben.

Wie es sich im Vergleich zu anderen Open-Weight-Modellen schlägt

M3 tritt in einem überfüllten Feld von Open-Weight-Modellen an, von denen viele aus chinesischen Labors stammen, die stark auf Preis und Leistungsfähigkeit drängen. Zu den aktuellen Konkurrenten gehören DeepSeek V4-pro, Qwen 3.7, Kimi k2.6 und GLM-5.1. Jedes hat seine eigenen Stärken in den Bereichen Kodierung, Argumentation und mehrsprachige Arbeit.

M3s Alleinstellungsmerkmal ist nicht ein einzelner Wert; es ist das Gesamtpaket. Nur wenige Open-Weight-Modelle kombinieren Frontier-Kodierung mit einem echten 1M-Token-Fenster und nativer Computernutzung im selben Modell. Die engsten Vergleiche neigen dazu, auf einer Achse zu gewinnen, während M3 seine Wette auf alle drei verteilt. Allerdings sind der technische Bericht und die offenen Gewichte noch nicht veröffentlicht, daher werden unabhängige Benchmarks der eigentliche Test sein. Wenn Sie bereits ein anderes offenes Modell verwenden, ist der Qwen 3.7 Überblick ein nützlicher Referenzpunkt, wogegen M3 antritt.

FAQ

Ist MiniMax M3 Open Source? Es ist Open-Weight. MiniMax hat versprochen, die Modellgewichte und einen technischen Bericht innerhalb von etwa 10 Tagen nach dem Start am 1. Juni 2026 zu veröffentlichen. Zum Zeitpunkt des Schreibens sind diese Gewichte noch nicht verfügbar, sodass Sie sie heute nicht herunterladen und selbst hosten können. Sobald MiniMax die Gewichte als Open Source freigibt, können Sie M3 auf Ihrer eigenen Infrastruktur ausführen.

Was ist das Kontextfenster? Bis zu 1.000.000 Tokens. Die MSA-Architektur macht ein so großes Fenster erschwinglich, da sie die Berechnung pro Token auf etwa 1/20 des Modells der vorherigen Generation reduziert.

Ist MiniMax M3 kostenlos? Nicht direkt. MiniMax verkauft Abonnement-Token-Pläne ab 20 $/Monat (Plus) und API-Zugriff, der nach Tokens abgerechnet wird. Es gibt keine von MiniMax selbst veröffentlichte kostenlose Stufe, obwohl wie man MiniMax M3 kostenlos nutzt die verfügbaren kostenlosen Wege aufzeigt.

Wie schlägt sich M3 im Vergleich zu Claude Opus 4.7? Bei den von MiniMax gemeldeten Benchmarks nähert sich M3 Opus 4.7 bei SWE-Bench Pro (59,0 %) und übertrifft es bei SVG-Bench, während es bei PostTrainBench (0,37 vs. 0,42) zurückliegt. Dies sind Herstellerangaben, warten Sie also auf unabhängige Tests, bevor Sie eine einzelne Zahl als gesichert betrachten.

Wann werden die Gewichte veröffentlicht? MiniMax hat zugesagt, sowohl die offenen Gewichte als auch den technischen Bericht innerhalb von etwa 10 Tagen nach dem Start am 1. Juni 2026 zu veröffentlichen. Der technische Bericht sollte auch die Parameteranzahl enthalten, die MiniMax noch nicht bekannt gegeben hat.

Kann M3 Bilder und Videos verarbeiten? Ja. M3 ist nativ multimodal und akzeptiert sowohl Bild- als auch Videoeingaben. Es geht auch einen Schritt weiter bei der Computernutzung, indem es Desktop-Anwendungen direkt bedient, anstatt nur zu beschreiben, was auf dem Bildschirm zu sehen ist.

Die Kurzfassung

MiniMax M3 ist das erste Open-Weight-Modell, das Frontier-Kodierung, ein 1M-Token-Kontextfenster und native Multimodalität an einem Ort vereint. Die MSA-Architektur hält die Kosten für lange Kontexte niedrig, der gemeldete SWE-Bench Pro-Score positioniert es nahe an der geschlossenen Frontier, und die offenen Gewichte sollen innerhalb weniger Tage nach dem Start veröffentlicht werden. Die ehrlichen Lücken, nicht offengelegte Parameterzahlen und einige Benchmarks, bei denen es zurückliegt, sind es wert, verfolgt zu werden, sobald unabhängige Ergebnisse vorliegen. Wenn Sie bereit sind, darauf aufzubauen, holen Sie sich einen API-Schlüssel, testen Sie Ihre ersten Aufrufe und Tool-Antworten in Apidog und fangen Sie klein an, bevor Sie skalieren.

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen