Alibaba lieferte innerhalb von zwei Wochen zwei Flaggschiffe der Qwen 3.7-Reihe aus: Qwen3.7-Max, das reine Text-Reasoning-Modell, und Qwen3.7-Plus, die multimodale Version, die Vision hinzufügt und nur einen Bruchteil des Preises kostet. Sie teilen sich denselben 1M-Token-Kontext und dieselbe autonome Obergrenze von 35 Stunden, sodass die Wahl allein anhand des Datenblatts nicht offensichtlich ist.
Dieser Leitfaden stellt sie anhand von Benchmarks, Preis, Geschwindigkeit und der Entscheidung für den täglichen Einsatz gegenüber. Wenn Sie zuerst den Hintergrund zu jedem Modell erfahren möchten, lesen Sie unsere Qwen 3.7 Plus Übersicht und den umfassenderen Leitfaden Was ist Qwen 3.7. Egal für welches Sie sich entscheiden, Sie werden es über eine API aufrufen und die Antworten testen müssen; hier kommt Apidog ins Spiel, das am Ende behandelt wird.
Die kurze Antwort
Wählen Sie standardmäßig Plus. Es entspricht Max bei der Tool-Nutzung, übertrifft es bei Terminal-Aufgaben, bietet Bild- und Videoeingabe und kostet etwa sechsmal weniger. Für die meisten Workloads ist diese Entscheidung allein aufgrund des Preises bereits getroffen.

Wählen Sie Max nur, wenn Sie ausschließlich für Text optimieren. Es behält einen kleinen Vorsprung in reinen Text-Bestenlisten und läuft bei reinen Text-Kaltstarts etwas schneller. Wenn Ihre Arbeit niemals einen Screenshot oder ein Dokumentenbild berührt, kann dieser Vorteil wichtig sein. Für alles andere gewinnt Plus.
Der Kernunterschied
Max ist das reine Text-Flaggschiff. Es argumentiert, codiert und führt lange Agentenketten aus, alles basierend auf Texteingaben. Plus übernimmt dieselbe Grundlage und fügt Augen hinzu: Es akzeptiert Bilder und Videos und verankert GUIs gut genug, um exakte Klickkoordinaten von einem Screenshot zurückzugeben. Dann unterbietet es Max im Preis.

Der Kompromiss ist also gering. Sie geben einen leichten Vorteil bei der Textqualität und Latenz auf und erhalten dafür Vision sowie eine deutlich günstigere Rechnung.
Benchmarks
Die Zahlen erzählen eine konsistente Geschichte. Plus liegt bei reinem Text leicht hinter Max, ist bei der Tool-Nutzung gleichauf und zieht in Führung, sobald Vision ins Spiel kommt.
| Benchmark | Qwen 3.7 Plus | Qwen 3.7 Max |
|---|---|---|
| LM Arena (Text) | #15 | #13 |
| LM Arena (Codierung) | #12 | #10 |
| Vision Arena | #16 | Nicht zutreffend |
| SWE-Bench Pro | ~60% | 60.6% |
| Terminal-Bench (2.0 Terminus) | 70.3 | 69.7 |
| ScreenSpot Pro (GUI-Verankerung) | 79.0 | Keine |
| MCP-Atlas (Tool-Nutzung) | 76.4 | 76.4 |
Drei Dinge stechen hervor.
SWE-Bench Pro ist effektiv ein Unentschieden. Plus erreicht etwa 60% gegenüber Max' 60,6%. Bei realen Softwareaufgaben kosten die Vision-Parameter Plus keine nennenswerte Codierungsfähigkeit. Unser Vergleich Qwen 3.7 vs. GPT-5.5 vs. Opus 4.7 zeigt, wo das im Vergleich zu den westlichen Flaggschiffen steht.
Plus gewinnt tatsächlich den Terminal-Bench, 70,3 zu 69,7. Für Agentenarbeiten, die stark auf Shell basieren, ist das günstigere Modell auch das geringfügig stärkere.
GUI-Verankerung ist der wahre Unterschied. ScreenSpot Pro 79.0 ist auf Spitzenniveau, und Max kann es überhaupt nicht ausführen. Wenn Ihr Agent einen Bildschirm betrachten muss, kommt nur eines dieser Modelle in Frage. Wie immer sollten die Benchmark-Zahlen des Anbieters als Orientierung und nicht als Evangelium behandelt werden; die SWE-bench-Website erklärt, was jede Suite misst.
Preise
Hier ist die Kluft groß.
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| Eingabe / 1M Token | $0.40 | $2.50 |
| Ausgabe / 1M Token | $1.60 | $7.50 |
| Gecachte Eingabe / 1M | $0.08 | $0.25 |
Plus ist bei der Eingabe etwa sechsmal und bei der Ausgabe fast fünfmal günstiger. Für Agenten mit hohem Volumen oder langer Laufzeit entscheidet dieses Verhältnis über die Budgets. Das günstigere Modell liest auch Bilder, was Max schwer zu verkaufen macht, es sei denn, Sie benötigen explizit seinen Textvorteil.
Ein Vorbehalt für Plus: Bilder und Videos werden tokenisiert und teilen sich das 1M-Kontextbudget, sodass eine screenshot-lastige oder Video-Workload pro Aufruf mehr kostet, als der Pro-Token-Preis vermuten lässt. Skalieren Sie Bilder herunter und sampeln Sie Videos sparsam. Unsere Notizen zur Reduzierung der Agenten-Token-Kosten und zum chinesischen LLM-Preiskrieg 2026 behandeln das umfassendere Kostenbild. Die offiziellen Preise finden Sie auf der Model Studio Preisgestaltungsseite.
Spezifikationen und Geschwindigkeit
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| Eingabemodalitäten | Text, Bild, Video | Nur Text |
| Kontextfenster | 1M (geteilt mit Vision) | 1M |
| Autonome Laufzeit-Obergrenze | 35 Stunden | 35 Stunden |
| Nur-Text-Latenz | Basislinie | ~7–15% schneller bei Kaltstarts |
| Gewichte | Proprietär, nur über API | Proprietär, nur über API |
Die Latenzzeit ist Max' stiller Vorteil. Bei reinen Text-Kaltstarts reagiert es merklich schneller, was sich in Chat-ähnlichen Produkten summiert, bei denen die Zeit bis zum ersten Token für Benutzer sichtbar ist; eine unabhängige Analyse verfolgt den Kompromiss zwischen Geschwindigkeit und Intelligenz im Detail. Beide Modelle sind closed-weight und laufen nur über Alibaba Cloud Model Studio, sodass keines eine Option ist, wenn Sie selbst hosten müssen.
Welches sollten Sie wählen
Wählen Sie Qwen 3.7 Plus, wenn:
- Ihre Arbeit Bilder, Screenshots, PDFs oder Videos betrifft.
- Sie Computer- oder GUI-Agenten entwickeln, die einen Bildschirm lesen.
- Kosten eine Rolle spielen, was bei diesen Zahlen fast immer der Fall ist.
Wählen Sie Qwen 3.7 Max, wenn:
- Sie ausschließlich für reine Text-SWE-Bench Pro-Ergebnisse optimieren.
- Sie die schnellste Textantwort in einem latenzsensitiven Produkt benötigen.
- Sie niemals visuelle Eingaben senden und jeden Punkt an Textqualität wünschen.
Für die meisten Teams ist Plus die sinnvolle Standardwahl und Max der Spezialist. Die Kostenlücke ist groß genug, dass Sie einen konkreten Grund haben sollten, sechsmal mehr für ein reines Textmodell zu bezahlen.
Um das zu konkretisieren, hier ist, wie gängige Workloads zugeordnet werden:
| Arbeitslast | Wahl | Warum |
|---|---|---|
| Screenshot-QA- oder visuelle Regressionsagent | Plus | Benötigt GUI-Verankerung; nur Plus sieht den Bildschirm |
| Rechnungs-, Quittungs- oder gescannte PDF-Extraktion | Plus | Dokumentenbilder erfordern visuelle Eingabe |
| Textklassifizierung mit hohem Volumen | Plus | Gleiche Textqualität, ein Bruchteil der Kosten |
| Latenzarmer Kundensupport-Chatbot | Max | Schnellere reine Text-Kaltstarts sind für Benutzer wichtig |
| Langer autonomer Codierungslauf | Beide | Sie sind bei SWE-Bench Pro gleichauf, lassen Sie also die Kosten entscheiden |
Das Muster wiederholt sich: Sofern eine Arbeitslast nicht rein textbasiert und latenzsensitiv ist, ist das günstigere multimodale Modell die sicherere Standardoption.
Beide mit Apidog testen
Beide Modelle teilen sich denselben OpenAI-kompatiblen Model Studio Endpunkt, sodass der Wechsel zwischen ihnen eine Ein-Zeilen-Änderung der Modell-ID ist. Das macht sie einfach direkt zu vergleichen: Senden Sie denselben Prompt an qwen3.7-plus und qwen3.7-max, vergleichen Sie die Antworten und prüfen Sie, ob der Preisunterschied für Ihre Aufgabe gerechtfertigt ist.

Apidog ist für diesen Workflow konzipiert. Senden Sie Anfragen an beide Modelle, inspizieren Sie das rohe JSON nebeneinander, speichern Sie Ihren Model Studio Schlüssel pro Umgebung und mocken Sie die Endpunkte, damit Ihre App weiterentwickelt werden kann. Für multimodale Plus-Anfragen zeigt unser Qwen 3.7 Plus API-Leitfaden das Bild- und Video-Payload-Format, und der grundlegende Qwen 3.7 API-Leitfaden behandelt den Textpfad. Wenn eines der Modelle Tool-Aufrufe in einem Agentenlauf verkettet, zeigt Apidogs AI-Agent-Debugger die gesamte Sequenz.
Laden Sie Apidog herunter, um beide Qwen 3.7 Modelle zu testen und zu vergleichen, bevor Sie eines in die Produktion integrieren.
FAQ
Ist Qwen 3.7 Plus besser als Max? Für die meisten Arbeitslasten ja, da es Vision hinzufügt und viel weniger kostet, während es Max bei Codierung und Tool-Nutzung entspricht. Max behält einen kleinen Vorsprung bei reinen Text-Bestenlisten und der Nur-Text-Latenz.
Wie viel günstiger ist Plus? Etwa sechsmal günstiger bei der Eingabe (0,40 $ vs. 2,50 $ pro Million Token) und fast fünfmal günstiger bei der Ausgabe (1,60 $ vs. 7,50 $).
Teilen sie sich dasselbe Kontextfenster? Ja, beide haben ein 1M-Token-Fenster. Bei Plus verbrauchen Bilder und Videos Token aus demselben Budget.
Kann Max Bilder verarbeiten? Nein. Max ist nur Text. Wenn Sie Bild- oder Videoeingaben benötigen, brauchen Sie Plus.
Sind sie Open Source? Nein. Beide sind proprietär und laufen nur über Alibaba Cloud Model Studio. Sie können die Gewichte weder herunterladen noch selbst hosten.
Welches ist schneller? Max ist bei reinen Text-Kaltstarts etwa 7 bis 15% schneller. Für gemischte oder Vision-Arbeiten ist Plus ohnehin die einzige Option.
Fazit
Qwen 3.7 Max und Plus konkurrieren nicht wirklich um dieselbe Aufgabe. Max ist der Text-Purist mit einem geringen Geschwindigkeits- und Qualitätsvorteil; Plus ist der günstigere, multimodale Generalist, der fast überall gewinnt, wo Preis oder Vision eine Rolle spielen. Beginnen Sie mit Plus und greifen Sie nur dann zu Max, wenn eine rein textbasierte Arbeitslast den Aufpreis rechtfertigt. So oder so, testen Sie die API in Apidog, damit das, was Sie veröffentlichen, sich so verhält, wie es die Benchmarks versprechen.
