Qwen 3.7 API nutzen: Eine Anleitung

Ashley Innocent

Ashley Innocent

21 May 2026

Qwen 3.7 API nutzen: Eine Anleitung

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Alibabas Qwen-Team lieferte Mitte Mai 2026 Qwen3.7-Max-Preview aus, und Entwickler stellten sich sofort dieselbe Frage: Wie rufe ich es von meinem eigenen Code aus auf? Das Modell ist ein führendes Denkmodell mit einem 1M-Token-Kontextfenster und expliziten Chain-of-Thought-Traces, das sich hervorragend für Agenten-Backends, die Analyse langer Dokumente und die Codegenerierung eignet. Aber „Preview“ leistet in diesem Namen viel Arbeit. Der Zugang ist beschränkt, die API-Oberfläche ist noch im Aufbau, und die Details, die man zum Schreiben funktionierender Codes benötigt, sind in den Release Notes und der Plattformdokumentation verstreut.

Button

Kurz gesagt

Qwen3.7-Max-Preview ist Alibabas führendes Denkmodell, das am 14. Mai 2026 in der Vorschau mit einem 1M-Token-Kontextfenster veröffentlicht wurde. Während der Vorschau ist die zuverlässigste Methode zur Nutzung Qwen Chat (chat.qwen.ai); der Produktions-API-Zugriff erfolgt über Alibaba Cloud Model Studio (DashScope) unter Verwendung eines OpenAI-kompatiblen Endpunkts, bei dem Sie eine Basis-URL festlegen, Ihren Schlüssel als Bearer-Token übergeben und /chat/completions aufrufen. Da die 3.7-Stufe nur eine Vorschau ist, bestätigen Sie die genaue Modell-ID und den Endpunkt in den offiziellen Dokumenten, bevor Sie Ihre Anwendung veröffentlichen, und verwenden Sie Apidog, um den Endpunkt zu testen und zu simulieren, während sich die Verfügbarkeit stabilisiert.

Wie man Qwen 3.7 jetzt sofort erreicht

Qwen liefert seine Modelle über verschiedene Oberflächen aus, die nicht alle gleichzeitig aktiv sind. Ende Mai 2026 ist dies der aktuelle Stand des Zugangs.

Qwen Chat (chat.qwen.ai). Der schnellste Weg, Qwen3.7-Max-Preview auszuprobieren. Melden Sie sich mit einem kostenlosen Qwen-Konto an, wählen Sie qwen3.7-max-preview im Modellselektor und aktivieren Sie den Denkmodus, um die Denkspur zu sehen. Während der Vorschau gibt es Nutzungslimits, aber es kostet nichts und erfordert keine Einrichtung. Es ist ein Browserprodukt, keine API, daher dient es der Evaluierung und nicht der Integration.

Alibaba Cloud Model Studio (DashScope). Hier werden Qwen-Modelle zu einer echten API. Model Studio stellt Qwen über einen OpenAI-kompatiblen Endpunkt bereit, sodass jeder Code, der bereits mit dem OpenAI SDK kommuniziert, Qwen mit einem Basis-URL- und Schlüssel-Tausch aufrufen kann. Ältere Stufen wie qwen3.6-max-preview und die qwen-max-Familie sind hier bereits verfügbar. Die 3.7-Vorschau-Stufe hat möglicherweise noch keinen öffentlichen API-Eintrag, wenn Sie dies lesen; Qwen hat den API-Zugriff in der Vergangenheit einige Wochen nach der Chat-Vorschau geöffnet.

Das OpenAI-kompatible Muster. Jedes aktuelle Qwen-Modell im Model Studio folgt dem gleichen Schema. Sie richten den Standard-OpenAI-Client auf eine DashScope-Basis-URL aus, authentifizieren sich mit einem Bearer-Token und rufen die Chat-Completions-Route auf. Dieses Muster ist versionsübergreifend stabil, sodass der unten stehende Code auch dann funktioniert, wenn die 3.7-Modell-ID eingeführt wird; Sie ändern hauptsächlich eine Zeichenkette.

Da der Modellbezeichner und der Endpunkt während einer Vorschau variieren können, behandeln Sie die offizielle Qwen-Dokumentation und die Model Studio Modellliste als Quelle der Wahrheit. Für eine kostenlose Option, während Sie auf den API-Zugriff warten, behandelt unser Leitfaden Wie man Qwen 3.7 kostenlos nutzt die Vorschaukanäle im Detail.

Zugriffsmethoden auf einen Blick

Methode API-Zugriff Kosten Am besten geeignet für
Qwen Chat (chat.qwen.ai) Nein Kostenlos, ratenbegrenzt Schnelle Evaluierung, Prompt-Tests
Alibaba Cloud Model Studio (DashScope) Ja, OpenAI-kompatibel Bezahlung pro Token Produktionsintegration
Qwen auf Hugging Face Gewichte, wenn veröffentlicht Kostenlos (selbst gehostet) Modelle mit offenem Gewicht, nicht die Max-Vorschau
Gateways von Drittanbietern Variiert Variiert Multi-Modell-Routing

Ein wichtiger Hinweis: Die Qwen-Modelle mit offenem Gewicht sind auf Hugging Face verfügbar, aber die Max-Preview-Stufe ist proprietär, erwarten Sie also keine herunterladbaren Gewichte für qwen3.7-max-preview.

Qwen 3.7 API-Schlüssel erhalten

Der API-Zugriff erfolgt über ein Alibaba Cloud-Konto. Die Schritte sind kurz.

  1. Erstellen Sie ein Alibaba Cloud-Konto und öffnen Sie die Model Studio-Konsole (modelstudio.console.alibabacloud.com).
  2. Aktivieren Sie Model Studio für Ihr Konto und Ihre Region. Schlüssel sind regionsgebunden, daher authentifiziert ein Schlüssel für den Singapur-Endpunkt nicht gegen Peking.
  3. Öffnen Sie den API-Schlüsselbereich der Konsole und generieren Sie einen Schlüssel. Er sieht aus wie sk- gefolgt von einer Zeichenfolge.
  4. Kopieren Sie den Schlüssel einmal und speichern Sie ihn wie ein Passwort.

Wählen Sie Ihre Region bewusst aus, da sie Ihre Basis-URL bestimmt:

Region Basis-URL
Singapore https://dashscope-intl.aliyuncs.com/compatible-mode/v1
US (Virginia) https://dashscope-us.aliyuncs.com/compatible-mode/v1
Beijing (China) https://dashscope.aliyuncs.com/compatible-mode/v1

Hinterlegen Sie den Schlüssel niemals fest im Quellcode, den Sie committen. Legen Sie ihn stattdessen in einer Umgebungsvariablen ab:

# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"

# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"

Ihr Code liest DASHSCOPE_API_KEY zur Laufzeit aus. Dadurch bleibt das Geheimnis außerhalb Ihres Repositories und Sie können Schlüssel rotieren, ohne den Code anfassen zu müssen. Die gleiche Gewohnheit gilt für jedes Modell, das Sie aufrufen; Sie werden das gleiche Muster in unserem Leitfaden zur Gemini 3.5 API sehen.

Ihre erste Anfrage: Python, cURL und JavaScript

Der Model Studio Endpunkt von Qwen ist OpenAI-kompatibel, daher haben Sie zwei Optionen: das offizielle OpenAI SDK, das auf die DashScope-Basis-URL zeigt, oder einen rohen HTTP-Aufruf. Beide werden unten beschrieben.

Ein Hinweis vor dem Code. Die Modell-ID qwen3.7-max-preview ist der Bezeichner, den Qwen Chat für das Vorschau-Modell verwendet. Die genaue Zeichenfolge, die die API erwartet, kann während eines Vorschau-Fensters abweichen, und eine ältere Stufe wie qwen3.6-max-preview könnte aktiv sein, wenn Sie dies versuchen. Bestätigen Sie die aktuelle Modell-ID in der Model Studio Modellliste und fügen Sie sie dann in das model-Feld ein. Die Form der Anfrage ändert sich nicht.

Python mit dem OpenAI SDK

Installieren Sie das SDK mit pip install openai und senden Sie dann eine Anfrage:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    # Use the base URL for your account's region
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

response = client.chat.completions.create(
    # Confirm the live model ID in the Model Studio model list
    model="qwen3.7-max-preview",
    messages=[
        {"role": "system", "content": "You are a precise coding assistant."},
        {"role": "user", "content": "Write a Python function that reverses a linked list."},
    ],
)

print(response.choices[0].message.content)

Das ist eine vollständige Anfrage. Das messages-Array folgt dem Standard-Rollenmuster: Eine system-Nachricht legt das Verhalten fest, gefolgt von user-Eingaben. Die Antwort enthält den generierten Text in choices[0].message.content.

cURL

Für einen schnellen Check im Terminal oder um zu bestätigen, dass ein Schlüssel funktioniert, bevor Sie Anwendungscode schreiben:

curl 'https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions' \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "qwen3.7-max-preview",
    "messages": [
      {"role": "user", "content": "Explain idempotency in REST APIs in two sentences."}
    ]
  }'

Wenn der Schlüssel und die Modell-ID gültig sind, erhalten Sie eine JSON-Antwort mit der Vervollständigung. Wenn nicht, teilt Ihnen der Fehlertext mit, was zu beheben ist; mehr zu Fehlern weiter unten.

JavaScript / Node.js

Dasselbe OpenAI SDK funktioniert in Node. Installieren Sie es mit npm install openai:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});

const response = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [
    { role: "user", content: "List three trade-offs of GraphQL versus REST." },
  ],
});

console.log(response.choices[0].message.content);

Drei Sprachen, eine Anfragenform; das ist der Vorteil einer OpenAI-kompatiblen API.

Streaming-Antworten

Für alles, was benutzerorientiert ist, möchten Sie nicht auf die vollständige Vervollständigung warten, bevor Sie die Ausgabe anzeigen. Streaming sendet Tokens, während sie generiert werden. Setzen Sie stream auf true und iterieren Sie über die Chunks.

stream = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {"role": "user", "content": "Summarize the CAP theorem."},
    ],
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

In Node ist die gestreamte Antwort ein asynchroner Iterator (async iterable):

const stream = await client.chat.completions.create({
  model: "qwen3.7-max-preview",
  messages: [{ role: "user", content: "Summarize the CAP theorem." }],
  stream: true,
});

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

Streaming ist bei einem Denkmodell wichtiger als bei einem einfachen Chatmodell. Qwen 3.7 kann viel Zeit mit seiner Denkprozesskette verbringen, bevor die endgültige Antwort kommt, sodass der Benutzer ohne Streaming auf einen leeren Bildschirm starrt. Mit Streaming können Sie die Denkspur, einen Tippindikator oder die Antwort, während sie sich formt, anzeigen.

Der Reasoning- und Thinking-Parameter

Qwen3.7-Max-Preview ist ein Denkmodell (Reasoning-Modell). Es kann eine explizite Denkprozesskette (Chain of Thought) innerhalb von <think>-Blöcken erzeugen, bevor es eine endgültige Antwort gibt. Diese Spur verbessert seine Ergebnisse bei mathematischen und komplexen mehrstufigen Problemen und hilft beim Debuggen: Sie können sehen, wo die Logik des Modells fehlerhaft war.

Bei neueren Qwen-Modellen, die über DashScope bereitgestellt werden, wird das Denkverhalten mit einem enable_thinking-Flag gesteuert. Bestätigen Sie den genauen Mechanismus und Parameternamen für die 3.7-Vorschau-Stufe anhand der aktuellen API-Referenz, da sich die Reasoning-Steuerungen zwischen den Qwen-Versionen geändert haben. Konzeptionell sieht die Anfrage so aus:

response = client.chat.completions.create(
    model="qwen3.7-max-preview",
    messages=[
        {"role": "user", "content": "A train leaves at 2pm averaging 60mph. "
                                    "A second leaves at 3pm at 75mph on the same route. "
                                    "When does the second catch the first?"},
    ],
    # Reasoning controls vary by Qwen version; confirm the current
    # parameter in the Model Studio API reference before relying on it.
    extra_body={"enable_thinking": True},
)

print(response.choices[0].message.content)

Einige praktische Hinweise:

Wenn Sie die Qualität und Kosten des Reasonings mit anderen führenden Modellen vergleichen, stellt unser Vergleich von Qwen 3.7 vs GPT-5.5 vs Opus 4.7 die Kompromisse nebeneinander dar. Denkmodelle können Tokens in Agenten-Loops schnell verbrauchen; wenn das Ihre Situation ist, gelten die Techniken in unserem Artikel zum Reduzieren von Agenten-Token-Kosten direkt.

Fehlerbehandlung und Ratenbegrenzungen

Eine Anfrage kann aus vorhersehbaren Gründen fehlschlagen. Behandeln Sie diese, damit Ihre App elegant degradiert.

HTTP-Status Bedeutung Was zu tun ist
400 Ungültige Anfrage: fehlerhaftes JSON, ungültiger Parameter Korrigieren Sie den Anfragekörper; überprüfen Sie die Modell-ID und Feldnamen
401 Ungültiger oder fehlender API-Schlüssel Überprüfen Sie den Schlüssel und stellen Sie sicher, dass er der Endpunktregion entspricht
403 Kein Zugriff auf das Modell Die Vorschau-Stufe kann beschränkt sein; bestätigen Sie, dass Ihr Konto aktiviert ist
404 Modell nicht gefunden Die Modell-ID ist falsch oder in Ihrer Region nicht verfügbar
429 Ratenbegrenzung oder Kontingent überschritten Zurücktreten und erneut versuchen; überprüfen Sie die QPS-Limits und das Kontoguthaben
500 / 503 Serverseitiger Fehler Mit exponentiellem Backoff erneut versuchen

Vorschau-Modelle geben häufiger 403 und 404 zurück als stabile Modelle, da der Zugriff beschränkt ist und die Bezeichner sich ändern. Wenn Sie einen dieser Fehler erhalten, liegt das Problem normalerweise am Zugriff oder an der Modellzeichenfolge, nicht an Ihrem Code.

Ratenbegrenzungen im Model Studio werden pro Konto als Abfragen pro Sekunde oder pro Minute festgelegt, und die genauen Zahlen hängen von Ihrer Kontoebene und dem Modell ab; überprüfen Sie die Konsole, anstatt einen festen Wert anzunehmen. Das Muster ist immer dasselbe: 429 abfangen, warten und mit zunehmenden Verzögerungen erneut versuchen.

import time
from openai import OpenAI, RateLimitError, APIStatusError

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

def ask_qwen(prompt, max_retries=4):
    for attempt in range(max_retries):
        try:
            response = client.chat.completions.create(
                model="qwen3.7-max-preview",
                messages=[{"role": "user", "content": prompt}],
            )
            return response.choices[0].message.content
        except RateLimitError:
            wait = 2 ** attempt          # 1s, 2s, 4s, 8s
            print(f"Rate limited. Retrying in {wait}s...")
            time.sleep(wait)
        except APIStatusError as e:
            # 400/401/403/404 are not worth retrying; surface them
            print(f"API error {e.status_code}: {e.message}")
            raise
    raise RuntimeError("Failed after retries")

Exponentielles Backoff bei 429 und 5xx, schnelles Fehlschlagen bei 4xx. Diese Aufteilung verhindert, dass Sie die API bei Fehlern, die ein erneuter Versuch nicht beheben wird, überlasten.

Testen und Mocken der Qwen API mit Apidog

Hier wird eine Vorschau-API mühsam, und hier zahlt sich gute Tooling aus. Wenn der Zugriff beschränkt ist, die Modell-ID sich ändert und Ratenbegrenzungen eng sind, möchten Sie nicht testen, indem Sie Ihre gesamte App ausführen und Protokolle lesen. Sie möchten eine Anfrage senden, genau sehen, was zurückkommt, und es aufbewahren, um es erneut auszuführen. Apidog ist für diesen Workflow gemacht.

Mocken Sie den Endpunkt, während Sie entwickeln. Dies ist der entscheidende Punkt bei einer beschränkten Vorschau. Apidogs Mock-Server liefert realistische Antworten aus dem API-Schema, ohne Schlüssel und ohne Ratenbegrenzung. So kann Ihr Frontend oder Agent gegen einen stellvertretenden Qwen-Endpunkt entwickeln, der immer sofort antwortet, selbst wenn der tatsächliche Vorschau-Zugriff gedrosselt, nicht verfügbar oder noch nicht für Ihr Konto geöffnet ist. Wenn die Live-API bereit ist, ändern Sie einfach die Basis-URL vom Mock auf DashScope, und Ihr Code bleibt unverändert. Weitere Informationen zu Schema-First-Workflows finden Sie in unserem Leitfaden zum Spec-First-Modus.

Das Muster verallgemeinert sich auf jede Modell-API. Derselbe Test- und Mock-Workflow in Apidog funktioniert, egal ob Sie Qwen, Gemini oder die ERNIE 5.1 API aufrufen; ein Vorschau-Modell macht den Mocking-Schritt wertvoller, da der reale Endpunkt der am wenigsten zuverlässige Teil Ihres Stacks ist.

Fazit

Qwen 3.7 aufzurufen ist unkompliziert, sobald man den Weg kennt. Die Schwierigkeit liegt in der Vorschau-Begrenzung, nicht in der API.

Hören Sie auf zu raten, was Qwen zurückgibt, und sehen Sie es stattdessen. Laden Sie Apidog herunter, um den Qwen-Endpunkt zu entwerfen, echte Testanfragen zu senden, wiederverwendbare Szenarien zu speichern und die API während der Entwicklung zu mocken. Es ist kostenlos zu starten und verwandelt eine instabile Vorschau in etwas, gegen das Sie mit Zuversicht entwickeln können.

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen