Hy3 Preview API Kostenlos Nutzen: So geht's

Tencent hat Hy3 Preview am 22. April 2026 quelloffen gemacht, und innerhalb eines Tages listete OpenRouter es als vollständig kostenlosen Endpunkt. Keine Kreditkarte, keine Token-Abrechnung, kein Testzeitraum. Sie können dasselbe 295B-Parameter Mixture-of-Experts-Modell, das Tencents Yuanbao-App und den CodeBuddy-Assistenten antreibt, heute aus Ihrem eigenen Code heraus für null Euro aufrufen.

Dieser Leitfaden zeigt, wie Sie die Hy3 Preview API kostenlos über OpenRouter, den Hugging Face Space und das ursprüngliche Hy3-Repository nutzen können. Er behandelt auch die Denkmodi, die Hy3 von den meisten offenen Modellen von 2026 unterscheiden, und wie Sie die API innerhalb von Apidog testen können, ohne Wegwerf-Skripte schreiben zu müssen.

Schaltfläche

Wenn Sie den schnellsten Weg zu Ihrer ersten Antwort wünschen, springen Sie zu „Schritt-für-Schritt: Hy3 Preview kostenlos über OpenRouter aufrufen“.

Kurz gesagt (TL;DR)

Hy3 Preview ist kostenlos auf OpenRouter unter der Modell-ID tencent/hy3-preview:free mit 0 $ Eingabe- und 0 $ Ausgabepreisen.
Es ist ein Mixture-of-Experts-Modell: insgesamt 295B Parameter, 21B aktiv, 192 Experten mit Top-8-Routing und ein 256K-Token-Kontextfenster.
Drei Denkmodi sind eingebaut: no_think für schnelle Antworten, low und high für tiefgreifende Chain-of-Thought bei Agenten- und Programmieraufgaben.
Die Benchmarks sind für ein Open-Weights-Modell stark: SWE-bench Verified 74.4, Terminal-Bench 2.0 54.4, GPQA Diamond 87.2, MMLU 87.42.
Sie können es auf drei kostenlosen Wegen ausführen: den kostenlosen OpenRouter-Tarif, den Hugging Face Hy3-preview Space oder die lokale Inferenz mit vLLM und den offenen Gewichten.
Apidog passt gut zum OpenRouter-Endpunkt, da Hy3 das OpenAI Chat Completions-Schema verwendet; richten Sie eine Anfrage an OpenRouter und legen Sie los.

Was ist Hy3 Preview?

Hy3 Preview ist die erste Flaggschiff-Veröffentlichung des neu strukturierten Hunyuan-Basismodellteams von Tencent, das jetzt von Yao Shunyu geleitet wird, einem ehemaligen OpenAI-Forscher, den das Unternehmen eingestellt hat, um seinen Reasoning Stack voranzutreiben. Es kann als Tencents bisher leistungsfähigstes Modell und eine direkte Antwort auf die wichtigsten chinesischen Open-Weights-Veröffentlichungen von DeepSeek, Alibaba und Zhipu verstanden werden.

Das technische Profil der offiziellen Modellkarte ist agentenorientiert:

Architektur: Mixture-of-Experts, 80 Schichten plus eine MTP-Schicht, 64 Attention-Heads mit gruppierter Query-Attention.
Parameter: insgesamt 295B, 21B aktiv pro Vorwärtsdurchlauf.
Experten: 192 Spezialisten mit Top-8-Routing pro Token.
Kontext: 256K Token (262.144 auf OpenRouters Liste).
Tokenizer: 120.832-Einträge-Vokabular mit BF16-Präzision.
Lizenz: Tencent Hy Community License, kommerzielle Nutzung im Rahmen der Lizenzbedingungen erlaubt.

Was es von einem generischen MoE im 200B-Bereich unterscheidet, ist das agentische Training. Tencent hat seine RL-Infrastruktur für den Multi-Turn-Werkzeuggebrauch neu aufgebaut, und die veröffentlichten Ergebnisse auf SWE-bench Verified, Terminal-Bench 2.0 und der internen WildClawBench-Suite bringen es in die Nähe der besten geschlossenen Modelle bei Code- und Shell-Aufgaben.

Drei kostenlose Wege zur Nutzung von Hy3 Preview

Sie haben drei Möglichkeiten, je nachdem, ob Sie eine Chat-Benutzeroberfläche, eine API oder lokale Gewichte wünschen.

Weg	Was es ist	Kostenlos?	Gut für
OpenRouter `tencent/hy3-preview:free`	Gehostete OpenAI-kompatible API	Ja, 0 $ Input/Output	Entwicklung von Agenten, Skripten und Backend-Funktionen
Hugging Face Space	Browser-Chat-Demo	Ja	Schnelle Prompts, Ausprobieren, Smoke-Tests
Selbst gehostete Gewichte (vLLM / SGLang)	Führen Sie die offenen Gewichte auf Ihren eigenen GPUs aus	Kostenlose Software, Hardwarekosten fallen an	Datenschutzsensible Arbeitslasten, hohes Volumen

Die meisten Entwickler werden den OpenRouter-Weg bevorzugen. Es ist der kürzeste Weg von der Anmeldung bis zu einem funktionierenden API-Aufruf, und die Ratenbegrenzungen im kostenlosen Tarif sind für Prototypen ausreichend großzügig.

Schritt-für-Schritt: Hy3 Preview kostenlos über OpenRouter aufrufen

Hier ist der minimale Weg von null zu einer funktionierenden tencent/hy3-preview:free-Antwort.

Erstellen Sie ein OpenRouter-Konto. Melden Sie sich unter openrouter.ai an. Eine E-Mail-Adresse genügt; für Free-Tier-Modelle ist keine Zahlungsmethode erforderlich.
Generieren Sie einen API-Schlüssel. Öffnen Sie im OpenRouter-Dashboard „Keys“ und erstellen Sie einen neuen Schlüssel. Kopieren Sie ihn in eine Umgebungsvariable, zum Beispiel export OPENROUTER_API_KEY=sk-or-....
Öffnen Sie die Modellseite. Gehen Sie zur kostenlosen Hy3 Preview-Liste und bestätigen Sie, dass der Statusbanner „Free“ anzeigt. Dort sehen Sie auch Nutzungsstatistiken; zum Start verarbeitete der Endpunkt täglich 6,81 Milliarden Prompt-Token über alle Benutzer hinweg.

Senden Sie Ihre erste Anfrage. OpenRouter stellt das OpenAI Chat Completions-Schema bereit, sodass jedes OpenAI SDK funktioniert:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'

Schalten Sie das Reasoning ein, wenn Sie es benötigen. Hy3 akzeptiert einen reasoning-Parameter mit effort auf low oder high. OpenRouter gibt die Denkspur in einem separaten reasoning_details-Array zurück, das als eigener Token-Bucket abgerechnet wird:

{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."}
  ],
  "reasoning": {"effort": "high"}
}

Iterieren Sie. Halten Sie die Sitzung im selben Thread, wenn Sie möchten, dass das Modell auf frühere Kontexte aufbaut; Hy3s 256K-Fenster bewältigt die meisten vollständigen Codebasen Ende-zu-Ende.

Das ist der gesamte Ablauf. Das Modell, das Sie aufrufen, ist dasselbe, das auf Hugging Face veröffentlicht wurde; die Qualität im kostenlosen OpenRouter-Tarif ist identisch mit den kostenpflichtigen Routen anderer Anbieter.

Kostenlos, Plus und selbst gehostet: Wo sie sich unterscheiden

Kostenlos ist nicht der einzige Weg, und es hilft, die echten Unterschiede zu erkennen, bevor man sich für einen entscheidet.

Fähigkeit	OpenRouter Kostenlos	OpenRouter Kostenpflichtig (nicht kostenlose Endpunkte)	Selbst gehostet (vLLM / SGLang)
Kosten pro Token	0 $	Pro Anbieter	Strom plus GPU-Amortisation
Denkmodi	`no_think`, `low`, `high`	Gleich	Gleich
Kontextlänge	256K	256K	256K (sofern Speicher ausreicht)
Durchsatz unter Last	Geteilter Pool, bei Bedarf de-priorisiert	Dediziert	Was Ihr Cluster liefert
Ratenbegrenzungen	OpenRouter Free-Tier-Grenze (flexibel)	Anbieterspezifisch	Keine
Datenaufbewahrung	OpenRouter Protokollierungsrichtlinie	Anbieterspezifisch	Bleibt auf Ihrer Hardware
Sichtbarkeit von Reasoning-Token	Ja, über `reasoning_details`	Ja	Ja

Kostenlos ist die richtige Wahl für Prototypen, Nebenprojekte, Evaluierungs-Benchmarks und Agenten mit geringem Traffic. Kostenpflichtig oder selbst gehostet ist sinnvoll, sobald es auf Latenz ankommt oder Sie die Ratenbegrenzung überschreiten.

Prompt- und Parameter-Tipps, um mehr aus Hy3 herauszuholen

Hy3 belohnt eine explizite Einrichtung mehr als kleinere Modelle. Ein paar Gewohnheiten helfen dabei.

Passen Sie die Temperatur an den Modus an. Die Modellkarte empfiehlt temperature=0.9 und top_p=1.0 als Standard. Reduzieren Sie auf 0.3 für strukturierte Ausgabe, bleiben Sie bei 0.9 für kreative Arbeit.
Verwenden Sie no_think für den täglichen Chat. Der Standard-Denkmodus ist aus gutem Grund deaktiviert; Sie benötigen low oder high nur für die Planung, mehrschrittigen Code oder Mathematik. Die Ausführung von high bei einer einzeiligen Frage verschwendet Reasoning-Token.
Benennen Sie die Tools im System-Prompt. Hy3 wurde für die Tool-Nutzung mit einem spezifischen Parser (hy_v3) trainiert. Auch auf OpenRouter erhalten Sie bessere Aufrufe, wenn der System-Prompt die Aufgabe jedes Tools beschreibt, anstatt sich nur auf das Schema zu verlassen.
Zitieren Sie Code, fassen Sie ihn nicht zusammen. Das 256K-Fenster ermöglicht das Einfügen ganzer Dateien. Fügen Sie die Datei ein und stellen Sie dann die Frage; bitten Sie das Modell nicht, sich den Code vorzustellen.
Stapelweise Bearbeitung mehrerer Dateien. Hy3s SWE-bench Verified-Score von 74.4 resultiert aus der kohärenten Bearbeitung mehrerer Dateien. Geben Sie ihm den gesamten Satz in einer Nachricht, anstatt sie einzeln einzutropfen.
Fragen Sie zuerst nach einem Plan. Für agentische Aufgaben liefert ein zweistufiges Muster („erstelle einen Plan, warte auf meine Bestätigung, dann führe aus“) durchweg sauberere Ergebnisse als One-Shot-Prompts.

Grenzen, die man vor dem Einsatz kennen sollte

Einige Fallstricke werden Sie stolpern lassen, wenn Sie sie ignorieren.

Ratenbegrenzungen passen sich der Last an. Der kostenlose Tarif von OpenRouter teilt die Kapazität auf alle kostenlosen Benutzer auf. Beim Start betrug das tägliche Prompt-Volumen bereits 6,81 Milliarden Token; bei Spitzenzeiten können Aufrufe 429er-Fehler verursachen. Bauen Sie Wiederholungen mit exponentiellem Backoff ein.
Reasoning-Token zählen als Ausgabe. reasoning_details sind im kostenlosen OpenRouter-Tarif kostenlos, werden aber auf kostenpflichtigen Routen als Ausgabe abgerechnet. Versenden Sie keine effort: "high"-Standardwerte an ein umsatzsensibles Produkt, ohne dies vorher gemessen zu haben.
Die Lizenz ist nicht Apache 2.0. Die Tencent Hy Community License erlaubt die kommerzielle Nutzung, enthält aber Nutzungsrichtlinien und Attributionsklauseln; lesen Sie die vollständige Lizenz im GitHub-Repo, bevor Sie Hy3 in ein Produkt einbetten.
Tool-Aufrufe erfordern den richtigen Parser. Wenn Sie selbst hosten, führen Sie vLLM oder SGLang mit --tool-call-parser hy_v3 (oder hunyuan für SGLang) aus. Ohne dies werden Tool-Aufrufe als Klartext zurückgegeben.
Englisch und Chinesisch sind erstklassig; andere Sprachen zweitklassig. Die C-Eval-Scores von 89.80 und CMMLU von 89.61 zeigen starke Chinesischkenntnisse. Andere Sprachen werden über MMMLU unterstützt, fallen aber in der Qualität ab.
Es hinkt den Top-US-Flaggschiffen bei einigen Reasoning-Benchmarks hinterher. HLE liegt bei 30, und die SCMP-Berichterstattung stellt fest, dass Hy3 mit den Top-chinesischen Modellen mithalten kann, aber bei den schwierigsten Reasoning-Suiten immer noch hinter den aktuellen Flaggschiffen von OpenAI und Google DeepMind zurückliegt.

Der schnelle Entwicklerweg: Hy3 Preview plus Apidog

Curl in der Kommandozeile ist für eine Demo in Ordnung. Für echte Iterationen spart ein visueller API-Client Stunden.

Öffnen Sie Apidog und erstellen Sie ein neues Projekt. Importieren Sie die OpenAI Chat Completions OpenAPI-Spezifikation; OpenRouter verwendet dasselbe Schema.
Legen Sie die Basis-URL auf https://openrouter.ai/api/v1 fest und fügen Sie eine Umgebungsvariable für OPENROUTER_API_KEY hinzu.
Erstellen Sie eine Anfrage, die /chat/completions aufruft, wobei das Modell auf tencent/hy3-preview:free eingestellt ist.
Duplizieren Sie die Anfrage, um die Denkmodi zu vergleichen. Apidog ermöglicht es Ihnen, eine Anfrage zu duplizieren und einen Parameter anzupassen, sodass Sie denselben Prompt mit no_think, low und high nebeneinander ausführen und die Latenz und den Ausgabeunterschied überprüfen können.
Speichern Sie Prompt-Vorlagen. Agentische Prompts werden lang. Apidogs Umgebungs- und Variablensystem hält System-Prompts, Tool-Schemata und Benutzer-Turns getrennt, sodass Sie sie bei Tests wiederverwenden können.

Wenn Sie von Postman kommen, ist die Umstellung schnell; unser API-Testing ohne Postman im Jahr 2026 Leitfaden behandelt die Migration. Teams, die in ihrem Editor leben, können denselben Workflow in VS Code mit Apidog in VS Code ausführen, was die Prompt-Optimierung neben dem Code hält, der die Ausgabe konsumiert.

Kostenlose Alternativen, wenn Sie an die Grenze stoßen

Wenn der kostenlose OpenRouter-Pool Sie während der Spitzenzeiten drosselt, gibt es zwei Wege, die Sie zuerst ausprobieren sollten.

Hugging Face Space. Der Hy3-preview Space bietet eine Browser-Chat-Demo. Er ist nicht skriptfähig, aber kostenlos und nützlich für schnelle Vergleiche.
Andere kostenlose chinesische Open-Weights-Modelle. Alibabas Qwen 3.5 Omni bietet einen kostenlosen Tarif mit starker multimodaler Ausgabe; siehe unsere Qwen 3.5 Omni-Ankündigung und den Anleitungs-Begleiter für die Einrichtung. Zhipu GLM 5V Turbo ist eine weitere Option mit einem großzügigen kostenlosen Tarif; der GLM 5V Turbo API-Leitfaden enthält die vollständige Anleitung.

Keines davon erreicht Hy3s SWE-bench- und Terminal-Bench-Werte für agentische Codierung, aber sie decken Chat-, mehrsprachige und multimodale Anwendungsfälle ab, die der kostenlose Hy3-Tarif nicht priorisiert. Für eine Produktionsentwicklung laden Sie Apidog herunter und richten Sie eine Sammlung pro Modell ein; Side-by-Side-Benchmarks mit Ihren tatsächlichen Prompts schlagen jedes Leaderboard.

Schaltfläche

Hy3 Preview selbst hosten mit vLLM

Wenn Sie die Hardware haben, ist die lokale Inferenz der vierte kostenlose Weg. Die Modellkarte empfiehlt vLLM mit Tensorparallelität von 8 und aktivierter Multi-Token-Vorhersage für spekulatives Decoding:

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

Der äquivalente SGLang-Befehl verwendet --tool-call-parser hunyuan und --reasoning-parser hunyuan. Sobald der Server unter http://localhost:8000/v1 läuft, zeigt jedes OpenAI SDK darauf auf dieselbe Weise, wie es auf OpenRouter zeigen würde; nur die Basis-URL und der Schlüssel ändern sich.

Erwarten Sie acht H100-ähnliche GPUs bei BF16 für das vollständige Modell. Quantisierte Community-Builds werden erscheinen, aber zum Start ist der offizielle Weg volle Präzision.

FAQ

Ist Hy3 Preview kostenlos?Ja. OpenRouter listet tencent/hy3-preview:free mit 0 $ pro Million Eingabe-Token und 0 $ pro Million Ausgabe-Token auf. Reasoning-Token sind im kostenlosen Tarif ebenfalls kostenlos, auch wenn sie auf Ratenbegrenzungen angerechnet werden. Bestätigen Sie den aktuellen Status auf der OpenRouter-Modellseite, bevor Sie sich für die Produktion darauf verlassen.

Wie schneidet Hy3 Preview im Vergleich zu DeepSeek V3 und Qwen 3 ab?Hy3 Preview’s SWE-bench Verified-Score von 74.4 und Terminal-Bench 2.0 von 54.4 platzieren es in derselben Kategorie wie die Top-chinesischen Open-Modelle, mit einem klaren Fokus auf Agenten- und Tool-Nutzung. Für reinen Chat sind Qwen 3 und DeepSeek V3 wettbewerbsfähig; für Agenten- und Codierungs-Workflows ist Hy3s RL-trainierter Tool-Einsatz das Unterscheidungsmerkmal.

Was sind Hy3s Denkmodi?Drei: no_think (Standard, direkte Antwort), low und high. Wechseln Sie sie über den reasoning-Parameter auf OpenRouter oder über chat_template_kwargs={"reasoning_effort": "high"} beim direkten Aufruf des Modells. Verwenden Sie high für Planung, mehrschrittigen Code und Mathematik; lassen Sie es für Chat deaktiviert.

Kann ich Hy3 Preview kommerziell nutzen?Ja, unter der Tencent Hy Community License. Die Lizenz erlaubt die kommerzielle Nutzung mit Quellenangabe und Einhaltung der Nutzungsrichtlinien. Lesen Sie die vollständigen Bedingungen im Hy3 GitHub-Repo, bevor Sie es in einem umsatzgenerierenden Produkt einsetzen.

Welche Kontextlänge unterstützt der kostenlose Tarif?256K Token Ende-zu-Ende. OpenRouters Liste zeigt 262.144 Token, passend zur Modellkarte. Sie können eine ganze mittelgroße Codebasis einfügen und haben immer noch Platz für Tool-Schemata und Konversationsverlauf.

Wie teste ich Hy3 Preview ohne Code zu schreiben?Nutzen Sie den Hugging Face Space für eine Browser-Chat-Demo oder richten Sie Apidog auf den OpenRouter-Endpunkt aus. Apidog importiert die OpenAI OpenAPI-Spezifikation, sodass die Konfiguration der Anfrage aus drei Feldern besteht: Basis-URL, API-Schlüssel und Modellname.