Hy3 Preview API Kostenlos Nutzen: So geht's

Ashley Innocent

Ashley Innocent

23 April 2026

Hy3 Preview API Kostenlos Nutzen: So geht's

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Tencent hat Hy3 Preview am 22. April 2026 quelloffen gemacht, und innerhalb eines Tages listete OpenRouter es als vollständig kostenlosen Endpunkt. Keine Kreditkarte, keine Token-Abrechnung, kein Testzeitraum. Sie können dasselbe 295B-Parameter Mixture-of-Experts-Modell, das Tencents Yuanbao-App und den CodeBuddy-Assistenten antreibt, heute aus Ihrem eigenen Code heraus für null Euro aufrufen.

Dieser Leitfaden zeigt, wie Sie die Hy3 Preview API kostenlos über OpenRouter, den Hugging Face Space und das ursprüngliche Hy3-Repository nutzen können. Er behandelt auch die Denkmodi, die Hy3 von den meisten offenen Modellen von 2026 unterscheiden, und wie Sie die API innerhalb von Apidog testen können, ohne Wegwerf-Skripte schreiben zu müssen.

Schaltfläche

Wenn Sie den schnellsten Weg zu Ihrer ersten Antwort wünschen, springen Sie zu „Schritt-für-Schritt: Hy3 Preview kostenlos über OpenRouter aufrufen“.

Kurz gesagt (TL;DR)

Was ist Hy3 Preview?

Hy3 Preview ist die erste Flaggschiff-Veröffentlichung des neu strukturierten Hunyuan-Basismodellteams von Tencent, das jetzt von Yao Shunyu geleitet wird, einem ehemaligen OpenAI-Forscher, den das Unternehmen eingestellt hat, um seinen Reasoning Stack voranzutreiben. Es kann als Tencents bisher leistungsfähigstes Modell und eine direkte Antwort auf die wichtigsten chinesischen Open-Weights-Veröffentlichungen von DeepSeek, Alibaba und Zhipu verstanden werden.

Das technische Profil der offiziellen Modellkarte ist agentenorientiert:

Was es von einem generischen MoE im 200B-Bereich unterscheidet, ist das agentische Training. Tencent hat seine RL-Infrastruktur für den Multi-Turn-Werkzeuggebrauch neu aufgebaut, und die veröffentlichten Ergebnisse auf SWE-bench Verified, Terminal-Bench 2.0 und der internen WildClawBench-Suite bringen es in die Nähe der besten geschlossenen Modelle bei Code- und Shell-Aufgaben.

Drei kostenlose Wege zur Nutzung von Hy3 Preview

Sie haben drei Möglichkeiten, je nachdem, ob Sie eine Chat-Benutzeroberfläche, eine API oder lokale Gewichte wünschen.

Weg Was es ist Kostenlos? Gut für
OpenRouter tencent/hy3-preview:free Gehostete OpenAI-kompatible API Ja, 0 $ Input/Output Entwicklung von Agenten, Skripten und Backend-Funktionen
Hugging Face Space Browser-Chat-Demo Ja Schnelle Prompts, Ausprobieren, Smoke-Tests
Selbst gehostete Gewichte (vLLM / SGLang) Führen Sie die offenen Gewichte auf Ihren eigenen GPUs aus Kostenlose Software, Hardwarekosten fallen an Datenschutzsensible Arbeitslasten, hohes Volumen

Die meisten Entwickler werden den OpenRouter-Weg bevorzugen. Es ist der kürzeste Weg von der Anmeldung bis zu einem funktionierenden API-Aufruf, und die Ratenbegrenzungen im kostenlosen Tarif sind für Prototypen ausreichend großzügig.

Schritt-für-Schritt: Hy3 Preview kostenlos über OpenRouter aufrufen

Hier ist der minimale Weg von null zu einer funktionierenden tencent/hy3-preview:free-Antwort.

  1. Erstellen Sie ein OpenRouter-Konto. Melden Sie sich unter openrouter.ai an. Eine E-Mail-Adresse genügt; für Free-Tier-Modelle ist keine Zahlungsmethode erforderlich.
  2. Generieren Sie einen API-Schlüssel. Öffnen Sie im OpenRouter-Dashboard „Keys“ und erstellen Sie einen neuen Schlüssel. Kopieren Sie ihn in eine Umgebungsvariable, zum Beispiel export OPENROUTER_API_KEY=sk-or-....
  3. Öffnen Sie die Modellseite. Gehen Sie zur kostenlosen Hy3 Preview-Liste und bestätigen Sie, dass der Statusbanner „Free“ anzeigt. Dort sehen Sie auch Nutzungsstatistiken; zum Start verarbeitete der Endpunkt täglich 6,81 Milliarden Prompt-Token über alle Benutzer hinweg.

Senden Sie Ihre erste Anfrage. OpenRouter stellt das OpenAI Chat Completions-Schema bereit, sodass jedes OpenAI SDK funktioniert:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'
  1. Schalten Sie das Reasoning ein, wenn Sie es benötigen. Hy3 akzeptiert einen reasoning-Parameter mit effort auf low oder high. OpenRouter gibt die Denkspur in einem separaten reasoning_details-Array zurück, das als eigener Token-Bucket abgerechnet wird:
{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."}
  ],
  "reasoning": {"effort": "high"}
}
  1. Iterieren Sie. Halten Sie die Sitzung im selben Thread, wenn Sie möchten, dass das Modell auf frühere Kontexte aufbaut; Hy3s 256K-Fenster bewältigt die meisten vollständigen Codebasen Ende-zu-Ende.

Das ist der gesamte Ablauf. Das Modell, das Sie aufrufen, ist dasselbe, das auf Hugging Face veröffentlicht wurde; die Qualität im kostenlosen OpenRouter-Tarif ist identisch mit den kostenpflichtigen Routen anderer Anbieter.

Kostenlos, Plus und selbst gehostet: Wo sie sich unterscheiden

Kostenlos ist nicht der einzige Weg, und es hilft, die echten Unterschiede zu erkennen, bevor man sich für einen entscheidet.

Fähigkeit OpenRouter Kostenlos OpenRouter Kostenpflichtig (nicht kostenlose Endpunkte) Selbst gehostet (vLLM / SGLang)
Kosten pro Token 0 $ Pro Anbieter Strom plus GPU-Amortisation
Denkmodi no_think, low, high Gleich Gleich
Kontextlänge 256K 256K 256K (sofern Speicher ausreicht)
Durchsatz unter Last Geteilter Pool, bei Bedarf de-priorisiert Dediziert Was Ihr Cluster liefert
Ratenbegrenzungen OpenRouter Free-Tier-Grenze (flexibel) Anbieterspezifisch Keine
Datenaufbewahrung OpenRouter Protokollierungsrichtlinie Anbieterspezifisch Bleibt auf Ihrer Hardware
Sichtbarkeit von Reasoning-Token Ja, über reasoning_details Ja Ja

Kostenlos ist die richtige Wahl für Prototypen, Nebenprojekte, Evaluierungs-Benchmarks und Agenten mit geringem Traffic. Kostenpflichtig oder selbst gehostet ist sinnvoll, sobald es auf Latenz ankommt oder Sie die Ratenbegrenzung überschreiten.

Prompt- und Parameter-Tipps, um mehr aus Hy3 herauszuholen

Hy3 belohnt eine explizite Einrichtung mehr als kleinere Modelle. Ein paar Gewohnheiten helfen dabei.

Grenzen, die man vor dem Einsatz kennen sollte

Einige Fallstricke werden Sie stolpern lassen, wenn Sie sie ignorieren.

Der schnelle Entwicklerweg: Hy3 Preview plus Apidog

Curl in der Kommandozeile ist für eine Demo in Ordnung. Für echte Iterationen spart ein visueller API-Client Stunden.

  1. Öffnen Sie Apidog und erstellen Sie ein neues Projekt. Importieren Sie die OpenAI Chat Completions OpenAPI-Spezifikation; OpenRouter verwendet dasselbe Schema.
  2. Legen Sie die Basis-URL auf https://openrouter.ai/api/v1 fest und fügen Sie eine Umgebungsvariable für OPENROUTER_API_KEY hinzu.
  3. Erstellen Sie eine Anfrage, die /chat/completions aufruft, wobei das Modell auf tencent/hy3-preview:free eingestellt ist.
  4. Duplizieren Sie die Anfrage, um die Denkmodi zu vergleichen. Apidog ermöglicht es Ihnen, eine Anfrage zu duplizieren und einen Parameter anzupassen, sodass Sie denselben Prompt mit no_think, low und high nebeneinander ausführen und die Latenz und den Ausgabeunterschied überprüfen können.
  5. Speichern Sie Prompt-Vorlagen. Agentische Prompts werden lang. Apidogs Umgebungs- und Variablensystem hält System-Prompts, Tool-Schemata und Benutzer-Turns getrennt, sodass Sie sie bei Tests wiederverwenden können.

Wenn Sie von Postman kommen, ist die Umstellung schnell; unser API-Testing ohne Postman im Jahr 2026 Leitfaden behandelt die Migration. Teams, die in ihrem Editor leben, können denselben Workflow in VS Code mit Apidog in VS Code ausführen, was die Prompt-Optimierung neben dem Code hält, der die Ausgabe konsumiert.

Kostenlose Alternativen, wenn Sie an die Grenze stoßen

Wenn der kostenlose OpenRouter-Pool Sie während der Spitzenzeiten drosselt, gibt es zwei Wege, die Sie zuerst ausprobieren sollten.

Keines davon erreicht Hy3s SWE-bench- und Terminal-Bench-Werte für agentische Codierung, aber sie decken Chat-, mehrsprachige und multimodale Anwendungsfälle ab, die der kostenlose Hy3-Tarif nicht priorisiert. Für eine Produktionsentwicklung laden Sie Apidog herunter und richten Sie eine Sammlung pro Modell ein; Side-by-Side-Benchmarks mit Ihren tatsächlichen Prompts schlagen jedes Leaderboard.

Schaltfläche

Hy3 Preview selbst hosten mit vLLM

Wenn Sie die Hardware haben, ist die lokale Inferenz der vierte kostenlose Weg. Die Modellkarte empfiehlt vLLM mit Tensorparallelität von 8 und aktivierter Multi-Token-Vorhersage für spekulatives Decoding:

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

Der äquivalente SGLang-Befehl verwendet --tool-call-parser hunyuan und --reasoning-parser hunyuan. Sobald der Server unter http://localhost:8000/v1 läuft, zeigt jedes OpenAI SDK darauf auf dieselbe Weise, wie es auf OpenRouter zeigen würde; nur die Basis-URL und der Schlüssel ändern sich.

Erwarten Sie acht H100-ähnliche GPUs bei BF16 für das vollständige Modell. Quantisierte Community-Builds werden erscheinen, aber zum Start ist der offizielle Weg volle Präzision.

FAQ

Ist Hy3 Preview kostenlos?Ja. OpenRouter listet tencent/hy3-preview:free mit 0 $ pro Million Eingabe-Token und 0 $ pro Million Ausgabe-Token auf. Reasoning-Token sind im kostenlosen Tarif ebenfalls kostenlos, auch wenn sie auf Ratenbegrenzungen angerechnet werden. Bestätigen Sie den aktuellen Status auf der OpenRouter-Modellseite, bevor Sie sich für die Produktion darauf verlassen.

Wie schneidet Hy3 Preview im Vergleich zu DeepSeek V3 und Qwen 3 ab?Hy3 Preview’s SWE-bench Verified-Score von 74.4 und Terminal-Bench 2.0 von 54.4 platzieren es in derselben Kategorie wie die Top-chinesischen Open-Modelle, mit einem klaren Fokus auf Agenten- und Tool-Nutzung. Für reinen Chat sind Qwen 3 und DeepSeek V3 wettbewerbsfähig; für Agenten- und Codierungs-Workflows ist Hy3s RL-trainierter Tool-Einsatz das Unterscheidungsmerkmal.

Was sind Hy3s Denkmodi?Drei: no_think (Standard, direkte Antwort), low und high. Wechseln Sie sie über den reasoning-Parameter auf OpenRouter oder über chat_template_kwargs={"reasoning_effort": "high"} beim direkten Aufruf des Modells. Verwenden Sie high für Planung, mehrschrittigen Code und Mathematik; lassen Sie es für Chat deaktiviert.

Kann ich Hy3 Preview kommerziell nutzen?Ja, unter der Tencent Hy Community License. Die Lizenz erlaubt die kommerzielle Nutzung mit Quellenangabe und Einhaltung der Nutzungsrichtlinien. Lesen Sie die vollständigen Bedingungen im Hy3 GitHub-Repo, bevor Sie es in einem umsatzgenerierenden Produkt einsetzen.

Welche Kontextlänge unterstützt der kostenlose Tarif?256K Token Ende-zu-Ende. OpenRouters Liste zeigt 262.144 Token, passend zur Modellkarte. Sie können eine ganze mittelgroße Codebasis einfügen und haben immer noch Platz für Tool-Schemata und Konversationsverlauf.

Wie teste ich Hy3 Preview ohne Code zu schreiben?Nutzen Sie den Hugging Face Space für eine Browser-Chat-Demo oder richten Sie Apidog auf den OpenRouter-Endpunkt aus. Apidog importiert die OpenAI OpenAPI-Spezifikation, sodass die Konfiguration der Anfrage aus drei Feldern besteht: Basis-URL, API-Schlüssel und Modellname.

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen