Comment utiliser l'API d'aperçu Hy3 gratuitement ?

Ashley Innocent

Ashley Innocent

23 April 2026

Comment utiliser l'API d'aperçu Hy3 gratuitement ?

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Tencent a mis en open source Hy3 Preview le 22 avril 2026, et en moins d'un jour, OpenRouter l'a listé comme un point d'accès entièrement gratuit. Pas de carte de crédit, pas de facturation de jetons, pas de période d'essai. Vous pouvez appeler le même modèle Mixture-of-Experts de 295 milliards de paramètres qui alimente l'application Yuanbao et l'assistant CodeBuddy de Tencent depuis votre propre code, aujourd'hui, pour zéro dollar.

Ce guide montre comment utiliser l'API Hy3 Preview gratuitement via OpenRouter, l'espace Hugging Face et le dépôt Hy3 brut. Il couvre également les modes de raisonnement qui distinguent Hy3 de la plupart des modèles open source de 2026, et comment tester l'API dans Apidog sans écrire de scripts jetables.

bouton

Si vous voulez le moyen le plus rapide d'obtenir votre première réponse, passez à « Étape par étape : appeler Hy3 Preview gratuitement sur OpenRouter ».

TL;DR

Qu'est-ce que Hy3 Preview ?

Hy3 Preview est la première version phare de l'équipe restructurée de modèles fondamentaux Hunyuan de Tencent, désormais dirigée par Yao Shunyu, un ancien chercheur d'OpenAI que la société a embauché pour faire progresser sa pile de raisonnement. On peut le considérer comme le modèle le plus performant de Tencent à ce jour et une réponse directe aux meilleures versions chinoises à poids ouverts de DeepSeek, Alibaba et Zhipu.

Le profil technique de la fiche de modèle officielle est axé sur l'agent :

Ce qui le distingue d'un MoE générique de l'ordre de 200 milliards, c'est l'entraînement agentique. Tencent a reconstruit son infrastructure RL pour l'utilisation d'outils multi-tours, et les scores publiés sur SWE-bench Verified, Terminal-Bench 2.0 et la suite interne WildClawBench le placent près des meilleurs modèles fermés sur les tâches de code et de shell.

Trois façons gratuites d'utiliser Hy3 Preview

Vous avez trois voies selon que vous souhaitez une interface de chat, une API ou des poids locaux.

Voie Ce que c'est Gratuit ? Idéal pour
OpenRouter tencent/hy3-preview:free API hébergée compatible OpenAI Oui, 0 $ entrée/sortie Construire des agents, des scripts et des fonctionnalités backend
Espace Hugging Face Démo de chat par navigateur Oui Prompts rapides, essais initiaux, tests de fumée
Poids auto-hébergés (vLLM / SGLang) Exécuter les poids ouverts sur vos propres GPU Logiciel gratuit, coût matériel applicable Charges de travail sensibles à la confidentialité, volume élevé

La plupart des développeurs préféreront la voie OpenRouter. C'est le chemin le plus court entre l'inscription et un appel API fonctionnel, et les limites de débit du niveau gratuit sont suffisamment généreuses pour le prototypage.

Étape par étape : appeler Hy3 Preview gratuitement sur OpenRouter

Voici le chemin minimal pour obtenir une réponse `tencent/hy3-preview:free` fonctionnelle, à partir de zéro.

  1. Créer un compte OpenRouter. Inscrivez-vous sur openrouter.ai. L'e-mail suffit ; aucune méthode de paiement n'est requise pour les modèles de niveau gratuit.
  2. Générer une clé API. Dans le tableau de bord OpenRouter, ouvrez « Clés » et créez une nouvelle clé. Copiez-la dans une variable d'environnement, par exemple export OPENROUTER_API_KEY=sk-or-....
  3. Ouvrir la page du modèle. Allez à la liste gratuite de Hy3 Preview et confirmez que la bannière d'état indique « Gratuit ». Vous y verrez également des statistiques d'utilisation ; au lancement, le point d'accès traitait 6,81 milliards de jetons de prompt par jour pour tous les utilisateurs.

Envoyer votre première requête. OpenRouter expose le schéma OpenAI Chat Completions, donc n'importe quel SDK OpenAI fonctionne :

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'
  1. Activer le raisonnement quand vous en avez besoin. Hy3 accepte un paramètre reasoning avec effort défini sur low ou high. OpenRouter renvoie la trace de pensée dans un tableau reasoning_details séparé, facturé comme son propre seau de jetons :
{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."}
  ],
  "reasoning": {"effort": "high"}
}
  1. Itérer. Gardez la session dans le même thread si vous voulez que le modèle s'appuie sur le contexte précédent ; la fenêtre de 256K de Hy3 gère la plupart des bases de code complètes de bout en bout.

Voilà tout le processus. Le modèle que vous appelez est le même que celui publié sur Hugging Face ; la qualité sur le niveau gratuit d'OpenRouter est identique à celle des voies payantes chez d'autres fournisseurs.

Gratuit, Plus et auto-hébergé : leurs différences

Le gratuit n'est pas la seule voie, et il est utile de voir les vraies différences avant de s'engager.

Capacité OpenRouter Gratuit OpenRouter Payant (points d'accès non gratuits) Auto-hébergé (vLLM / SGLang)
Coût par jeton 0 $ Par fournisseur Électricité plus amortissement du GPU
Modes de raisonnement no_think, low, high Identiques Identiques
Longueur du contexte 256K 256K 256K (si la mémoire le permet)
Débit sous charge Pool partagé, dépriorisé en cas de demande Dédié Ce que votre cluster dessert
Limites de débit Plafond du niveau gratuit OpenRouter (variable) Spécifiques au fournisseur Aucune
Rétention des données Politique de journalisation d'OpenRouter Spécifiques au fournisseur Reste sur votre matériel
Visibilité des jetons de raisonnement Oui, via reasoning_details Oui Oui

Le gratuit est le bon choix pour les prototypes, les projets secondaires, les benchmarks d'évaluation et les agents à faible trafic. Le payant ou l'auto-hébergement prend tout son sens dès que la latence est importante ou que vous dépassez le plafond de débit.

Conseils de prompt et de paramètres pour tirer le meilleur parti de Hy3

Hy3 récompense une configuration explicite plus que les modèles plus petits. Quelques habitudes aident.

Limites à connaître avant de déployer

Quelques pièges vous attendent si vous les ignorez.

Le chemin rapide du développeur : Hy3 Preview plus Apidog

Le curl en ligne de commande est bien pour une démo. Pour une véritable itération, un client API visuel fait gagner des heures.

  1. Ouvrir Apidog et créer un nouveau projet. Importez la spécification OpenAPI des complétions de chat OpenAI ; OpenRouter utilise le même schéma.
  2. Définissez l'URL de base sur https://openrouter.ai/api/v1 et ajoutez une variable d'environnement pour OPENROUTER_API_KEY.
  3. Créez une requête qui cible /chat/completions avec le modèle défini sur tencent/hy3-preview:free.
  4. Dupliquez la requête pour comparer les modes de raisonnement. Apidog vous permet de dupliquer une requête et de modifier un paramètre, afin que vous puissiez exécuter le même prompt avec no_think, low et high côte à côte et inspecter la latence et la différence de sortie.
  5. Enregistrez les modèles de prompts. Les prompts agentiques peuvent devenir longs. Le système d'environnement et de variables d'Apidog sépare les prompts système, les schémas d'outils et les tours d'utilisateur afin que vous puissiez les réutiliser dans différents tests.

Si vous venez de Postman, le changement est rapide ; notre guide de test d'API sans Postman en 2026 couvre la migration. Les équipes qui vivent dans leur éditeur peuvent exécuter le même workflow à l'intérieur de VS Code avec Apidog à l'intérieur de VS Code, ce qui permet d'ajuster les prompts à côté du code qui consomme la sortie.

Alternatives gratuites lorsque vous atteignez la limite

Si le pool gratuit d'OpenRouter vous limite pendant les heures de pointe, deux pistes valent la peine d'être explorées en premier.

Aucun de ceux-ci ne correspond aux chiffres de Hy3 pour SWE-bench et Terminal-Bench en matière de codage agentique, mais ils couvrent des cas d'utilisation de chat, multilingues et multimodaux que le niveau gratuit de Hy3 ne priorise pas. Pour une construction de production, téléchargez Apidog et configurez une collection par modèle ; les benchmarks côte à côte sur vos prompts réels sont plus efficaces que la lecture de n'importe quel classement.

bouton

Auto-hébergement de Hy3 Preview avec vLLM

Si vous disposez du matériel, l'inférence locale est la quatrième voie gratuite. La fiche du modèle recommande vLLM avec un parallélisme tensoriel de 8 et la prédiction multi-jetons activée pour le décodage spéculatif :

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

La commande SGLang équivalente utilise --tool-call-parser hunyuan et --reasoning-parser hunyuan. Une fois le serveur démarré à http://localhost:8000/v1, n'importe quel SDK OpenAI le cible de la même manière qu'il ciblerait OpenRouter ; seuls l'URL de base et la clé changent.

Attendez-vous à huit GPU de classe H100 en BF16 pour le modèle complet. Des versions communautaires quantifiées apparaîtront, mais au lancement, le chemin officiel est la pleine précision.

FAQ

Hy3 Preview est-il gratuit ?Oui. OpenRouter liste tencent/hy3-preview:free avec 0 $ par million de jetons d'entrée et 0 $ par million de jetons de sortie. Les jetons de raisonnement sur le niveau gratuit sont également gratuits, bien qu'ils comptent dans les limites de débit. Confirmez le statut actuel sur la page du modèle OpenRouter avant de vous y fier pour la production.

Comment Hy3 Preview se compare-t-il à DeepSeek V3 et Qwen 3 ?Le score SWE-bench Verified de Hy3 Preview de 74,4 et Terminal-Bench 2.0 de 54,4 le placent au même niveau que les meilleurs modèles ouverts chinois, avec une nette orientation agent et utilisation d'outils. Pour le chat pur, Qwen 3 et DeepSeek V3 sont compétitifs ; pour les workflows d'agent et de codage, l'utilisation d'outils entraînée par RL de Hy3 est le facteur de différenciation.

Quels sont les modes de raisonnement de Hy3 ?Trois : no_think (par défaut, réponse directe), low et high. Changez-les via le paramètre reasoning sur OpenRouter ou via chat_template_kwargs={"reasoning_effort": "high"} lors de l'appel direct du modèle. Utilisez high pour la planification, le code multi-étapes et les mathématiques ; désactivez-le pour le chat.

Puis-je utiliser Hy3 Preview commercialement ?Oui, sous la licence communautaire Tencent Hy. La licence autorise l'utilisation commerciale avec attribution et conformité aux politiques d'utilisation. Lisez les conditions complètes sur le dépôt GitHub de Hy3 avant de le déployer dans un produit générateur de revenus.

Quelle longueur de contexte le niveau gratuit prend-il en charge ?256K jetons de bout en bout. La liste d'OpenRouter indique 262 144 jetons, correspondant à la fiche du modèle. Vous pouvez coller une base de code entière de taille moyenne et avoir encore de la place pour les schémas d'outils et l'historique de conversation.

Comment tester Hy3 Preview sans écrire de code ?Utilisez l'espace Hugging Face pour une démo de chat par navigateur, ou pointez Apidog vers le point d'accès OpenRouter. Apidog importe la spécification OpenAPI d'OpenAI, donc la configuration de la requête se fait en trois champs : URL de base, clé API et nom du modèle.

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API