Cómo Usar la API de Vista Previa Hy3 Gratis

Ashley Innocent

Ashley Innocent

23 April 2026

Cómo Usar la API de Vista Previa Hy3 Gratis

Tencent hizo de código abierto Hy3 Preview el 22 de abril de 2026, y en un día OpenRouter lo incluyó como un punto final completamente gratuito. Sin tarjeta de crédito, sin medición de tokens, sin ventana de prueba. Puedes llamar al mismo modelo Mixture-of-Experts de 295B parámetros que impulsa la aplicación Yuanbao de Tencent y el asistente CodeBuddy desde tu propio código, hoy, por cero dólares.

Esta guía muestra cómo usar la API de Hy3 Preview de forma gratuita a través de OpenRouter, el Space de Hugging Face y el repositorio Hy3 original. También cubre los modos de razonamiento que hacen que Hy3 sea diferente de la mayoría de los modelos abiertos de 2026, y cómo probar la API dentro de Apidog sin escribir scripts desechables.

botón

Si quieres la ruta más rápida para tu primera respuesta, salta a "Paso a paso: llama a Hy3 Preview gratis en OpenRouter".

En resumen

¿Qué es Hy3 Preview?

Hy3 Preview es el primer lanzamiento insignia del equipo reestructurado de modelos fundacionales Hunyuan de Tencent, ahora liderado por Yao Shunyu, un exinvestigador de OpenAI que la compañía contrató para impulsar su pila de razonamiento. Enmarquémoslo como el modelo más capaz de Tencent hasta la fecha y una respuesta directa a los principales lanzamientos de código abierto chinos de DeepSeek, Alibaba y Zhipu.

Captura de pantalla de la arquitectura de Hy3 Preview, mostrando su estructura MoE y flujo de datos.

El perfil técnico de la tarjeta de modelo oficial es centrado en el agente:

Lo que lo distingue de un MoE genérico de rango de 200B es el entrenamiento agéntico. Tencent reconstruyó su infraestructura de RL para el uso de herramientas de múltiples turnos, y las puntuaciones publicadas en SWE-bench Verified, Terminal-Bench 2.0 y el conjunto interno WildClawBench lo sitúan cerca de los modelos cerrados más importantes en tareas de código y shell.

Gráfico que muestra los resultados de Hy3 Preview en SWE-bench Verified y Terminal-Bench 2.0.

Tres formas gratuitas de usar Hy3 Preview

Tienes tres caminos dependiendo de si quieres una interfaz de chat, una API o pesos locales.

Ruta Qué es ¿Gratis? Ideal para
OpenRouter tencent/hy3-preview:free API compatible con OpenAI alojada Sí, $0 entrada/salida Construir agentes, scripts y características de backend
Hugging Face Space Demostración de chat en navegador Mensajes rápidos, probarlo, pruebas de humo
Pesos autoalojados (vLLM / SGLang) Ejecutar los pesos abiertos en tus propias GPUs Software gratuito, se aplica el costo del hardware Cargas de trabajo sensibles a la privacidad, alto volumen

La mayoría de los desarrolladores querrán la ruta de OpenRouter. Es el camino más corto desde el registro hasta una llamada a la API que funciona, y los límites de tarifa en la capa gratuita son lo suficientemente generosos para la creación de prototipos.

Paso a paso: llama a Hy3 Preview gratis en OpenRouter

Aquí tienes el camino mínimo desde cero hasta una respuesta funcional de tencent/hy3-preview:free.

Captura de pantalla de la página de OpenRouter para Hy3 Preview, mostrando su estado gratuito y estadísticas de uso.
  1. Crea una cuenta de OpenRouter. Regístrate en openrouter.ai. Un correo electrónico es suficiente; no se requiere método de pago para los modelos de la capa gratuita.
  2. Genera una clave API. En el panel de control de OpenRouter, abre "Keys" y crea una nueva clave. Cópiala en una variable de entorno, por ejemplo export OPENROUTER_API_KEY=sk-or-....
  3. Abre la página del modelo. Ve a la lista gratuita de Hy3 Preview y confirma que el banner de estado dice "Free". También verás estadísticas de uso allí; en el lanzamiento, el endpoint estaba manejando 6.81B de tokens de entrada por día entre todos los usuarios.
Captura de pantalla del banner de OpenRouter que confirma que Hy3 Preview es un modelo gratuito.

Envía tu primera solicitud. OpenRouter expone el esquema de OpenAI Chat Completions, por lo que cualquier SDK de OpenAI funciona:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explica la decisión de enrutamiento de MoE dentro de una configuración top-8 de 192 en 3 oraciones."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'
  1. Activa el razonamiento cuando lo necesites. Hy3 acepta un parámetro reasoning con effort establecido en low o high. OpenRouter devuelve el rastro de pensamiento en un array reasoning_details separado, facturado como su propio cubo de tokens:
{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Planifica, luego escribe un script Bash que rote los archivos de registro diarios con más de 30 días en una carpeta de archivo fechada."}
  ],
  "reasoning": {"effort": "high"}
}
  1. Itera. Mantén la sesión en el mismo hilo si quieres que el modelo se base en el contexto anterior; la ventana de 256K de Hy3 maneja la mayoría de las bases de código completas de principio a fin.

Ese es todo el flujo. El modelo al que estás llamando es el mismo publicado en Hugging Face; la calidad en la capa gratuita de OpenRouter es idéntica a las rutas de pago en otros proveedores.

Gratuito, Plus y autoalojado: en qué se diferencian

Gratuito no es el único camino, y ayuda ver la diferencia real antes de comprometerte con uno.

Capacidad OpenRouter Gratuito OpenRouter de pago (endpoints no gratuitos) Autoalojado (vLLM / SGLang)
Costo por token $0 Por proveedor Electricidad más amortización de GPU
Modos de razonamiento no_think, low, high Igual Igual
Longitud del contexto 256K 256K 256K (si la memoria lo permite)
Rendimiento bajo carga Pool compartido, despriorizado bajo demanda Dedicado Lo que tu clúster sirva
Límites de tarifa Límite de capa gratuita de OpenRouter (flexible) Específico del proveedor Ninguno
Retención de datos Política de registro de OpenRouter Específico del proveedor Permanece en tu hardware
Visibilidad de tokens de razonamiento Sí, vía reasoning_details

Gratuito es la elección correcta para prototipos, proyectos secundarios, benchmarks de evaluación y agentes de bajo tráfico. Pago o autoalojado tiene sentido en el momento en que la latencia importa o excedes el límite de tarifa.

Consejos de prompts y parámetros para sacar más partido a Hy3

Hy3 recompensa la configuración explícita más que los modelos más pequeños. Algunos hábitos ayudan.

Límites que conviene conocer antes de lanzar

Algunos inconvenientes te sorprenderán si los pasas por alto.

La vía rápida para desarrolladores: Hy3 Preview más Apidog

El `curl` de línea de comandos está bien para una demostración. Para una iteración real, un cliente API visual ahorra horas.

  1. Abre Apidog y crea un nuevo proyecto. Importa la especificación OpenAPI de OpenAI Chat Completions; OpenRouter utiliza el mismo esquema.
  2. Establece la URL base en https://openrouter.ai/api/v1 y agrega una variable de entorno para OPENROUTER_API_KEY.
  3. Crea una solicitud que apunte a /chat/completions con el modelo configurado como tencent/hy3-preview:free.
  4. Duplica la solicitud para comparar los modos de razonamiento. Apidog te permite duplicar una solicitud y ajustar un parámetro, para que puedas ejecutar el mismo prompt con no_think, low y high uno al lado del otro e inspeccionar la latencia y la diferencia de salida.
  5. Guarda las plantillas de prompts. Los prompts agénticos se vuelven largos. El sistema de entorno y variables de Apidog mantiene separados los prompts del sistema, los esquemas de herramientas y los turnos de usuario para que puedas reutilizarlos en diferentes pruebas.

Si vienes de Postman, el cambio es rápido; nuestra guía de pruebas de API sin Postman en 2026 cubre la migración. Los equipos que viven en su editor pueden ejecutar el mismo flujo de trabajo dentro de VS Code con Apidog dentro de VS Code, lo que mantiene la optimización de prompts junto al código que consume la salida.

Alternativas gratuitas cuando alcanzas el límite

Si el pool gratuito de OpenRouter te ralentiza durante las horas pico, hay dos caminos que vale la pena probar primero.

Ninguno de estos iguala los números de SWE-bench y Terminal-Bench de Hy3 para codificación agéntica, pero cubren casos de uso de chat, multilingües y multimodales que la capa gratuita de Hy3 no prioriza. Para una compilación de producción, descarga Apidog y configura una colección por modelo; los benchmarks lado a lado en tus prompts reales superan la lectura de cualquier clasificación.

botón

Autoalojamiento de Hy3 Preview con vLLM

Si tienes el hardware, la inferencia local es el cuarto camino gratuito. La tarjeta del modelo recomienda vLLM con paralelismo de tensor de 8 y predicción multi-token habilitada para decodificación especulativa:

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

El comando SGLang equivalente usa --tool-call-parser hunyuan y --reasoning-parser hunyuan. Una vez que el servidor esté activo en http://localhost:8000/v1, cualquier SDK de OpenAI apunta a él de la misma manera que apuntaría a OpenRouter; solo cambian la URL base y la clave.

Espera ocho GPUs de clase H100 a BF16 para el modelo completo. Aparecerán compilaciones comunitarias cuantizadas, pero en el lanzamiento la ruta oficial es de precisión completa.

Preguntas frecuentes

¿Es Hy3 Preview gratuito?Sí. OpenRouter lista tencent/hy3-preview:free con $0 por millón de tokens de entrada y $0 por millón de tokens de salida. Los tokens de razonamiento en la capa gratuita también son gratuitos, aunque cuentan para los límites de velocidad. Confirma el estado actual en la página del modelo de OpenRouter antes de depender de él para producción.

¿Cómo se compara Hy3 Preview con DeepSeek V3 y Qwen 3?La puntuación de SWE-bench Verified de Hy3 Preview de 74.4 y Terminal-Bench 2.0 de 54.4 lo sitúan en el mismo nivel que los principales modelos abiertos chinos, con una clara inclinación hacia el agente y el uso de herramientas. Para el chat puro, Qwen 3 y DeepSeek V3 son competitivos; para los flujos de trabajo de agente y codificación, el uso de herramientas entrenado con RL de Hy3 es el diferenciador.

¿Cuáles son los modos de razonamiento de Hy3?Tres: no_think (predeterminado, respuesta directa), low y high. Cámbialos a través del parámetro reasoning en OpenRouter o vía chat_template_kwargs={"reasoning_effort": "high"} al llamar directamente al modelo. Usa high para planificación, código de varios pasos y matemáticas; déjalo desactivado para el chat.

¿Puedo usar Hy3 Preview comercialmente?Sí, bajo la Licencia Comunitaria Tencent Hy. La licencia permite el uso comercial con atribución y cumplimiento de las cláusulas de política de uso. Lee los términos completos en el repositorio de GitHub de Hy3 antes de implementarlo en un producto que genere ingresos.

¿Qué longitud de contexto admite la capa gratuita?256K tokens de principio a fin. La lista de OpenRouter muestra 262.144 tokens, lo que coincide con la tarjeta del modelo. Puedes pegar una base de código de tamaño medio completa y aún tener espacio para esquemas de herramientas e historial de conversación.

¿Cómo pruebo Hy3 Preview sin escribir código?Usa el Space de Hugging Face para una demostración de chat en navegador, o apunta Apidog al endpoint de OpenRouter. Apidog importa la especificación OpenAPI de OpenAI, por lo que configurar la solicitud es cuestión de tres campos: URL base, clave API y nombre del modelo.

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs