Qwen 3.6 en OpenRouter: Guía de Uso Inmediato

Ashley Innocent

Ashley Innocent

31 March 2026

Qwen 3.6 en OpenRouter: Guía de Uso Inmediato

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

En resumen

Qwen 3.6 Plus Preview se lanzó el 30 de marzo de 2026, con una ventana de contexto de 1 millón de tokens, razonamiento de cadena de pensamiento obligatorio y soporte para el uso de herramientas. Ahora mismo es completamente gratis en OpenRouter. Utilice el ID del modelo qwen/qwen3.6-plus-preview:free con cualquier cliente compatible con OpenAI para empezar a enviar solicitudes hoy mismo.

El modelo que apareció discretamente

Alibaba Cloud lanzó Qwen 3.6 Plus Preview el 30 de marzo de 2026. Sin un anuncio rimbombante. Sin lista de espera. Simplemente un nuevo modelo disponible en OpenRouter a 0 $ por millón de tokens.

Captura de pantalla de la página de Qwen 3.6 Plus Preview en OpenRouter, mostrando su precio de 0 $/millón de tokens.

En sus primeros dos días, procesó más de 400 millones de tokens de finalización en aproximadamente 400.000 solicitudes. Los desarrolladores lo encontraron rápido.

Este artículo le guiará a través de todo lo que necesita para empezar a funcionar: configuración de la cuenta, claves API, ejemplos de código funcionales en cURL, Python y Node.js, y consejos específicos sobre dónde este modelo rinde mejor.

💡
Si está construyendo sobre cualquier API de IA, también querrá una forma de probar y depurar esas solicitudes de forma fiable. Apidog lo maneja bien. Es gratis y funciona con cualquier API REST, incluido OpenRouter.
botón

Al final de esta guía, sabrá exactamente cómo llamar a Qwen 3.6 de forma gratuita, de qué es capaz y cuáles son sus limitaciones.

Qué añade Qwen 3.6 sobre la serie 3.5

El salto de 3.5 a 3.6 no es incremental. Tres cosas cambiaron de manera significativa.

1. La ventana de contexto creció a 1 millón de tokens

Qwen 3.5 tenía una ventana de contexto de 32K a 128K dependiendo de la variante. Qwen 3.6 soporta una entrada de 1 millón de tokens.

Para ponerlo en términos prácticos: 1 millón de tokens son aproximadamente 750.000 palabras. Esto es suficiente para alimentar al modelo con una base de código completa, un año de registros de Slack, una biblioteca completa de documentos legales o un gran corpus de investigación en una sola solicitud.

La mayoría de los modelos gratuitos alcanzan un máximo de 8K a 32K. Obtener 1M de tokens de forma gratuita es poco común.

2. El razonamiento está integrado, no es opcional

Qwen 3.6 utiliza tokens de razonamiento obligatorios. Antes de que el modelo produzca su respuesta final, genera una cadena de pensamiento interna. No necesita indicarle "piensa paso a paso" ni ninguna instrucción especial.

Este es el mismo patrón que DeepSeek R1 popularizó. La diferencia es que Qwen 3.6 lo aplica en tareas de codificación, front-end y resolución general de problemas, no solo en matemáticas.

3. El comportamiento de agente es más fiable

La llamada de herramientas en la serie 3.5 era inconsistente. Las funciones se llamaban con tipos de argumentos incorrectos, o el modelo alucinaba una llamada a función que no existía.

Qwen 3.6 aborda esto directamente. Según la propia descripción de Alibaba Cloud, "ofrece un razonamiento más sólido y un comportamiento de agente más fiable en comparación con la serie 3.5". En la práctica, esto significa menos llamadas de herramientas fallidas en flujos de trabajo de varios pasos.

El modelo está específicamente ajustado para tres tareas:

Cómo acceder a Qwen 3.6 de forma gratuita

Necesitas dos cosas: una cuenta de OpenRouter y una clave API. No se requiere tarjeta de crédito para los modelos gratuitos.

Paso 1: Crea tu cuenta de OpenRouter

Ve a openrouter.ai y regístrate con un correo electrónico o una cuenta de Google. Todo el proceso dura menos de dos minutos.

Los modelos gratuitos no requieren que añadas un método de pago. Obtienes acceso inmediatamente después de la verificación del correo electrónico.

Paso 2: Genera una clave API

  1. Haz clic en tu avatar de perfil en la esquina superior derecha
  2. Selecciona API Keys (Claves API) en el menú desplegable
  3. Haz clic en Create Key (Crear clave)
  4. Ponle un nombre (por ejemplo, qwen-test) y haz clic en Create (Crear)
  5. Copia la clave. Comienza con sk-or-v1-...
Captura de pantalla mostrando el proceso de generación de una clave API en OpenRouter.

Guarda esto en un lugar seguro. OpenRouter no te lo mostrará de nuevo.

Paso 3: Envía tu primera solicitud

El ID del modelo es qwen/qwen3.6-plus-preview:free.

OpenRouter utiliza el mismo formato de solicitud que la API de OpenAI, por lo que cualquier cliente compatible con OpenAI funciona sin modificaciones.

cURL:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer sk-or-v1-YOUR_KEY_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.6-plus-preview:free",
    "messages": [
      {
        "role": "user",
        "content": "Escribe una función de Python que analice un token JWT y devuelva la carga útil como un diccionario."
      }
    ]
  }'

Python (librería requests):

import requests

def call_qwen(prompt: str, api_key: str) -> str:
    response = requests.post(
        "https://openrouter.ai/api/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {api_key}",
            "Content-Type": "application/json",
        },
        json={
            "model": "qwen/qwen3.6-plus-preview:free",
            "messages": [{"role": "user", "content": prompt}],
        },
        timeout=60,
    )
    response.raise_for_status()
    return response.json()["choices"][0]["message"]["content"]

result = call_qwen(
    "Escribe una función de Python que analice un token JWT y devuelva la carga útil.",
    api_key="sk-or-v1-YOUR_KEY_HERE"
)
print(result)

Node.js (fetch):

async function callQwen(prompt, apiKey) {
  const response = await fetch("https://openrouter.ai/api/v1/chat/completions", {
    method: "POST",
    headers: {
      "Authorization": `Bearer ${apiKey}`,
      "Content-Type": "application/json",
    },
    body: JSON.stringify({
      model: "qwen/qwen3.6-plus-preview:free",
      messages: [{ role: "user", content: prompt }],
    }),
  });

  if (!response.ok) {
    throw new Error(`OpenRouter error: ${response.status} ${await response.text()}`);
  }

  const data = await response.json();
  return data.choices[0].message.content;
}

callQwen(
  "Escribe una función JavaScript que valide una dirección de correo electrónico.",
  "sk-or-v1-YOUR_KEY_HERE"
).then(console.log);

Python con el SDK de OpenAI:

Si ya utiliza el SDK de OpenAI para Python, puede apuntarlo a OpenRouter sin otros cambios:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=[
        {
            "role": "system",
            "content": "Eres un ingeniero backend senior. Escribe código limpio y listo para producción."
        },
        {
            "role": "user",
            "content": "Escribe una función de Python que reintente una solicitud HTTP fallida hasta 3 veces con retroceso exponencial."
        }
    ],
)

print(response.choices[0].message.content)

Uso de herramientas y flujos de trabajo de agente

El uso de herramientas es donde Qwen 3.6 destaca en el nivel gratuito. Aquí hay un ejemplo funcional:

from openai import OpenAI
import json

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

# Define las herramientas disponibles para el modelo
tools = [
    {
        "type": "function",
        "function": {
            "name": "search_api_docs",
            "description": "Busca en la documentación de la API un endpoint o parámetro específico",
            "parameters": {
                "type": "object",
                "properties": {
                    "query": {
                        "type": "string",
                        "description": "La consulta de búsqueda"
                    },
                    "version": {
                        "type": "string",
                        "enum": ["v1", "v2", "v3"],
                        "description": "Versión de la API a buscar"
                    }
                },
                "required": ["query"]
            }
        }
    },
    {
        "type": "function",
        "function": {
            "name": "run_api_test",
            "description": "Ejecuta una solicitud de prueba contra un endpoint de la API",
            "parameters": {
                "type": "object",
                "properties": {
                    "endpoint": {"type": "string"},
                    "method": {"type": "string", "enum": ["GET", "POST", "PUT", "DELETE"]},
                    "body": {"type": "object"}
                },
                "required": ["endpoint", "method"]
            }
        }
    }
]

messages = [
    {
        "role": "user",
        "content": "Encuentra la documentación para el endpoint /users y ejecuta una solicitud GET de prueba contra él."
    }
]

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=messages,
    tools=tools,
    tool_choice="auto",
)

message = response.choices[0].message

# Comprueba si el modelo quiere llamar a una herramienta
if message.tool_calls:
    for tool_call in message.tool_calls:
        print(f"Tool: {tool_call.function.name}")
        args = json.loads(tool_call.function.arguments)
        print(f"Arguments: {json.dumps(args, indent=2)}")
else:
    print(message.content)

El modelo generará una llamada de función estructurada en lugar de alucinar una respuesta de formato libre. Luego, usted ejecuta la función en su propio código y alimenta el resultado en el siguiente turno.

Así es como se construyen los flujos de trabajo de agente de varios pasos: el modelo llama a las herramientas, su código las ejecuta y usted repite el proceso hasta que la tarea esté terminada.

Uso de la ventana de contexto de 1 millón de tokens

Una ventana de contexto de 1 millón de tokens no es útil para preguntas sencillas. Está diseñada para tareas en las que necesita proporcionar al modelo una gran cantidad de contexto a la vez.

Aquí hay tres patrones donde esto realmente importa:

Revisión completa de la base de código

Alimente al modelo con toda su base de código (dentro del límite de tokens) y pídale que identifique problemas de seguridad, patrones inconsistentes o funciones indocumentadas.

import os
from pathlib import Path
from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="sk-or-v1-YOUR_KEY_HERE",
)

def load_codebase(directory: str, extensions: list[str]) -> str:
    """Carga todos los archivos fuente de un directorio en una sola cadena."""
    content_parts = []
    for path in Path(directory).rglob("*"):
        if path.suffix in extensions and path.is_file():
            try:
                text = path.read_text(encoding="utf-8", errors="ignore")
                content_parts.append(f"--- FILE: {path} ---\n{text}\n")
            except Exception:
                continue
    return "\n".join(content_parts)

codebase = load_codebase("./src", [".py", ".js", ".ts"])

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=[
        {
            "role": "user",
            "content": f"Revisa esta base de código e identifica:\n1. Vulnerabilidades de seguridad\n2. Funciones sin manejo de errores\n3. Convenciones de nomenclatura inconsistentes\n\nBase de código:\n{codebase}"
        }
    ],
)

print(response.choices[0].message.content)

Análisis de documentos grandes

Pase un documento legal largo, un informe financiero o un artículo de investigación y haga preguntas específicas al respecto.

with open("annual_report_2025.txt", "r") as f:
    document = f.read()

response = client.chat.completions.create(
    model="qwen/qwen3.6-plus-preview:free",
    messages=[
        {
            "role": "user",
            "content": f"Extrae todas las menciones de límites de tasa de API y cambios de precios de este documento:\n\n{document}"
        }
    ],
)

Conversación de múltiples turnos con historial completo

Mantenga todo el historial de la conversación en contexto sin truncamiento, útil para sesiones de depuración largas o entrevistas técnicas.

conversation = []

def chat(user_message: str) -> str:
    conversation.append({"role": "user", "content": user_message})
    
    response = client.chat.completions.create(
        model="qwen/qwen3.6-plus-preview:free",
        messages=conversation,
    )
    
    assistant_message = response.choices[0].message.content
    conversation.append({"role": "assistant", "content": assistant_message})
    return assistant_message

# Larga sesión de depuración de ida y vuelta
print(chat("Estoy recibiendo un error 401 de la API de GitHub. Aquí está mi código..."))
print(chat("Añadí el token pero ahora obtengo un 403. El token tiene ámbito de repositorio."))
print(chat("El repositorio es privado. ¿Qué ámbitos necesito realmente?"))

Probando solicitudes de API de OpenRouter con Apidog

Cuando estás construyendo sobre la API de OpenRouter, depurar las solicitudes fallidas se vuelve tedioso rápidamente. Estás haciendo solicitudes HTTP, revisando respuestas JSON e iterando en tus prompts. Hacer esto desde la línea de comandos o Postman es lento.

Captura de pantalla de Apidog mostrando la configuración y respuesta de una solicitud de API a OpenRouter.

Apidog merece la pena probarlo aquí. Es un cliente API gratuito que maneja la construcción de solicitudes, la inspección de respuestas y la automatización de pruebas en un solo lugar.

Para probar el endpoint de Qwen 3.6 en Apidog:

  1. Cree una nueva solicitud POST a https://openrouter.ai/api/v1/chat/completions
  2. Agregue su cabecera Authorization: Bearer sk-or-v1-...
  3. Establezca el cuerpo en JSON con sus campos model y messages
  4. Envíe la solicitud e inspeccione la respuesta

Puede guardar esto como una colección, cambiar entre IDs de modelo para comparar resultados y escribir pruebas automatizadas que verifiquen la estructura de la respuesta, aseguren que choices[0].message.content no esté vacío o afirmen que las llamadas a herramientas contienen el nombre de función esperado.

Si está construyendo una aplicación que llama a OpenRouter, escribir algunas pruebas de solicitud en Apidog al principio le ahorrará tiempo cuando el modelo se comporte de forma inesperada.

Límites del nivel gratuito que debe conocer antes de construir sobre esto

Qwen 3.6 es gratis ahora. Eso no durará indefinidamente, y hay limitaciones prácticas que deben ser planificadas.

Los límites de tasa son compartidos. Los modelos gratuitos en OpenRouter comparten capacidad entre todos los usuarios. Durante las horas pico (típicamente por la tarde en EE. UU.), verá una mayor latencia y errores ocasionales de límite de tasa. Incorpore lógica de reintento en cualquier código de producción.

import time
import requests
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry

session = requests.Session()
retry_strategy = Retry(
    total=3,
    backoff_factor=2,
    status_forcelist=[429, 500, 502, 503, 504],
)
adapter = HTTPAdapter(max_retries=retry_strategy)
session.mount("https://", adapter)

response = session.post(
    "https://openrouter.ai/api/v1/chat/completions",
    headers={"Authorization": "Bearer sk-or-v1-YOUR_KEY_HERE"},
    json={
        "model": "qwen/qwen3.6-plus-preview:free",
        "messages": [{"role": "user", "content": "Hola"}],
    },
    timeout=30,
)

Los datos son registrados. La página del modelo de OpenRouter indica que "el modelo recopila datos de solicitud y finalización que pueden usarse para mejorar el modelo". No envíe claves API, contraseñas o información de identificación personal a través de este endpoint.

Estado de vista previa. Esta es una versión preliminar. El comportamiento del modelo puede cambiar. Si lo está utilizando para inferencia en producción, fije sus pruebas de integración al ID de modelo actual y monitoree las regresiones.

Solo texto. Qwen 3.6 acepta entrada de texto y produce salida de texto. No hay imágenes, audio ni carga de archivos.

Casos de uso en el mundo real

Construcción de un agente de revisión de código. Un equipo que construía una herramienta interna de revisión de PR alimentó Qwen 3.6 con todas las diferencias de sus pull requests (a veces más de 10.000 líneas) y obtuvo comentarios detallados sobre errores lógicos, pruebas faltantes y problemas de seguridad. La ventana de 1M de tokens lo hizo posible sin necesidad de dividir el contenido.

Generación de componentes front-end. Un desarrollador individual que construía un panel de control SaaS utilizó Qwen 3.6 para generar componentes React a partir de especificaciones de diseño. El modelo produjo TypeScript limpio con tipos de propiedades adecuados y CSS responsivo sin necesidad de múltiples pasadas de corrección.

Resumen de documentación de API. Un equipo que migraba entre APIs de pago de terceros pasó la documentación completa para ambas APIs (cada una de alrededor de 100K tokens) en una sola solicitud y pidió una comparación lado a lado de los métodos de autenticación, formatos de webhook y límites de tasa. El modelo devolvió una tabla estructurada en menos de 30 segundos.

Regístrese en openrouter.ai, obtenga su clave y cambie a qwen/qwen3.6-plus-preview:free por cualquier modelo por el que esté pagando actualmente.

Preguntas frecuentes

¿Es Qwen 3.6 realmente de uso gratuito?

Sí. A partir de marzo de 2026, el modelo aparece a 0 $ por millón de tokens de entrada y 0 $ por millón de tokens de salida en OpenRouter. El estado gratuito puede cambiar cuando termine el período de vista previa, así que consulte la página de precios de OpenRouter antes de construir algo que dependa de que el costo se mantenga en cero.

¿Cuál es el límite de tasa para el nivel gratuito?

OpenRouter no publica límites de tasa exactos para los modelos de nivel gratuito. En la práctica, los modelos gratuitos comparten capacidad y están sujetos a estrangulamiento durante el alto tráfico. Comience con una solicitud a la vez y agregue lógica de reintento antes de aumentar la concurrencia.

¿Puedo usar Qwen 3.6 para proyectos comerciales?

Sí, OpenRouter permite el uso comercial. Revise la licencia del modelo Qwen de Alibaba Cloud para conocer cualquier restricción sobre el modelo subyacente en sí, especialmente si va a distribuir los resultados.

¿Por qué Qwen 3.6 tarda más en responder que otros modelos?

Los tokens de razonamiento obligatorios añaden latencia. Antes de generar una respuesta, el modelo procesa una cadena de pensamiento interna. Para indicaciones sencillas, esto puede añadir unos segundos. Para tareas de razonamiento complejas, la latencia adicional lo vale. Use streaming si quiere mostrar la salida parcial a medida que se genera.

¿Hay alguna forma de deshabilitar los tokens de razonamiento?

A partir de la vista previa actual, el razonamiento es obligatorio y no se puede desactivar. Si necesita respuestas más rápidas sin la cadena de pensamiento, pruebe una variante de modelo diferente cuando esté disponible, o use un modelo gratuito más pequeño como LLaMA 3.1 8B para tareas sensibles a la latencia.

¿Cómo afecta la ventana de contexto de 1M de tokens al costo?

En el nivel gratuito, no afecta. Paga 0 $ independientemente de cuántos tokens envíe. Tenga en cuenta que las solicitudes muy grandes tardan más en procesarse y pueden agotar el tiempo de espera en el nivel gratuito. Comience con un tiempo de espera de 30 a 60 segundos y auméntelo para solicitudes de más de 100K tokens.

botón

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs

Qwen 3.6 en OpenRouter: Guía de Uso Inmediato