Cómo ejecutar Qwen3.5 gratis con OpenClaw usando Ollama

Ashley Innocent

Ashley Innocent

25 February 2026

Cómo ejecutar Qwen3.5 gratis con OpenClaw usando Ollama

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

Te enfrentas a altas facturas en la nube cuando ejecutas potentes agentes de IA todos los días. Qwen3.5 te ofrece razonamiento multimodal de nivel fronterizo localmente. Lo combinas con OpenClaw para flujos de trabajo de agentes persistentes y Ollama para un servicio local sencillo. El resultado es un agente de IA completo que funciona 24/7 en tu máquina sin suscripciones.

💡
Descarga Apidog gratis para seguir los pasos. Puedes probar el endpoint compatible con OpenAI de Ollama y la puerta de enlace de OpenClaw directamente dentro de Apidog. Las solicitudes visuales, las aserciones instantáneas y los escenarios de prueba guardados facilitan la verificación de cada cambio de configuración.
botón

Las pequeñas elecciones importan. Eliges la etiqueta de modelo correcta. Configuras la URL base correcta. Estas decisiones crean grandes diferencias en velocidad y fiabilidad. Esta guía te muestra los pasos exactos para que termines con una pila lista para producción que controlas por completo.

Qué Hace a Qwen3.5 Perfecto para el Trabajo de Agente Local

Alibaba lanzó Qwen3.5 a principios de 2026 como su primera familia de modelos de visión-lenguaje nativos. El buque insignia 397B-A17B utiliza una arquitectura híbrida. Combina Gated Delta Networks con una mezcla dispersa de expertos (Mixture-of-Experts). Solo se activan 17 mil millones de parámetros por token. Obtienes un rendimiento sólido con mucha menos memoria.

Comparativa de Qwen3.5

Ollama aloja estas etiquetas prácticas que puedes descargar hoy:

Ejecutas qwen3.5 localmente y mantienes tus datos privados. El modelo obtiene una puntuación de 86.7 en TAU2-Bench y 85.0 en MMMU. Por lo tanto, puedes confiar en él para tareas de agente que mezclan texto, capturas de pantalla y llamadas a herramientas.

Cómo OpenClaw Convierte a Qwen3.5 en un Agente Real

OpenClaw funciona como tu tiempo de ejecución de agente siempre activo. Lo conectas a WhatsApp, Telegram, Slack, Discord o Signal una vez. El agente escucha continuamente. Cuando envías un mensaje, OpenClaw lo dirige a qwen3.5, llama a herramientas, controla tu navegador con Playwright, edita archivos, actualiza calendarios y responde de forma proactiva.

Almacenas memoria entre sesiones. El agente recuerda tus proyectos y preferencias para siempre. Instalas habilidades de la comunidad o dejas que qwen3.5 escriba nuevas bajo demanda. OpenClaw se convierte así en tu asistente digital personal que nunca duerme.

Por Qué Ollama Simplifica la Integración

Ollama sirve modelos localmente y expone un endpoint compatible con OpenAI en el puerto 11434. Apuntas OpenClaw a http://localhost:11434/v1 y configuras el modelo en qwen3.5:35b. Ollama maneja la cuantificación, la descarga de GPU y la gestión del contexto automáticamente.

Logras una rápida generación de tokens en hardware de consumo. Mantienes la ventana de contexto completa de 256K que qwen3.5 necesita para conversaciones de agente largas. Evitas los costos de la nube y las fugas de datos al mismo tiempo.

Requisitos Previos que Debes Cumplir

Prepara tu máquina antes de empezar. Usa macOS 14 o posterior, Ubuntu 22.04/24.04, o Windows 11 con WSL2. Necesitas al menos 24 GB de VRAM para el modelo 35B o 32 GB de memoria unificada en Apple Silicon. Mantén 30 GB de espacio libre en disco. Instala Node.js 22 o superior y Ollama 0.17 o más reciente.

Verificarás tu GPU más tarde con un solo comando. El hardware que cumple estos requisitos te proporciona un rendimiento receptivo. Puedes recurrir a modelos cuantificados más pequeños si tienes menos memoria.

Instalar Ollama y Descargar Qwen3.5

Empiezas instalando Ollama. En macOS ejecutas:

brew install ollama
brew services start ollama

En Linux ejecutas:

curl -fsSL https://ollama.com/install.sh | sh
systemctl enable --now ollama

Confirmas que el servicio se ejecuta con ollama list. Luego descargas el modelo:

ollama pull qwen3.5:35b

La descarga finaliza en 10 a 30 minutos. Pruebas la inferencia básica:

ollama run qwen3.5:35b

Escribes un prompt dentro del REPL. Qwen3.5 responde con precisión. Sales con /bye.

Verificas inmediatamente el endpoint compatible con OpenAI porque OpenClaw lo necesita:

curl http://localhost:11434/v1/models

La respuesta lista qwen3.5:35b. Sabes que el puente funciona.

Iniciar OpenClaw con Qwen3.5

Usas un comando de Ollama para instalar e iniciar todo:

ollama launch openclaw --model qwen3.5:35b

Ollama instala los componentes que faltan, inicia la puerta de enlace y abre el asistente TUI. Conectas tus canales de mensajería, confirmas el proveedor del modelo y guardas la configuración. La puerta de enlace se ejecuta en el puerto 8080.

Pruebas enviando un mensaje a tu bot en Telegram: “Listar archivos en mi carpeta de Descargas.” OpenClaw usa qwen3.5 y devuelve el resultado.

También puedes configurar manualmente. Editas ~/.openclaw/openclaw.json y configuras la URL base del proveedor de Ollama. Reinicias con openclaw start. Ambos métodos dan resultados idénticos.

Probar la Pila Completa con Apidog

Abres Apidog y creas un nuevo proyecto llamado “Qwen3.5 OpenClaw Local Stack”. Configuras la URL base a http://localhost:11434/v1.

Probando la integración en Apidog

Añades una solicitud POST a /chat/completions. Incluyes estos encabezados:

Usas este cuerpo:

{
  "model": "qwen3.5:35b",
  "messages": [
    {"role": "system", "content": "You are a helpful agent."},
    {"role": "user", "content": "Plan steps to organize my Downloads folder by file type."}
  ],
  "temperature": 0.7,
  "max_tokens": 2048
}

Envías la solicitud. Apidog muestra los tokens en streaming en tiempo real. Añades una aserción visual para el código de estado 200. Guardas la solicitud como un escenario de prueba. Ejecutas el escenario de nuevo después de cambiar la configuración. Así detectas los problemas inmediatamente.

Creas una segunda colección para la puerta de enlace de OpenClaw en http://localhost:8080/v1. Pruebas el enrutamiento de mensajes de extremo a extremo. La validación de esquemas de Apidog confirma que los formatos de llamada a herramientas coinciden con lo que OpenClaw espera.

Diseña y Documenta Tus Endpoints en Apidog

Usas el diseñador visual de Apidog para modelar el esquema de finalización de chat. Importas la especificación oficial de OpenAI. La personalizas para los parámetros de qwen3.5. Generas documentación interactiva automáticamente. Compartes la documentación con tus compañeros de equipo a través de los espacios de trabajo de Apidog si trabajáis juntos.

También creas respuestas simuladas dentro de Apidog. Simulas llamadas a herramientas antes de finalizar la configuración completa de OpenClaw. Así desarrollas más rápido y pruebas casos extremos de forma segura.

Configuración Avanzada para un Mejor Rendimiento

Creas un Modelfile personalizado cuando necesitas una cuantificación más ligera:

FROM qwen3.5:35b
PARAMETER num_gpu 999
PARAMETER num_ctx 131072

Lo construyes con ollama create qwen3.5:35b-q4 -f Modelfile. Actualizas tu configuración de OpenClaw para usar la nueva etiqueta.

Habilitas la visión enviando imágenes base64 en los mensajes de chat. Qwen3.5 procesa las capturas de pantalla que OpenClaw captura durante las tareas del navegador. Por lo tanto, automatizas formularios que requieren comprensión visual.

Instalas habilidades adicionales:

openclaw skill install @community/calendar
openclaw skill install @community/github

Cada habilidad registra esquemas JSON. Qwen3.5 aprende a llamarlos automáticamente. Supervisas el uso dentro del panel de control de OpenClaw.

Flujos de Trabajo del Mundo Real que Ejecutas Hoy

Usas la pila para revisiones de código. Envías un mensaje a OpenClaw: “Revisa el PR en mi repositorio y sugiere refactorizaciones.” El agente clona el repositorio, analiza el código y crea un parche.

Automatizas tareas personales. Escribes: “Verifica mi bandeja de entrada para confirmaciones de vuelos y añádelas al calendario.” OpenClaw analiza los correos electrónicos y actualiza tu calendario.

Creas asistentes de investigación. Envías una captura de pantalla de un PDF y pides un resumen más preguntas de seguimiento. Qwen3.5 extrae el texto con precisión. OpenClaw mantiene el contexto durante días.

Ejecutas múltiples agentes. Lanzas espacios de trabajo de OpenClaw separados. Uno usa qwen3.5:35b para trabajo general. Otro usa un modelo de codificador especializado. La puerta de enlace enruta los mensajes correctamente.

Optimizar la Velocidad y el Uso de la Memoria

Configuras OLLAMA_NUM_GPU=999 para usar todas las capas de GPU. Monitoreas con nvidia-smi. En Apple Silicon habilitas la atención flash.

Reduces la hinchazón del contexto con prompts de resumen periódicos que qwen3.5 ejecuta automáticamente. Comparas las tasas de tokens por segundo. El modelo 35B alcanza 45-60 tokens por segundo en una GPU de clase 4090. Eliges la variante que se ajuste a tu hardware.

Usas las pruebas de rendimiento de Apidog para medir la latencia en 100 solicitudes. Ajustas la temperatura y max_tokens hasta alcanzar tu tiempo de respuesta objetivo.

Resuelve Problemas Comunes Rápidamente

Ves “modelo no encontrado.” Ejecutas ollama list y corriges la etiqueta en tu configuración.

Experimentas alta latencia. Revisas los logs con journalctl -u ollama y aumentas las capas de GPU. Usas Apidog para volver a probar la misma solicitud y confirmar la mejora.

El análisis de la llamada a la herramienta falla. Bloqueas la temperatura en 0.7 dentro de los escenarios de prueba de Apidog y vuelves a ejecutar.

OpenClaw pierde la conexión a una aplicación de mensajería. Ejecutas openclaw configure --section channels para refrescar los tokens.

Alcanzas los límites de tasa en Ollama. Aumentas la configuración de concurrencia y pruebas de nuevo en Apidog.

Usas el panel de inspección de errores de Apidog para cada problema. El rastreo visual de la pila y la comparación de respuestas aceleran drásticamente las correcciones.

Mantén Tu Configuración Segura

Ejecutas OpenClaw bajo una cuenta de usuario dedicada. Habilitas el sandboxing para la ejecución de herramientas. Nunca expones los puertos 11434 u 8080 públicamente. Los accedes a través de túneles SSH o Tailscale cuando viajas.

Revisas cada fuente de habilidad antes de instalarla. Activas el cifrado de memoria en la configuración de OpenClaw. Haces copias de seguridad de la carpeta ~/.openclaw regularmente.

Por lo tanto, operas un sistema más seguro que la mayoría de los servicios en la nube porque tus datos nunca abandonan tu red.

Planificar Futuras Actualizaciones

Alibaba lanza variantes más pequeñas de Qwen3.5 regularmente. Ollama las añade rápidamente. Descargas las actualizaciones con ollama pull qwen3.5:35b --force.

La biblioteca de habilidades de OpenClaw crece cada semana. Revisas las notificaciones de GitHub para mantenerte al día.

Repites el proceso de prueba de Apidog después de cada actualización. Mantienes tu colección de pruebas y simplemente cambias la etiqueta del modelo. Así mantienes la fiabilidad sin trabajo extra.

Conclusión

Ahora ejecutas qwen3.5 con OpenClaw gratis usando Ollama. Controlas toda la pila en tu hardware. Obtienes un razonamiento potente, soporte de visión, memoria persistente y automatización proactiva.

Seguiste pasos claros. Probaste cada capa con Apidog. Optimizaste el rendimiento y aseguraste el entorno. Pequeñas elecciones de configuración produjeron un agente de IA personal capaz.

Abre tu terminal ahora. Ejecuta el comando de inicio. Conecta tus aplicaciones de mensajería. Envía tu primera tarea. Verás lo potente que se siente un agente completamente local.

Descarga Apidog para seguir las futuras actualizaciones y seguir probando tus endpoints de forma eficiente. Ya tienes todo lo que necesitas para construir flujos de trabajo más inteligentes hoy mismo.

botón
Especificación de diseño de API de Apidog

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs