Cómo usar GLM-5.2 con Claude Code, Cline y Cursor

GLM-5.2 es el modelo de codificación de pesos abiertos de Z.ai, y se integra con las tres herramientas de codificación que la mayoría de los desarrolladores ya usan: Claude Code, Cline y Cursor. La particularidad es que cada una se conecta de manera diferente. Claude Code utiliza el formato de API de Anthropic, mientras que Cline y Cursor requieren un punto final compatible con OpenAI. Esta guía explica las tres, de principio a fin, utilizando el Plan de Codificación GLM como base.

Si primero desea conocer los detalles del modelo, comience con nuestra descripción general de GLM-5.2 y la referencia de la API de GLM-5.2. Esta publicación es la guía de configuración.

botón

Lo que necesita antes de empezar

GLM-5.2 es un modelo de Mezcla de Expertos de aproximadamente 753B parámetros, que se ofrece con una ventana de contexto de 1M de tokens (1.048.576 tokens para ser exactos). Está diseñado principalmente para la codificación, con un fuerte razonamiento y uso de herramientas agentivas. El punto de referencia principal, según los resultados publicados de Z.ai, es Terminal-Bench 2.1 con 81.0, superando el 62.0 de GLM-5.1. VentureBeat lo describió como superior a GPT-5.5 en los puntos de referencia de codificación de largo alcance por aproximadamente un sexto del costo.

Para seguir esta guía, necesita:

Una cuenta de Z.ai y una clave API. Para Claude Code y las herramientas agentivas, querrá una clave del Plan de Codificación GLM en lugar de una clave de pago por uso sin procesar, ya que el punto final de codificación es el ámbito de esas claves.
Una de las tres herramientas instaladas: Claude Code, Cline (una extensión de VS Code) o Cursor.
El ID del modelo, que es glm-5.2 en todas partes excepto dentro de Claude Code, donde se utiliza la variante de contexto de 1M glm-5.2[1m].

Una nota rápida sobre el costo. La API estándar cuesta $1.40 por 1M de tokens de entrada y $4.40 por 1M de tokens de salida (confirmado por OpenRouter), con una entrada en caché de alrededor de $0.26 por 1M (atribuido a VentureBeat). El Plan de Codificación GLM es una suscripción separada con niveles Lite, Pro, Max y Team. Los precios de los niveles públicos han variado, así que trate cualquier número que vea como aproximado (a partir de junio de 2026, verifique los precios actuales en z.ai antes de comprometerse).

Configurar GLM-5.2 en Claude Code

Claude Code se comunica con un punto final compatible con Anthropic, y Z.ai expone uno específicamente para herramientas de codificación. Usted apunta Claude Code a ese punto final con variables de entorno, y luego lo ejecuta normalmente.

Aquí está el bloque completo. Colóquelo en su perfil de shell (~/.zshrc o ~/.bashrc), o configúrelo en línea antes de iniciar.

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

Luego inicie Claude Code de la manera habitual:

claude

Algunas de esas variables merecen una explicación, porque omitirlas es donde la mayoría de las configuraciones fallan.

La URL base. https://api.z.ai/api/coding/paas/v4 es el punto final de codificación compatible con Anthropic. Algunas publicaciones antiguas muestran https://open.z.ai/api/paas/v4 en su lugar. Ambas han circulado, así que si las solicitudes devuelven 404 o la autenticación falla, pruebe con el otro host y verifique el valor actual en la documentación de GLM-5.2 de Z.ai (verifique en vivo).

El sufijo [1m]. Al establecer las variables del modelo Sonnet y Opus en glm-5.2[1m] se le indica a Claude Code que dirija cada nivel del modelo a la variante de contexto de 1M de GLM-5.2. Sin el sufijo, obtiene el contexto predeterminado; con él, obtiene el millón completo de tokens. Mapear Sonnet y Opus al mismo modelo significa que, independientemente del nivel al que Claude Code intente acceder, aterrizará en GLM-5.2.

CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000. Claude Code auto-compacta la conversación cuando se acerca al límite de contexto. La ventana predeterminada asume un presupuesto de contexto más pequeño. Aumentarla a 1.000.000 permite que Claude Code utilice la ventana completa de GLM-5.2 antes de comenzar a resumir, por lo que mantendrá más de su base de código en contexto.

API_TIMEOUT_MS=3000000. Este no es opcional para trabajos de contexto grande. Es un tiempo de espera de 3.000 segundos (50 minutos). Cuando se introduce una tarea agentiva de largo alcance en una ventana de 1M de tokens, el modelo puede pensar durante mucho tiempo antes de que llegue el primer token, especialmente con un esfuerzo de pensamiento máximo. El tiempo de espera predeterminado es mucho más corto, por lo que Claude Code interrumpe la solicitud a mitad de camino y usted ve un error de conexión confuso. Aumente el tiempo de espera y las llamadas largas se completarán.

Sobre el esfuerzo de pensamiento: GLM-5.2 tiene dos niveles, Alto y Máximo, y Z.ai recomienda Máximo para codificación. El punto final de codificación aplica un valor predeterminado sensato, pero si su herramienta le permite pasar reasoning_effort, configúrelo en max para las tareas más difíciles. El pensamiento también se puede desactivar por completo cuando desee finalizaciones rápidas y económicas.

Si proviene de un modelo anterior, la ruta de migración es la misma que cubrimos para GLM-5.1 en Claude Code y GLM-4.5 con Claude Code. Cambie el ID del modelo y la URL base, mantenga la estructura.

Configurar GLM-5.2 en Cline

Cline es una extensión de VS Code que ejecuta un agente de codificación autónomo dentro de su editor. A diferencia de Claude Code, Cline lee desde un punto final compatible con OpenAI, por lo que la configuración es diferente.

Instale la extensión Cline desde el marketplace de VS Code y abra su configuración (el icono de engranaje en el panel de Cline).
Para Proveedor de API, elija Compatible con OpenAI.
Establezca la URL base en https://api.z.ai/api/paas/v4/. Tenga en cuenta la barra diagonal final y que esta es la base general de la API, no la ruta de codificación.
Pegue su clave API de Z.ai en Clave API.
Para ID del modelo, ingrese glm-5.2 (sin el sufijo [1m] aquí, esa es una convención solo de Claude Code).
Encuentre la configuración de ventana de contexto y establézcala en 1000000. Cline usa esto para decidir cuándo truncar el historial, por lo que dejarlo en un valor predeterminado desperdicia la mayor parte de la ventana de GLM-5.2.

Esa es toda la configuración de GLM-5.2 Cline. Guarde, inicie una tarea y observe a Cline planificar, editar archivos y ejecutar comandos contra el modelo.

Una nota específica de Cline: debido a que Cline puede realizar muchas llamadas a herramientas por tarea, una ventana de contexto demasiado pequeña lo obliga a omitir pasos anteriores. Establecer la ventana en un millón completo mantiene el plan, las diferencias y la salida de la prueba dentro del alcance, que es exactamente donde el largo contexto de GLM-5.2 demuestra su valor.

Configurar GLM-5.2 en Cursor

Cursor es un editor independiente centrado en la IA. También utiliza el formato compatible con OpenAI, por lo que la configuración es muy similar a la de Cline.

Abra la configuración de Cursor, vaya a Modelos y desplácese hasta la sección de claves API de OpenAI.
Habilite la URL base personalizada (a veces etiquetada como "Anular URL base de OpenAI").
Establezca la URL base en https://api.z.ai/api/paas/v4/.
Ingrese su clave API de Z.ai.
Agregue un modelo personalizado con el ID glm-5.2, luego asegúrese de que sea el modelo activo.
Verifique la conexión con la prueba de clave API incorporada de Cursor, luego envíe una consulta.

Eso cubre GLM-5.2 Cursor. Una vez verificado, GLM-5.2 impulsa el chat y las ediciones en línea de Cursor.

Si ha utilizado Cursor con otras versiones de GLM anteriormente, las ventajas y desventajas que describimos en Claude Code vs Cursor con GLM-4.7 aún se aplican: la interfaz de usuario de Cursor es la más pulida para ediciones en línea rápidas, mientras que Claude Code y Cline se inclinan más hacia ejecuciones autónomas de agentes en varios pasos.

Configuración comparativa

Aquí están todos los valores en un solo lugar para que pueda copiar el correcto para cada herramienta.

Configuración	Claude Code	Cline	Cursor
Formato de API	Compatible con Anthropic	Compatible con OpenAI	Compatible con OpenAI
URL base	`https://api.z.ai/api/coding/paas/v4` (verificar en vivo)	`https://api.z.ai/api/paas/v4/`	`https://api.z.ai/api/paas/v4/`
ID del modelo	`glm-5.2[1m]`	`glm-5.2`	`glm-5.2`
Tipo de clave	Clave del Plan de Codificación GLM	Clave API	Clave API
Ventana de contexto	`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`	establecer en `1000000`	predeterminado del modelo
Tiempo de espera	`API_TIMEOUT_MS=3000000`	n/d	n/d
Esfuerzo de pensamiento	Máx. (recomendado para codificación)	vía predeterminado del proveedor	vía predeterminado del proveedor

Las dos cosas que más confunden a la gente: usar la URL base incorrecta para el tipo de herramienta, y olvidar el sufijo [1m] y el tiempo de espera en Claude Code.

Pruebe su configuración con una llamada API real

Antes de confiar en cualquier herramienta, confirme que la clave y el modelo funcionan con una solicitud sin procesar. Esta llamada llega directamente a la API general y aísla la configuración de la herramienta de los problemas de credenciales.

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Escribe una función en Python que invierta una lista enlazada."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "max",
    "stream": false
  }'

Si eso devuelve una finalización, su clave e ID de modelo son correctos, y cualquier problema restante es de configuración de la herramienta. Este también es un buen lugar para incluir un cliente API en el proceso. Si ya está probando GLM-5.2 junto con sus propios puntos finales de backend, Apidog le permite guardar la solicitud, administrar el encabezado ANTHROPIC_API_KEY o Authorization como una variable de entorno, y reproducirla sin volver a escribir el curl. Puede descargar Apidog e importar la solicitud directamente desde el curl anterior.

Qué herramienta debería usar

No hay un ganador único. Depende de cómo le guste trabajar.

Claude Code es la opción más adecuada para ejecuciones de agentes nativas de terminal y de largo alcance, y es la única de las tres que obtiene el contexto completo de 1M a través de glm-5.2[1m]. Ideal para refactorizaciones grandes y cambios en todo el repositorio.
Cline trae el agente dentro de VS Code sin salir de su editor, con clara visibilidad de cada llamada a herramienta. Un buen término medio.
Cursor es el más pulido para ediciones en línea rápidas y trabajos de estilo autocompletar, con la configuración más ligera.

Para una comparación de características más profunda entre planes, consulte Claude Code vs Codex vs Cursor vs MiniMax vs Plan GLM. Para saber cómo GLM-5.2 se compara con los modelos de vanguardia, consulte GLM-5.2 vs GPT-5.5, Claude Opus y Gemini y el desglose de los puntos de referencia. Y si está considerando la actualización, GLM-5.2 vs GLM-5.1 explica los cambios.

Preguntas Frecuentes

¿Por qué uso `glm-5.2[1m]` en Claude Code pero `glm-5.2` en Cline y Cursor?

El sufijo [1m] es una convención de Claude Code que selecciona la variante de contexto de 1M a través del punto final de codificación. Cline y Cursor pasan el ID de modelo simple glm-5.2 al punto final general compatible con OpenAI, donde la ventana de contexto se configura en la interfaz de usuario de la herramienta en lugar de en el ID.

¿Qué pasa si Claude Code se agota el tiempo en tareas largas?

Eso es casi siempre el tiempo de espera. Establezca API_TIMEOUT_MS=3000000 para que Claude Code espere lo suficiente para que finalicen las respuestas de gran contexto y esfuerzo Máximo. Sin él, la herramienta aborta la solicitud antes de que el modelo responda.

¿Necesito el Plan de Codificación GLM, o puedo usar el pago por uso?

Ambos funcionan, pero la clave del Plan de Codificación GLM es lo que el punto final de codificación espera para Claude Code, y los niveles mensuales fijos del plan (Lite, Pro, Max, Team) suelen ser más ventajosos que la facturación por token para una codificación diaria intensiva. Confirme los precios actuales de los niveles en z.ai, ya que las cifras publicadas han cambiado (verifique a partir de junio de 2026).

¿Cuál es la URL base correcta para Claude Code?

Use https://api.z.ai/api/coding/paas/v4. Algunas fuentes enumeran https://open.z.ai/api/paas/v4. Si una falla con errores de autenticación o 404, pruebe la otra y consulte la documentación de Z.ai en vivo. La base API general (https://api.z.ai/api/paas/v4/) es para Cline y Cursor, no para Claude Code.

¿Puede GLM-5.2 manejar imágenes?

No existe una variante de visión confirmada para GLM-5.2. Es un modelo de codificación y razonamiento de texto a texto. No espere un "GLM-5.2V" hasta que Z.ai lance uno.

Cierre

Tres herramientas, un modelo, dos formatos de punto final. Obtenga la URL base y el ID del modelo correctos para la herramienta que esté utilizando, recuerde el sufijo [1m] y el tiempo de espera para Claude Code, y configure la ventana de contexto a un millón completo en Cline. A partir de ahí, GLM-5.2 se comporta como cualquier otro backend de codificación, solo que con pesos abiertos y más barato de ejecutar. Si desea ejecutarlo sin ninguna herramienta, consulte cómo usar GLM-5.2 de forma gratuita y el desglose de precios de GLM-5.2. Obtenga los pesos de Hugging Face o extraiga el modelo con Ollama cuando desee una copia local.