Como Usar GLM-5.2 Com Claude Code, Cline e Cursor

Configurar GLM-5.2 em Claude Code, Cline e Cursor: URLs base exatas, IDs de modelo (glm-5.2[1m]), janela de contexto e configuração de tempo limite para o Plano de Codificação GLM.

Ashley Innocent

Ashley Innocent

17 junho 2026

Como Usar GLM-5.2 Com Claude Code, Cline e Cursor

Apidog para empresas

Implantação local

SSO & RBAC

Conforme SOC 2

Explorar Apidog Enterprise

O GLM-5.2 é o modelo de codificação de pesos abertos da Z.ai, e ele se integra às três ferramentas de codificação que a maioria dos desenvolvedores já usa: Claude Code, Cline e Cursor. O detalhe é que cada uma se conecta de forma diferente. O Claude Code utiliza o formato da API Anthropic, enquanto Cline e Cursor exigem um endpoint compatível com OpenAI. Este guia detalha as três, de ponta a ponta, usando o Plano de Codificação GLM como base.

Se você deseja apenas os fatos do modelo primeiro, comece com nossa visão geral do GLM-5.2 e a referência da API do GLM-5.2. Esta postagem é o guia de conexão.

botão

O que você precisa antes de começar

O GLM-5.2 é um modelo Mixture-of-Experts com cerca de 753 bilhões de parâmetros, servido com uma janela de contexto de 1 milhão de tokens (exatamente 1.048.576 tokens). Ele é focado em codificação, com forte raciocínio e uso de ferramentas agenticas. O benchmark principal, de acordo com os resultados publicados da Z.ai, é o Terminal-Bench 2.1 com 81,0, acima dos 62,0 do GLM-5.1. A VentureBeat o descreveu como superando o GPT-5.5 em benchmarks de codificação de longo prazo por aproximadamente um sexto do custo.

Para seguir este guia, você precisa:

Uma breve palavra sobre custos. A API padrão custa US$ 1,40 por 1M de tokens de entrada e US$ 4,40 por 1M de tokens de saída (confirmado pelo OpenRouter), com entrada em cache em torno de US$ 0,26 por 1M (atribuído à VentureBeat). O Plano de Codificação GLM é uma assinatura separada com os níveis Lite, Pro, Max e Team. Os preços dos níveis públicos mudaram, então trate qualquer número que você veja como aproximado (a partir de junho de 2026, verifique os preços atuais em z.ai antes de se comprometer).

Configurar o GLM-5.2 no Claude Code

O Claude Code se comunica com um endpoint compatível com Anthropic, e a Z.ai expõe um especificamente para ferramentas de codificação. Você aponta o Claude Code para esse endpoint com variáveis de ambiente e, em seguida, o executa normalmente.

Aqui está o bloco completo. Coloque-o no seu perfil de shell (~/.zshrc ou ~/.bashrc) ou defina-o inline antes de iniciar.

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="sua-chave-glm-coding-plan"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

Em seguida, inicie o Claude Code da maneira usual:

claude

Algumas dessas variáveis merecem uma explicação, porque ignorá-las é onde a maioria das configurações falha.

A URL base. https://api.z.ai/api/coding/paas/v4 é o endpoint de codificação compatível com Anthropic. Alguns artigos mais antigos mostram https://open.z.ai/api/paas/v4. Ambos circularam, então, se as solicitações retornarem 404 ou a autenticação falhar, tente o outro host e verifique o valor atual na documentação GLM-5.2 da Z.ai (verifique ao vivo).

O sufixo [1m]. Definir as variáveis de modelo Sonnet e Opus para glm-5.2[1m] instrui o Claude Code a rotear cada nível do modelo para a variante de contexto de 1M do GLM-5.2. Sem o sufixo, você obtém o contexto padrão; com ele, você obtém o milhão de tokens completos. Mapear Sonnet e Opus para o mesmo modelo significa que, qualquer que seja o nível que o Claude Code busque, você utilizará o GLM-5.2.

CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000. O Claude Code compacta automaticamente a conversa quando se aproxima do limite de contexto. A janela padrão assume um orçamento de contexto menor. Aumentá-la para 1.000.000 permite que o Claude Code use a janela completa do GLM-5.2 antes de começar a resumir, para que você mantenha mais do seu código-base em contexto.

API_TIMEOUT_MS=3000000. Este não é opcional para trabalhos com grandes contextos. São 3.000 segundos (50 minutos) de tempo limite. Ao alimentar uma tarefa agentica de longo prazo em uma janela de 1 milhão de tokens, o modelo pode pensar por muito tempo antes que o primeiro token chegue, especialmente com esforço de pensamento máximo. O tempo limite padrão é muito mais curto, então o Claude Code interrompe a solicitação no meio do caminho e você vê um erro de conexão confuso. Aumente o tempo limite e as chamadas longas serão concluídas.

Sobre o esforço de raciocínio: o GLM-5.2 possui dois níveis, Alto e Máximo, e a Z.ai recomenda Máximo para codificação. O endpoint de codificação aplica um padrão sensato, mas se sua ferramenta permitir que você passe reasoning_effort, defina-o como max para as tarefas mais difíceis. O raciocínio também pode ser desativado completamente quando você deseja conclusões rápidas e baratas.

Se você veio de um modelo anterior, o caminho de migração é o mesmo que abordamos para o GLM-5.1 no Claude Code e o GLM-4.5 com Claude Code. Troque o ID do modelo e a URL base, mantendo a estrutura.

Configurar o GLM-5.2 no Cline

O Cline é uma extensão do VS Code que executa um agente de codificação autônomo dentro do seu editor. Ao contrário do Claude Code, o Cline lê a partir de um endpoint compatível com OpenAI, então a configuração é diferente.

  1. Instale a extensão Cline do marketplace do VS Code e abra suas configurações (o ícone de engrenagem no painel Cline).
  2. Para Provedor de API, escolha Compatível com OpenAI.
  3. Defina URL Base para https://api.z.ai/api/paas/v4/. Observe a barra final e que esta é a base da API geral, não o caminho de codificação.
  4. Cole sua chave de API da Z.ai em Chave de API.
  5. Para ID do Modelo, insira glm-5.2 (sem o sufixo [1m] aqui, essa é uma convenção apenas do Claude Code).
  6. Encontre a configuração de janela de contexto e defina-a como 1000000. O Cline usa isso para decidir quando truncar o histórico, então deixá-lo com um valor padrão desperdiça a maior parte da janela do GLM-5.2.

Essa é toda a configuração do GLM-5.2 Cline. Salve, inicie uma tarefa e observe o Cline planejar, editar arquivos e executar comandos contra o modelo.

Uma observação específica do Cline: como o Cline pode disparar muitas chamadas de ferramenta por tarefa, uma janela de contexto subdimensionada o força a descartar etapas anteriores. Definir a janela para um milhão completo mantém o plano, as diferenças e a saída do teste dentro do escopo, que é exatamente onde o longo contexto do GLM-5.2 se destaca.

Configurar o GLM-5.2 no Cursor

O Cursor é um editor independente focado em IA. Ele também fala o formato compatível com OpenAI, então a configuração se assemelha muito ao Cline.

  1. Abra as configurações do Cursor, vá para Modelos e role até a seção de chave da API OpenAI.
  2. Ative a URL base personalizada (às vezes rotulada como "Substituir URL base da OpenAI").
  3. Defina a URL base para https://api.z.ai/api/paas/v4/.
  4. Insira sua chave de API da Z.ai.
  5. Adicione um modelo personalizado com o ID glm-5.2 e, em seguida, certifique-se de que ele seja o modelo ativo.
  6. Verifique a conexão com o teste de chave de API integrado do Cursor e, em seguida, envie um prompt.

Isso abrange o GLM-5.2 Cursor. Uma vez verificado, o GLM-5.2 alimenta o chat e as edições inline do Cursor.

Se você já usou o Cursor com outras versões do GLM, as compensações que descrevemos em Claude Code vs Cursor com GLM-4.7 ainda se aplicam: a interface do usuário do Cursor é a mais suave para edições inline, enquanto Claude Code e Cline se inclinam mais para execuções de agente autônomas e de várias etapas.

Configuração lado a lado

Aqui está cada valor em um só lugar para que você possa copiar o correto para cada ferramenta.

Configuração Claude Code Cline Cursor
Formato da API Compatível com Anthropic Compatível com OpenAI Compatível com OpenAI
URL Base https://api.z.ai/api/coding/paas/v4 (verifique ao vivo) https://api.z.ai/api/paas/v4/ https://api.z.ai/api/paas/v4/
ID do Modelo glm-5.2[1m] glm-5.2 glm-5.2
Tipo de chave Chave do Plano de Codificação GLM Chave de API Chave de API
Janela de Contexto CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 definido para 1000000 padrão do modelo
Tempo Limite API_TIMEOUT_MS=3000000 n/a n/a
Esforço de raciocínio Máximo (recomendado para codificação) via padrão do provedor via padrão do provedor

As duas coisas que mais confundem as pessoas: usar a URL base errada para o tipo de ferramenta e esquecer o sufixo [1m] e o tempo limite no Claude Code.

Teste sua configuração com uma chamada de API real

Antes de confiar em qualquer ferramenta, confirme se a chave e o modelo funcionam com uma requisição bruta. Esta chamada atinge a API geral diretamente e isola a configuração da ferramenta de problemas de credenciais.

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Escreva uma função em Python que inverta uma lista encadeada."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "max",
    "stream": false
  }'

Se isso retornar uma conclusão, sua chave e ID de modelo estão corretos, e qualquer problema restante é de configuração da ferramenta. Este também é um ponto útil para trazer um cliente de API para o processo. Se você já estiver testando o GLM-5.2 junto com seus próprios endpoints de backend, o Apidog permite salvar a solicitação, gerenciar o cabeçalho ANTHROPIC_API_KEY ou Authorization como uma variável de ambiente e reproduzi-la sem redigitar o curl. Você pode baixar o Apidog e importar a solicitação diretamente do curl acima.

Qual ferramenta você deve usar

Não há um único vencedor. Depende de como você gosta de trabalhar.

Para uma comparação mais aprofundada dos recursos entre os planos, consulte Claude Code vs Codex vs Cursor vs MiniMax vs GLM Plan. Para saber como o GLM-5.2 se compara à fronteira, verifique GLM-5.2 vs GPT-5.5, Claude Opus e Gemini e a análise de benchmarks autônoma. E se você estiver avaliando a atualização, GLM-5.2 vs GLM-5.1 detalha o que mudou.

FAQ

Por que eu uso glm-5.2[1m] no Claude Code, mas glm-5.2 no Cline e no Cursor?

O sufixo [1m] é uma convenção do Claude Code que seleciona a variante de contexto de 1M através do endpoint de codificação. Cline e Cursor passam o ID do modelo simples glm-5.2 para o endpoint geral compatível com OpenAI, onde a janela de contexto é definida na interface do usuário da ferramenta em vez de no ID.

E se o Claude Code exceder o tempo limite em tarefas longas?

Quase sempre é o tempo limite. Defina API_TIMEOUT_MS=3000000 para que o Claude Code espere tempo suficiente para que as respostas de grande contexto e esforço máximo sejam concluídas. Sem isso, a ferramenta aborta a solicitação antes que o modelo retorne.

Eu preciso do Plano de Codificação GLM ou posso usar o pagamento conforme o uso?

Ambos funcionam, mas a chave do Plano de Codificação GLM é o que o endpoint de codificação espera para o Claude Code, e os níveis mensais fixos do plano (Lite, Pro, Max, Team) geralmente superam a cobrança por token para codificação diária pesada. Confirme os preços dos níveis atuais em z.ai, pois os valores publicados mudaram (verifique a partir de junho de 2026).

Qual URL base está correta para o Claude Code?

Use https://api.z.ai/api/coding/paas/v4. Algumas fontes listam https://open.z.ai/api/paas/v4. Se um falhar com erros de autenticação ou 404, tente o outro e verifique a documentação Z.ai ao vivo. A base da API geral (https://api.z.ai/api/paas/v4/) é para Cline e Cursor, não para Claude Code.

O GLM-5.2 pode processar imagens?

Não há variante de visão confirmada para o GLM-5.2. É um modelo de codificação e raciocínio de texto-para-texto. Não espere um "GLM-5.2V" até que a Z.ai lance um.

Conclusão

Três ferramentas, um modelo, dois formatos de endpoint. Defina corretamente a URL base e o ID do modelo para a ferramenta em que você está, lembre-se do sufixo [1m] e do tempo limite para o Claude Code, e defina a janela de contexto para um milhão completo no Cline. A partir daí, o GLM-5.2 se comporta como qualquer outro backend de codificação, apenas com pesos abertos e mais barato de executar. Se você quiser executá-lo sem nenhuma ferramenta, veja como usar o GLM-5.2 gratuitamente e a análise de preços do GLM-5.2. Obtenha os pesos no Hugging Face ou puxe o modelo com Ollama quando quiser uma cópia local.

botão

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs