GLM-5.2 Claude Code, Cline, Cursor 연동 사용법

GLM-5.2는 Z.ai의 오픈 가중치 코딩 모델이며, 대부분의 개발자가 이미 사용하는 세 가지 코딩 하니스인 Claude Code, Cline, Cursor에 연결됩니다. 문제는 각각의 연결 방식이 다르다는 것입니다. Claude Code는 Anthropic API 형식을 사용하며, Cline과 Cursor는 OpenAI 호환 엔드포인트를 필요로 합니다. 이 가이드는 GLM 코딩 플랜을 기반으로 이 세 가지를 처음부터 끝까지 설명합니다.

모델에 대한 사실만 먼저 알고 싶다면, GLM-5.2 개요와 GLM-5.2 API 참조부터 시작하십시오. 이 게시물은 연결 가이드입니다.

버튼

시작하기 전에 필요한 것

GLM-5.2는 약 753B 매개변수의 Mixture-of-Experts 모델로, 1M 토큰 컨텍스트 창(정확히 1,048,576 토큰)과 함께 제공됩니다. 강력한 추론 및 에이전트 도구 사용 기능을 갖춘 코딩 우선 모델입니다. Z.ai의 발표된 결과에 따르면, 헤드라인 벤치마크는 Terminal-Bench 2.1에서 GLM-5.1의 62.0에서 상승한 81.0을 기록했습니다. VentureBeat는 GPT-5.5를 장기 코딩 벤치마크에서 약 6분의 1 비용으로 능가했다고 설명했습니다.

이 가이드를 따르려면 다음이 필요합니다:

Z.ai 계정 및 API 키. Claude Code와 에이전트 하니스에는 코딩 엔드포인트에 맞춰진 GLM 코딩 플랜 키가 필요하며, 일반 종량제 키는 아닙니다.
세 가지 하니스 중 하나가 설치되어 있어야 합니다: Claude Code, Cline (VS Code 확장), 또는 Cursor.
모델 ID는 Claude Code 내부에서 1M 컨텍스트 변형인 glm-5.2[1m]을 사용하는 경우를 제외하고는 모두 glm-5.2입니다.

비용에 대한 간략한 설명입니다. 표준 API는 1M 입력 토큰당 1.40달러, 1M 출력 토큰당 4.40달러이며(OpenRouter 확인), 캐시된 입력은 1M당 약 0.26달러입니다(VentureBeat에 기인). GLM 코딩 플랜은 Lite, Pro, Max, Team 계층이 있는 별도의 구독입니다. 공개 계층 가격은 변동될 수 있으므로, 어떤 숫자든 대략적인 것으로 간주하십시오 (2026년 6월 기준, 커밋하기 전에 z.ai에서 현재 가격을 확인하십시오).

Claude Code에서 GLM-5.2 설정

Claude Code는 Anthropic 호환 엔드포인트와 통신하며, Z.ai는 코딩 도구를 위해 특별히 엔드포인트를 노출합니다. 환경 변수를 사용하여 Claude Code를 해당 엔드포인트로 지정한 다음 평소처럼 실행합니다.

다음은 전체 블록입니다. 셸 프로필(~/.zshrc 또는 ~/.bashrc)에 넣거나 실행하기 전에 인라인으로 설정하십시오.

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

그런 다음 평소처럼 Claude Code를 시작합니다:

claude

이 변수들 중 일부는 설명을 들을 가치가 있습니다. 왜냐하면 이들을 생략하면 대부분의 설정이 실패하기 때문입니다.

기본 URL. https://api.z.ai/api/coding/paas/v4는 Anthropic 호환 코딩 엔드포인트입니다. 일부 이전 문서에는 https://open.z.ai/api/paas/v4로 표시되어 있습니다. 두 가지 모두 사용되었으므로, 요청이 404를 반환하거나 인증이 실패하면 다른 호스트를 시도하고 Z.ai GLM-5.2 문서에서 현재 값을 확인하십시오(실시간 확인 필요).

[1m] 접미사. Sonnet 및 Opus 모델 변수를 모두 glm-5.2[1m]으로 설정하면 Claude Code는 모든 모델 계층을 GLM-5.2의 1M-컨텍스트 변형으로 라우팅하도록 지시합니다. 접미사가 없으면 기본 컨텍스트를 얻고, 접미사가 있으면 전체 백만 토큰을 얻습니다. Sonnet과 Opus를 동일한 모델에 매핑하면 Claude Code가 어떤 계층에 도달하든 GLM-5.2에 연결됩니다.

CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000. Claude Code는 컨텍스트 한계에 가까워지면 대화를 자동으로 압축합니다. 기본 창은 더 작은 컨텍스트 예산을 가정합니다. 이를 1,000,000으로 늘리면 Claude Code는 요약을 시작하기 전에 GLM-5.2의 전체 창을 사용할 수 있으므로 코드베이스의 더 많은 부분을 컨텍스트 내에 유지할 수 있습니다.

API_TIMEOUT_MS=3000000. 이 변수는 대규모 컨텍스트 작업에서 선택 사항이 아닙니다. 이것은 3,000초(50분)의 시간 제한입니다. 1M 토큰 창에 장기 에이전트 작업을 공급할 때, 모델은 특히 최대 사고 노력(Max thinking effort)에서 첫 토큰이 도착하기 전에 오랫동안 생각할 수 있습니다. 기본 시간 제한은 훨씬 짧으므로 Claude Code는 요청을 중간에 중단하고 혼란스러운 연결 오류를 표시합니다. 시간 제한을 늘리면 긴 호출이 완료됩니다.

사고 노력(thinking effort)에 대해: GLM-5.2에는 High와 Max의 두 가지 수준이 있으며, Z.ai는 코딩에 Max를 권장합니다. 코딩 엔드포인트는 합리적인 기본값을 적용하지만, 하니스가 reasoning_effort를 전달하도록 허용하는 경우 가장 어려운 작업에 대해 max로 설정하십시오. 빠르고 저렴한 완성을 원할 때는 사고를 완전히 비활성화할 수도 있습니다.

이전 모델에서 전환하신 경우, 마이그레이션 경로는 Claude Code의 GLM-5.1과 Claude Code의 GLM-4.5에서 다루었던 것과 동일합니다. 모델 ID와 기본 URL을 교체하고 구조를 유지하십시오.

Cline에서 GLM-5.2 설정

Cline은 편집기 내에서 자율 코딩 에이전트를 실행하는 VS Code 확장 프로그램입니다. Claude Code와 달리 Cline은 OpenAI 호환 엔드포인트를 읽으므로 연결 방식이 다릅니다.

VS Code 마켓플레이스에서 Cline 확장을 설치하고 설정(Cline 패널의 톱니바퀴 아이콘)을 엽니다.
API 공급자(API Provider)로 OpenAI 호환(OpenAI Compatible)을 선택합니다.
기본 URL(Base URL)을 https://api.z.ai/api/paas/v4/로 설정합니다. 후행 슬래시와 이 URL이 일반 API 기본 URL이며 코딩 경로가 아님에 유의하십시오.
Z.ai API 키를 API 키(API Key)에 붙여넣습니다.
모델 ID(Model ID)에 glm-5.2를 입력합니다 (여기에는 [1m] 접미사가 없습니다. 이는 Claude Code 전용 규칙입니다).
컨텍스트 창(context window) 설정을 찾아 1000000으로 설정합니다. Cline은 기록을 자를 시기를 결정하는 데 이를 사용하므로, 기본값을 그대로 두면 GLM-5.2 창의 대부분이 낭비됩니다.

이것이 GLM-5.2 Cline 설정의 전부입니다. 저장하고, 작업을 시작한 다음, Cline이 모델에 대해 계획하고, 파일을 편집하고, 명령을 실행하는 것을 지켜보십시오.

Cline 특정 참고 사항: Cline은 작업당 여러 도구 호출을 실행할 수 있으므로, 작은 컨텍스트 창은 이전 단계를 삭제하도록 강제합니다. 창을 전체 백만으로 설정하면 계획, 차이점, 테스트 출력이 모두 범위 내에 유지되며, 이는 GLM-5.2의 긴 컨텍스트가 그 가치를 발휘하는 지점입니다.

Cursor에서 GLM-5.2 설정

Cursor는 독립형 AI 우선 편집기입니다. 이 또한 OpenAI 호환 형식을 사용하므로 구성이 Cline과 매우 유사합니다.

Cursor 설정을 열고, 모델(Models)로 이동하여 OpenAI API 키 섹션으로 스크롤합니다.
사용자 지정 기본 URL(custom base URL)(때로는 "OpenAI 기본 URL 재정의"로 표시됨)을 활성화합니다.
기본 URL을 https://api.z.ai/api/paas/v4/로 설정합니다.
Z.ai API 키를 입력합니다.
ID가 glm-5.2인 사용자 지정 모델을 추가한 다음, 활성 모델로 설정되었는지 확인합니다.
Cursor의 내장 API 키 테스트로 연결을 확인한 다음 프롬프트를 보냅니다.

이것으로 GLM-5.2 Cursor가 완료됩니다. 확인되면 GLM-5.2가 Cursor의 채팅 및 인라인 편집 기능을 지원합니다.

이전에 다른 GLM 버전과 함께 Cursor를 사용했던 경우, Claude Code 대 GLM-4.7을 사용한 Cursor에서 다루었던 장단점은 여전히 적용됩니다: Cursor의 UI는 인라인 편집에 가장 부드럽고, Claude Code와 Cline은 자율적이고 다단계 에이전트 실행에 더 중점을 둡니다.

측면별 구성

다음은 각 하니스에 맞는 값을 복사할 수 있도록 모든 값을 한곳에 모아둔 것입니다.

설정	Claude Code	Cline	Cursor
API 형식	Anthropic 호환	OpenAI 호환	OpenAI 호환
기본 URL	`https://api.z.ai/api/coding/paas/v4` (실시간 확인)	`https://api.z.ai/api/paas/v4/`	`https://api.z.ai/api/paas/v4/`
모델 ID	`glm-5.2[1m]`	`glm-5.2`	`glm-5.2`
키 유형	GLM 코딩 플랜 키	API 키	API 키
컨텍스트 창	`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`	`1000000`으로 설정	모델 기본값
시간 초과	`API_TIMEOUT_MS=3000000`	해당 없음	해당 없음
사고 노력	Max (코딩에 권장)	공급자 기본값 통해	공급자 기본값 통해

사람들이 가장 많이 실수하는 두 가지는 하니스 유형에 잘못된 기본 URL을 사용하는 것과 Claude Code에서 [1m] 접미사와 시간 초과를 잊어버리는 것입니다.

실제 API 호출로 설정 테스트

어떤 하니스를 신뢰하기 전에, 원시 요청으로 키와 모델이 작동하는지 확인하십시오. 이 호출은 일반 API에 직접 연결되며, 하니스 구성과 자격 증명 문제를 분리합니다.

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Write a Python function that reverses a linked list."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "max",
    "stream": false
  }'

이것이 완성을 반환하면 키와 모델 ID는 올바르며, 나머지 문제는 하니스 측 구성에 있습니다. 또한 API 클라이언트를 루프에 통합하기 좋은 지점입니다. GLM-5.2를 자체 백엔드 엔드포인트와 함께 이미 테스트하고 있다면, Apidog를 사용하면 요청을 저장하고, ANTHROPIC_API_KEY 또는 Authorization 헤더를 환경 변수로 관리하며, curl을 다시 입력하지 않고 재생할 수 있습니다. Apidog를 다운로드하여 위의 curl에서 직접 요청을 가져올 수 있습니다.

어떤 하니스를 사용해야 할까요?

단 하나의 정답은 없습니다. 작업 방식에 따라 다릅니다.

Claude Code는 터미널 기반의 장기 에이전트 실행에 가장 적합하며, glm-5.2[1m]을 통해 전체 1M 컨텍스트를 얻는 세 가지 중 유일한 것입니다. 대규모 리팩토링 및 리포지토리 전체 변경에 가장 좋습니다.
Cline은 편집기를 떠나지 않고 VS Code 내부에 에이전트를 가져오며, 모든 도구 호출을 명확하게 볼 수 있습니다. 좋은 중간 지점입니다.
Cursor는 가장 가벼운 구성으로 빠른 인라인 편집 및 자동 완성 스타일 작업에 가장 세련되었습니다.

플랜 간의 더 심층적인 기능 비교는 Claude Code 대 Codex 대 Cursor 대 MiniMax 대 GLM 플랜을 참조하십시오. GLM-5.2가 최첨단과 어떻게 비교되는지 알아보려면 GLM-5.2 대 GPT-5.5, Claude Opus, Gemini 및 독립적인 벤치마크 분석을 확인하십시오. 그리고 업그레이드를 고려 중이라면 GLM-5.2 대 GLM-5.1에서 변경 사항을 설명합니다.

FAQ

Claude Code에서는 `glm-5.2[1m]`을 사용하고 Cline과 Cursor에서는 `glm-5.2`를 사용하는 이유는 무엇입니까?

[1m] 접미사는 코딩 엔드포인트를 통해 1M 컨텍스트 변형을 선택하는 Claude Code 규칙입니다. Cline과 Cursor는 일반 OpenAI 호환 엔드포인트에 일반 모델 ID glm-5.2를 전달하며, 이 경우 컨텍스트 창은 ID 대신 하니스 UI에서 설정됩니다.

Claude Code가 긴 작업에서 시간 초과되면 어떻게 됩니까?

거의 항상 시간 초과 문제입니다. API_TIMEOUT_MS=3000000으로 설정하여 Claude Code가 대규모 컨텍스트, 최대 노력 응답이 완료될 때까지 충분히 기다리도록 하십시오. 이 설정이 없으면 모델이 반환하기 전에 하니스가 요청을 중단합니다.

GLM 코딩 플랜이 필요합니까, 아니면 종량제를 사용할 수 있습니까?

둘 다 작동하지만, GLM 코딩 플랜 키는 코딩 엔드포인트가 Claude Code에 대해 예상하는 것이며, 플랜의 고정 월별 계층(Lite, Pro, Max, Team)은 일반적으로 많은 일일 코딩에 대해 토큰당 요금보다 유리합니다. 게시된 수치가 변경되었으므로 z.ai에서 현재 계층 가격을 확인하십시오 (2026년 6월 현재 확인).

Claude Code에 올바른 기본 URL은 무엇입니까?

https://api.z.ai/api/coding/paas/v4를 사용하십시오. 일부 출처에서는 https://open.z.ai/api/paas/v4를 나열합니다. 하나가 인증 또는 404 오류로 실패하면 다른 것을 시도하고 실시간 Z.ai 문서를 확인하십시오. 일반 API 기본 URL(https://api.z.ai/api/paas/v4/)은 Cline 및 Cursor용이며, Claude Code용이 아닙니다.

GLM-5.2는 이미지를 처리할 수 있습니까?

GLM-5.2에 대해 확인된 비전 변형은 존재하지 않습니다. 이것은 텍스트 입력, 텍스트 출력 코딩 및 추론 모델입니다. Z.ai가 비전 변형을 출시하기 전까지는 "GLM-5.2V"를 기대하지 마십시오.

마무리

세 가지 하니스, 하나의 모델, 두 가지 엔드포인트 형식. 사용하는 하니스에 맞는 기본 URL과 모델 ID를 올바르게 설정하고, Claude Code의 [1m] 접미사와 시간 초과를 기억하며, Cline에서 컨텍스트 창을 전체 백만으로 설정하십시오. 그렇게 하면 GLM-5.2는 다른 코딩 백엔드와 마찬가지로 작동하며, 단지 오픈 가중치이고 실행 비용이 더 저렴합니다. 하니스 없이 실행하고 싶다면 GLM-5.2를 무료로 사용하는 방법과 GLM-5.2 가격 분석을 참조하십시오. 로컬 복사본을 원할 경우 Hugging Face에서 가중치를 가져오거나 Ollama로 모델을 가져오십시오.

버튼