GLM-5.2はZ.aiのオープンウェイトのコーディングモデルで、ほとんどの開発者がすでに使用している3つのコーディングハーネス、Claude Code、Cline、Cursorに接続できます。ただし、それぞれ接続方法が異なります。Claude CodeはAnthropic API形式を使い、ClineとCursorはOpenAI互換のエンドポイントを必要とします。このガイドでは、GLMコーディングプランを基盤として、これら3つすべてを最初から最後まで説明します。
まずモデルの事実だけを知りたい場合は、当社のGLM-5.2概要とGLM-5.2 APIリファレンスから始めてください。この記事は接続ガイドです。
ボタン
始める前に必要なもの
GLM-5.2は、約7530億のパラメータを持つMixture-of-Expertsモデルで、100万トークンのコンテキストウィンドウ(正確には1,048,576トークン)で提供されます。コーディングを第一に考えられており、強力な推論とエージェント的なツール使用が可能です。Z.aiが公開した結果によると、主要ベンチマークであるTerminal-Bench 2.1では81.0を記録し、GLM-5.1の62.0から向上しています。VentureBeatは、長期間のコーディングベンチマークにおいて、GPT-5.5を約6分の1のコストで上回ると評しました。

このガイドに従うには、以下が必要です。
- Z.aiアカウントとAPIキー。Claude Codeやエージェントハーネスの場合、コーディングエンドポイントがこれらのキーの対象となるため、通常の従量課金キーではなくGLMコーディングプランキーが必要になります。
- 3つのハーネスのいずれかがインストールされていること:Claude Code、Cline(VS Code拡張機能)、またはCursor。
- モデルIDは
glm-5.2ですが、Claude Code内では1Mコンテキストバリアントのglm-5.2[1m]を使用します。
コストについて簡単に説明します。標準APIは、入力トークン100万あたり1.40ドル、出力トークン100万あたり4.40ドル(OpenRouterで確認)、キャッシュされた入力は100万あたり約0.26ドル(VentureBeatによる)です。GLMコーディングプランは、Lite、Pro、Max、Teamの各ティアがある個別のサブスクリプションです。公開されているティア価格は変動しているため、表示されている数値は概算として扱ってください(2026年6月現在、契約前にz.aiで現在の価格を確認してください)。
Claude CodeでGLM-5.2をセットアップする
Claude CodeはAnthropic互換のエンドポイントと通信し、Z.aiはコーディングツール専用のエンドポイントを公開しています。環境変数を使用してClaude Codeをそのエンドポイントに指定し、通常通り実行します。

これが完全なブロックです。シェルプロファイル(~/.zshrcまたは~/.bashrc)に記述するか、起動前にインラインで設定してください。
export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000
その後、通常の方法でClaude Codeを起動します。
claude
これらの変数のいくつかは説明が必要です。なぜなら、それらをスキップするとほとんどのセットアップが機能しなくなるからです。
ベースURL。 https://api.z.ai/api/coding/paas/v4はAnthropic互換のコーディングエンドポイントです。古い記述の中には、代わりにhttps://open.z.ai/api/paas/v4と示されているものもあります。両方流通しているため、リクエストが404エラーになるか認証が失敗する場合は、もう一方のホストを試すか、Z.ai GLM-5.2ドキュメントで現在の値を確認してください(ライブで確認)。
[1m]サフィックス。 SonnetとOpusの両方のモデル変数をglm-5.2[1m]に設定すると、Claude CodeはすべてのモデルティアをGLM-5.2の1Mコンテキストバリアントにルーティングするよう指示されます。サフィックスがない場合はデフォルトのコンテキストが得られますが、サフィックスを付けると完全な100万トークンが得られます。SonnetとOpusの両方を同じモデルにマッピングすることで、Claude Codeがどのティアを要求しても、GLM-5.2に接続されることになります。
CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000。 Claude Codeは、コンテキスト制限に近づくと会話を自動的に圧縮します。デフォルトのウィンドウは、より小さなコンテキスト予算を前提としています。これを1,000,000に増やすことで、Claude Codeは要約を開始する前にGLM-5.2の完全なウィンドウを使用できるため、より多くのコードベースをコンテキスト内に保持できます。
API_TIMEOUT_MS=3000000。 これは大規模なコンテキスト作業では必須です。これは3,000秒(50分)のタイムアウトです。1Mトークンウィンドウに長期的なエージェントタスクを投入すると、特に思考努力がMaxの場合、最初のトークンが到着するまでにモデルが長時間考えることがあります。デフォルトのタイムアウトははるかに短いため、Claude Codeはリクエストを途中で中断し、混乱を招く接続エラーが表示されます。タイムアウトを延長すれば、長い呼び出しも完了します。
思考努力について:GLM-5.2にはHighとMaxの2つのレベルがあり、Z.aiはコーディングにはMaxを推奨しています。コーディングエンドポイントは適切なデフォルトを適用しますが、ハーネスがreasoning_effortを渡せる場合、最も難しいタスクにはmaxに設定してください。高速で安価な補完が必要な場合は、思考を完全に無効にすることもできます。
以前のモデルから移行する場合、移行パスはClaude CodeでのGLM-5.1およびClaude CodeでのGLM-4.5で説明したものと同じです。モデルIDとベースURLを交換し、構造は維持します。
ClineでGLM-5.2をセットアップする
Clineは、エディター内で自律的なコーディングエージェントを実行するVS Code拡張機能です。Claude Codeとは異なり、ClineはOpenAI互換のエンドポイントから読み込むため、接続方法が異なります。

- VS CodeマーケットプレイスからCline拡張機能をインストールし、その設定(Clineパネルの歯車アイコン)を開きます。
- APIプロバイダーとして、OpenAI互換を選択します。
- ベースURLを
https://api.z.ai/api/paas/v4/に設定します。末尾のスラッシュに注意し、これが一般的なAPIベースであり、コーディングパスではないことに注意してください。 - Z.ai APIキーをAPIキーに貼り付けます。
- モデルIDには
glm-5.2と入力します(ここには[1m]サフィックスは不要です。これはClaude Codeのみの慣習です)。 - コンテキストウィンドウ設定を見つけて1000000に設定します。Clineはこれを使用して履歴をいつ切り捨てるかを決定するため、デフォルト値のままにするとGLM-5.2のウィンドウのほとんどが無駄になります。
これでGLM-5.2 Clineのセットアップは完了です。保存してタスクを開始し、Clineがモデルに対して計画、ファイルの編集、コマンドの実行を行う様子をご覧ください。
Cline特有の注意点として、Clineは1つのタスクに対して多数のツール呼び出しを行うことができるため、コンテキストウィンドウが小さいと以前のステップが破棄されてしまいます。ウィンドウを完全な100万に設定することで、計画、差分、テスト出力がすべてスコープ内に維持され、まさにGLM-5.2の長いコンテキストがその真価を発揮する点です。
CursorでGLM-5.2をセットアップする
Cursorは、AIファーストのスタンドアロンエディターです。これもOpenAI互換形式を使用するため、設定はClineとよく似ています。

- Cursorの設定を開き、モデルに移動し、OpenAI APIキーセクションまでスクロールします。
- カスタムベースURL(「OpenAIベースURLを上書き」と表示されることもあります)を有効にします。
- ベースURLを
https://api.z.ai/api/paas/v4/に設定します。 - Z.ai APIキーを入力します。
- IDが
glm-5.2のカスタムモデルを追加し、それがアクティブなモデルであることを確認します。 - Cursorの内蔵APIキーテストで接続を確認し、プロンプトを送信します。
これでGLM-5.2 Cursorの設定は完了です。検証が完了すると、GLM-5.2がCursorのチャットとインライン編集を強化します。
以前に他のGLMバージョンでCursorを扱ったことがある場合でも、GLM-4.7とClaude Code vs Cursorで記述したトレードオフは依然として適用されます。CursorのUIはインライン編集に最も滑らかであり、Claude CodeとClineは自律的な多段階エージェント実行により重点を置いています。
並列設定
以下にすべての値をまとめていますので、ハーネスごとに正しいものをコピーできます。
| 設定 | Claude Code | Cline | Cursor |
|---|---|---|---|
| API形式 | Anthropic互換 | OpenAI互換 | OpenAI互換 |
| ベースURL | https://api.z.ai/api/coding/paas/v4 (ライブで確認) |
https://api.z.ai/api/paas/v4/ |
https://api.z.ai/api/paas/v4/ |
| モデルID | glm-5.2[1m] |
glm-5.2 |
glm-5.2 |
| キーの種類 | GLMコーディングプランキー | APIキー | APIキー |
| コンテキストウィンドウ | CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000 |
1000000に設定 |
モデルのデフォルト |
| タイムアウト | API_TIMEOUT_MS=3000000 |
該当なし | 該当なし |
| 思考努力 | Max (コーディングに推奨) | プロバイダーのデフォルト経由 | プロバイダーのデフォルト経由 |
人々が最もつまずく2つの点:ハーネスの種類に対して間違ったベースURLを使用すること、そしてClaude Codeでの[1m]サフィックスとタイムアウトを忘れることです。
実際のAPI呼び出しでセットアップをテストする
どのハーネスを信頼する前に、生の_リクエスト_でキーとモデルが機能することを確認してください。この呼び出しは一般的なAPIを直接叩き、ハーネスの設定と認証情報の問題を分離します。
curl https://api.z.ai/api/paas/v4/chat/completions \
-H "Authorization: Bearer $ZAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "glm-5.2",
"messages": [
{"role": "user", "content": "Write a Python function that reverses a linked list."}
],
"thinking": {"type": "enabled"},
"reasoning_effort": "max",
"stream": false
}'
それが補完を返せば、あなたのキーとモデルIDは有効であり、残りの問題はハーネス側の設定にあります。これはAPIクライアントを導入するのに便利な場所でもあります。独自のバックエンドエンドポイントと並行してGLM-5.2をすでにテストしている場合、Apidogを使用すると、リクエストを保存し、ANTHROPIC_API_KEYまたはAuthorizationヘッダーを環境変数として管理し、curlを再入力することなくリプレイできます。Apidogをダウンロードして、上記curlから直接リクエストをインポートできます。
どのハーネスを使用すべきか
唯一の正解はありません。それはあなたの作業スタイルによって異なります。
- Claude Codeは、ターミナルネイティブな長期的なエージェント実行に最も適しており、
glm-5.2[1m]を介して完全な1Mコンテキストを取得できる3つのうち唯一のものです。大規模なリファクタリングやリポジトリ全体の変更に最適です。 - Clineは、エディターを離れることなくVS Code内でエージェントを実行でき、すべてのツール呼び出しを明確に可視化できます。良い中間地点です。
- Cursorは、高速なインライン編集とオートコンプリートスタイルの作業に最も洗練されており、設定も最も軽いです。
プラン間のより詳細な機能比較については、Claude Code vs Codex vs Cursor vs MiniMax vs GLM Planをご覧ください。GLM-5.2が最先端モデルとどのように比較されるかについては、GLM-5.2 vs GPT-5.5、Claude Opus、およびGeminiと、スタンドアロンのベンチマーク詳細を確認してください。アップグレードを検討している場合は、GLM-5.2 vs GLM-5.1で変更点を確認できます。
よくある質問
Claude Codeではglm-5.2[1m]を使用するのに、ClineとCursorではglm-5.2を使用するのはなぜですか?
[1m]サフィックスは、コーディングエンドポイントを介して1Mコンテキストバリアントを選択するためのClaude Codeの慣習です。ClineとCursorは、プレーンなモデルID glm-5.2を一般的なOpenAI互換エンドポイントに渡し、そこでコンテキストウィンドウはID内ではなくハーネスUIで設定されます。
Claude Codeが長いタスクでタイムアウトした場合どうなりますか?
それはほとんどの場合タイムアウトです。API_TIMEOUT_MS=3000000を設定して、Claude Codeが大規模なコンテキスト、最大努力の応答が完了するまで十分に待つようにしてください。これがないと、モデルが応答を返す前にハーネスがリクエストを中断してしまいます。
GLMコーディングプランは必要ですか、それとも従量課金制を利用できますか?
どちらも機能しますが、GLMコーディングプランキーはコーディングエンドポイントがClaude Codeに対して期待するものであり、プランの月額固定ティア(Lite、Pro、Max、Team)は、日常的な頻繁なコーディングでは通常、トークンごとの課金よりも優れています。公開されている数値は変動しているため、z.aiで現在のティア価格を確認してください(2026年6月現在で確認)。
Claude Codeの正しいベースURLはどれですか?
https://api.z.ai/api/coding/paas/v4を使用してください。一部のソースではhttps://open.z.ai/api/paas/v4が記載されています。認証または404エラーで一方が失敗した場合は、もう一方を試して、ライブのZ.aiドキュメントを確認してください。一般的なAPIベース(https://api.z.ai/api/paas/v4/)はClineとCursor用であり、Claude Code用ではありません。
GLM-5.2は画像を扱えますか?
GLM-5.2にビジョン対応バリアントは確認されていません。これはテキスト入力、テキスト出力のコーディングおよび推論モデルです。Z.aiがリリースするまでは「GLM-5.2V」を期待しないでください。
まとめ
3つのハーネス、1つのモデル、2つのエンドポイント形式。使用しているハーネスに合わせてベースURLとモデルIDを正しく設定し、Claude Codeでは[1m]サフィックスとタイムアウトを忘れずに、Clineではコンテキストウィンドウを完全な100万に設定してください。そこからGLM-5.2は他のコーディングバックエンドと同様に動作し、オープンウェイトで実行コストも安くなります。ハーネスなしで実行したい場合は、GLM-5.2を無料で使う方法とGLM-5.2の料金内訳をご覧ください。ローカルコピーが必要な場合は、Hugging Faceからウェイトを取得するか、Ollamaでモデルをプルしてください。
ボタン
