Cara Menggunakan GLM-5.2 dengan Claude Code, Cline, dan Cursor

GLM-5.2 adalah model pengkodean bobot terbuka dari Z.ai, dan dapat diintegrasikan ke dalam tiga perangkat pengkodean yang sudah digunakan sebagian besar pengembang: Claude Code, Cline, dan Cursor. Masalahnya adalah setiap perangkat diatur secara berbeda. Claude Code menggunakan format API Anthropic, sementara Cline dan Cursor menginginkan endpoint yang kompatibel dengan OpenAI. Panduan ini akan membahas ketiganya, dari awal hingga akhir, menggunakan Paket Pengkodean GLM sebagai dasar.

Jika Anda hanya ingin fakta model terlebih dahulu, mulailah dengan ikhtisar GLM-5.2 kami dan referensi API GLM-5.2. Artikel ini adalah panduan pengaturannya.

tombol

Yang Anda butuhkan sebelum memulai

GLM-5.2 adalah model Mixture-of-Experts sekitar 753 miliar parameter, disajikan dengan jendela konteks 1 juta token (tepatnya 1.048.576 token). Ini mengutamakan pengkodean, dengan penalaran yang kuat dan penggunaan alat agentik. Tolok ukur utama, menurut hasil yang dipublikasikan Z.ai, adalah Terminal-Bench 2.1 pada 81.0, naik dari GLM-5.1 yang 62.0. VentureBeat menggambarkannya sebagai mengalahkan GPT-5.5 pada tolok ukur pengkodean berjangka panjang dengan biaya sekitar seperenam.

Untuk mengikuti panduan ini Anda membutuhkan:

Akun Z.ai dan kunci API. Untuk Claude Code dan perangkat agentik, Anda menginginkan kunci Paket Pengkodean GLM daripada kunci bayar-sesuai-penggunaan biasa, karena endpoint pengkodean adalah cakupan kunci tersebut.
Salah satu dari tiga perangkat terinstal: Claude Code, Cline (ekstensi VS Code), atau Cursor.
ID model, yaitu glm-5.2 di mana-mana kecuali di dalam Claude Code, tempat Anda menggunakan varian konteks 1 juta glm-5.2[1m].

Sedikit tentang biaya. API standar mengenakan biaya $1.40 per 1 juta token input dan $4.40 per 1 juta token output (dikonfirmasi oleh OpenRouter), dengan input yang di-cache sekitar $0.26 per 1 juta (diatributkan ke VentureBeat). Paket Pengkodean GLM adalah langganan terpisah dengan tingkat Lite, Pro, Max, dan Tim. Harga tingkat publik telah berubah-ubah, jadi anggaplah angka apa pun yang Anda lihat sebagai perkiraan (per Juni 2026, verifikasi harga saat ini di z.ai sebelum Anda berkomitmen).

Menyiapkan GLM-5.2 di Claude Code

Claude Code berkomunikasi dengan endpoint yang kompatibel dengan Anthropic, dan Z.ai mengekspos satu khusus untuk alat pengkodean. Anda mengarahkan Claude Code ke endpoint tersebut dengan variabel lingkungan, lalu menjalankannya seperti biasa.

Berikut adalah blok lengkapnya. Letakkan di profil shell Anda (~/.zshrc atau ~/.bashrc), atau atur sebaris sebelum meluncurkan.

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

Kemudian luncurkan Claude Code dengan cara biasa:

claude

Beberapa variabel tersebut patut dijelaskan, karena melewatkannya adalah titik di mana sebagian besar pengaturan gagal.

URL dasar. https://api.z.ai/api/coding/paas/v4 adalah endpoint pengkodean yang kompatibel dengan Anthropic. Beberapa tulisan lama menunjukkan https://open.z.ai/api/paas/v4 sebagai gantinya. Keduanya telah beredar, jadi jika permintaan 404 atau autentikasi gagal, coba host lain dan periksa nilai saat ini di dokumen Z.ai GLM-5.2 (verifikasi langsung).

Sufiks [1m]. Mengatur variabel model Sonnet dan Opus ke glm-5.2[1m] memberi tahu Claude Code untuk merutekan setiap tingkat model ke varian konteks 1 juta GLM-5.2. Tanpa sufiks Anda mendapatkan konteks default; dengan sufiks Anda mendapatkan satu juta token penuh. Memetakan Sonnet dan Opus ke model yang sama berarti tingkat apa pun yang dijangkau Claude Code, Anda akan menggunakan GLM-5.2.

CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000. Claude Code secara otomatis memadatkan percakapan ketika mendekati batas konteks. Jendela default mengasumsikan anggaran konteks yang lebih kecil. Meningkatkannya menjadi 1.000.000 memungkinkan Claude Code menggunakan jendela penuh GLM-5.2 sebelum mulai meringkas, sehingga Anda menjaga lebih banyak basis kode Anda dalam konteks.

API_TIMEOUT_MS=3000000. Yang satu ini tidak opsional untuk pekerjaan konteks besar. Itu adalah waktu tunggu 3.000 detik (50 menit). Ketika Anda memasukkan tugas agentik berjangka panjang ke dalam jendela 1 juta token, model dapat berpikir untuk waktu yang lama sebelum token pertama tiba, terutama pada upaya berpikir Maksimal. Waktu tunggu default jauh lebih pendek, sehingga Claude Code menghentikan permintaan di tengah jalan dan Anda melihat kesalahan koneksi yang membingungkan. Tingkatkan waktu tunggu dan panggilan panjang akan selesai.

Mengenai upaya berpikir: GLM-5.2 memiliki dua tingkatan, Tinggi dan Maksimal, dan Z.ai merekomendasikan Maksimal untuk pengkodean. Endpoint pengkodean menerapkan default yang masuk akal, tetapi jika perangkat Anda memungkinkan Anda untuk meneruskan reasoning_effort, atur ke max untuk tugas-tugas tersulit. Pemikiran juga dapat dinonaktifkan sepenuhnya saat Anda menginginkan penyelesaian yang cepat dan murah.

Jika Anda datang dari model sebelumnya, jalur migrasi sama dengan yang kami bahas untuk GLM-5.1 di Claude Code dan GLM-4.5 dengan Claude Code. Tukar ID model dan URL dasar, pertahankan strukturnya.

Menyiapkan GLM-5.2 di Cline

Cline adalah ekstensi VS Code yang menjalankan agen pengkodean otonom di dalam editor Anda. Tidak seperti Claude Code, Cline membaca dari endpoint yang kompatibel dengan OpenAI, jadi pengaturannya berbeda.

Instal ekstensi Cline dari pasar VS Code dan buka pengaturannya (ikon roda gigi di panel Cline).
Untuk Penyedia API, pilih Kompatibel dengan OpenAI.
Atur URL Dasar ke https://api.z.ai/api/paas/v4/. Perhatikan garis miring di akhir dan bahwa ini adalah basis API umum, bukan jalur pengkodean.
Tempelkan kunci API Z.ai Anda ke Kunci API.
Untuk ID Model, masukkan glm-5.2 (tidak ada sufiks [1m] di sini, itu adalah konvensi khusus Claude Code).
Temukan pengaturan jendela konteks dan atur ke 1000000. Cline menggunakan ini untuk memutuskan kapan harus memotong riwayat, jadi membiarkannya pada nilai default akan menyia-nyiakan sebagian besar jendela GLM-5.2.

Itulah seluruh pengaturan GLM-5.2 Cline. Simpan, mulai tugas, dan saksikan Cline merencanakan, mengedit file, dan menjalankan perintah terhadap model.

Satu catatan khusus Cline: karena Cline dapat memicu banyak panggilan alat per tugas, jendela konteks yang terlalu kecil memaksanya untuk menghilangkan langkah-langkah sebelumnya. Mengatur jendela ke satu juta penuh menjaga rencana, perbedaan, dan output pengujian semuanya dalam lingkup, yang merupakan tepat di mana konteks panjang GLM-5.2 menunjukkan nilainya.

Menyiapkan GLM-5.2 di Cursor

Cursor adalah editor AI mandiri. Ini juga menggunakan format yang kompatibel dengan OpenAI, jadi konfigurasinya mirip Cline.

Buka pengaturan Cursor, buka Model, dan gulir ke bagian kunci API OpenAI.
Aktifkan URL dasar kustom (terkadang diberi label "Timpa URL Dasar OpenAI").
Atur URL dasar ke https://api.z.ai/api/paas/v4/.
Masukkan kunci API Z.ai Anda.
Tambahkan model kustom dengan ID glm-5.2, lalu pastikan itu adalah model aktif.
Verifikasi koneksi dengan pengujian kunci API bawaan Cursor, lalu kirim prompt.

Itu mencakup GLM-5.2 Cursor. Setelah diverifikasi, GLM-5.2 mendukung obrolan dan pengeditan sebaris Cursor.

Jika Anda sebelumnya menggunakan Cursor dengan versi GLM lainnya, pertukaran yang kami tulis di Claude Code vs Cursor dengan GLM-4.7 masih berlaku: UI Cursor adalah yang paling mulus untuk pengeditan sebaris, sementara Claude Code dan Cline lebih condong ke eksekusi agen otonom multi-langkah.

Konfigurasi Berdampingan

Berikut adalah setiap nilai di satu tempat sehingga Anda dapat menyalin yang benar per perangkat.

Pengaturan	Claude Code	Cline	Cursor
Format API	Kompatibel dengan Anthropic	Kompatibel dengan OpenAI	Kompatibel dengan OpenAI
URL Dasar	`https://api.z.ai/api/coding/paas/v4` (verifikasi langsung)	`https://api.z.ai/api/paas/v4/`	`https://api.z.ai/api/paas/v4/`
ID Model	`glm-5.2[1m]`	`glm-5.2`	`glm-5.2`
Jenis Kunci	Kunci Paket Pengkodean GLM	Kunci API	Kunci API
Jendela Konteks	`CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000`	atur ke `1000000`	default model
Waktu Tunggu	`API_TIMEOUT_MS=3000000`	n/a	n/a
Upaya Berpikir	Maksimal (direkomendasikan untuk pengkodean)	via default penyedia	via default penyedia

Dua hal yang paling sering membuat orang bingung: menggunakan URL dasar yang salah untuk jenis perangkat, dan melupakan sufiks [1m] serta waktu tunggu di Claude Code.

Uji Pengaturan Anda dengan Panggilan API Nyata

Sebelum Anda memercayai perangkat apa pun, konfirmasikan bahwa kunci dan model berfungsi dengan permintaan mentah. Panggilan ini langsung memanggil API umum dan mengisolasi konfigurasi perangkat dari masalah kredensial.

curl https://api.z.ai/api/paas/v4/chat/completions \
  -H "Authorization: Bearer $ZAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Write a Python function that reverses a linked list."}
    ],
    "thinking": {"type": "enabled"},
    "reasoning_effort": "max",
    "stream": false
  }'

Jika itu mengembalikan penyelesaian, kunci dan ID model Anda bagus, dan masalah yang tersisa adalah konfigurasi sisi perangkat. Ini juga merupakan tempat yang berguna untuk melibatkan klien API. Jika Anda sudah menguji GLM-5.2 bersama dengan endpoint backend Anda sendiri, Apidog memungkinkan Anda menyimpan permintaan, mengelola header ANTHROPIC_API_KEY atau Authorization sebagai variabel lingkungan, dan memutarnya ulang tanpa mengetik ulang curl. Anda dapat mengunduh Apidog dan mengimpor permintaan langsung dari curl di atas.

Perangkat Mana yang Harus Anda Gunakan

Tidak ada pemenang tunggal. Itu tergantung pada bagaimana Anda suka bekerja.

Claude Code adalah yang paling cocok untuk eksekusi agen berjangka panjang berbasis terminal, dan itu satu-satunya dari ketiganya yang mendapatkan konteks 1 juta penuh melalui glm-5.2[1m]. Terbaik untuk refactoring besar dan perubahan di seluruh repositori.
Cline membawa agen ke dalam VS Code tanpa meninggalkan editor Anda, dengan visibilitas yang jelas ke setiap panggilan alat. Pilihan menengah yang baik.
Cursor adalah yang paling halus untuk pengeditan sebaris cepat dan pekerjaan gaya pelengkapan otomatis, dengan konfigurasi paling ringan.

Untuk perbandingan fitur yang lebih mendalam antar paket, lihat Claude Code vs Codex vs Cursor vs MiniMax vs Paket GLM. Untuk bagaimana GLM-5.2 dibandingkan dengan yang terdepan, periksa GLM-5.2 vs GPT-5.5, Claude Opus, dan Gemini dan analisis tolok ukur yang berdiri sendiri. Dan jika Anda mempertimbangkan peningkatan, GLM-5.2 vs GLM-5.1 menjelaskan apa yang berubah.

FAQ

Mengapa saya menggunakan `glm-5.2[1m]` di Claude Code tetapi `glm-5.2` di Cline dan Cursor?

Sufiks [1m] adalah konvensi Claude Code yang memilih varian konteks 1 juta melalui endpoint pengkodean. Cline dan Cursor meneruskan ID model biasa glm-5.2 ke endpoint umum yang kompatibel dengan OpenAI, di mana jendela konteks diatur di UI perangkat, bukan di ID.

Bagaimana jika Claude Code kehabisan waktu pada tugas-tugas panjang?

Itu hampir selalu masalah waktu tunggu. Atur API_TIMEOUT_MS=3000000 agar Claude Code menunggu cukup lama untuk respons konteks besar dengan upaya Maksimal selesai. Tanpa itu, perangkat menghentikan permintaan sebelum model merespons.

Apakah saya memerlukan Paket Pengkodean GLM, atau bisakah saya menggunakan bayar-sesuai-penggunaan?

Keduanya berfungsi, tetapi kunci Paket Pengkodean GLM adalah yang diharapkan endpoint pengkodean untuk Claude Code, dan tingkat bulanan tetap dari paket (Lite, Pro, Max, Tim) biasanya mengalahkan penagihan per-token untuk pengkodean berat setiap hari. Konfirmasikan harga tingkat saat ini di z.ai, karena angka yang dipublikasikan telah bergeser (verifikasi per Juni 2026).

URL dasar mana yang benar untuk Claude Code?

Gunakan https://api.z.ai/api/coding/paas/v4. Beberapa sumber mencantumkan https://open.z.ai/api/paas/v4. Jika salah satu gagal dengan kesalahan autentikasi atau 404, coba yang lain dan periksa dokumen Z.ai yang terbaru. Basis API umum (https://api.z.ai/api/paas/v4/) adalah untuk Cline dan Cursor, bukan Claude Code.

Bisakah GLM-5.2 menangani gambar?

Belum ada varian visi yang dikonfirmasi untuk GLM-5.2. Ini adalah model pengkodean dan penalaran teks-masuk, teks-keluar. Jangan berharap "GLM-5.2V" sampai Z.ai merilisnya.

Penutup

Tiga perangkat, satu model, dua format endpoint. Pastikan URL dasar dan ID model benar untuk perangkat yang Anda gunakan, ingat sufiks [1m] dan waktu tunggu untuk Claude Code, dan atur jendela konteks ke satu juta penuh di Cline. Dari sana GLM-5.2 berperilaku seperti backend pengkodean lainnya, hanya saja bobotnya terbuka dan lebih murah untuk dijalankan. Jika Anda ingin menjalankannya tanpa perangkat sama sekali, lihat cara menggunakan GLM-5.2 secara gratis dan analisis harga GLM-5.2. Ambil bobotnya dari Hugging Face atau ambil modelnya dengan Ollama saat Anda menginginkan salinan lokal.