GLM-5.2 Fiyatları: API Ücreti, Önbelleklenmiş Giriş ve GLM Kodlama Planı Katmanları (2026)

GLM-5.2, öncü sınıf bir kodlama modelini çalıştırmanın uygun maliyetli yoludur. Z.ai (Zhipu AI), MIT lisansı altında açık ağırlıklarla, 1M token bağlam penceresiyle ve büyük kapalı laboratuvarların fiyat kartlarını geniş bir farkla düşüren bir API fiyat kartıyla sunuyor. Bu sayfa en önemli sayfadır. Token başına tam API maliyetini, önbelleğe alınmış girdi indiriminin nasıl çalıştığını, gerçek kodlama oturumları için hazırlanmış dolar örneklerini, GLM Kodlama Planı abonelik katmanlarını ve GLM-5.2'nin sizin çalışma şeklinize göre GPT-5.5'ten daha ucuz olup olmadığına dair dürüst bir değerlendirmeyi bulacaksınız.

Sayıları vermeden önce bir not: Yapay zeka fiyatlandırması hızla değişir ve bazı GLM Kodlama Planı katmanları ikincil kaynaklarda çelişmektedir. Bir rakam kesinleşmediğinde işaretlenmiştir. İşaretlenmiş herhangi bir sayıyı bir tahmin olarak kabul edin ve bütçenizi bağlamadan önce z.ai adresinden güncel fiyatı onaylayın.

button

GLM-5.2 API maliyetine bir bakış

Kullandıkça öde API oranı başlamak için en temiz yerdir, çünkü OpenRouter'ın halka açık listesi tarafından doğrulanmıştır.

Öğe	Fiyat	Kaynak
Girdi tokenları	$1.40 / 1M	Onaylandı (OpenRouter)
Çıktı tokenları	$4.40 / 1M	Onaylandı (OpenRouter)
Önbelleğe alınmış girdi	~$0.26 / 1M	VentureBeat (atfedildi)

Böylece, GLM-5.2'nin manşet token başına maliyeti, girdi tokenı başına 0.0000014 dolar ve çıktı tokenı başına 0.0000044 dolar olarak ortaya çıkıyor. Çıktı, girdi fiyatının yaklaşık 3.1 katıdır, ki bu bir akıl yürütme modeli için normal bir şekildir: modelin ürettiği tokenlar (düşünme izi dahil) ona beslediğiniz tokenlardan daha pahalıdır.

1M token başına yaklaşık 0.26 dolarlık önbelleğe alınmış girdi oranı, ajans tabanlı ve sohbet iş yükleri için her şeyi değiştiren bir kaldıraçtır ve aşağıda ayrı bir bölümde ele alınmaktadır. Bu rakam, birinci taraf bir fiyat kartından ziyade VentureBeat'in raporlamasından gelmektedir, bu nedenle buna göre atfedin.

glm-5.2 için ücretsiz bir OpenRouter kanalı yoktur. Başka bir yerde böyle bir iddia görürseniz, yanlıştır. Açık ağırlıkları kendi donanımınızın maliyetine kendiniz çalıştırabilirsiniz, ki bu farklı bir tür "ücretsiz"dir. Bu yol için, GLM-5.2'yi ücretsiz kullanma hakkındaki tamamlayıcı rehbere ve GLM-5'i yerel olarak ücretsiz çalıştırma hakkındaki önceki yazıya bakın.

Önbelleğe alınmış girdi indirimi nasıl çalışır

İstem önbellekleme, GLM-5.2 fiyat listesindeki en büyük maliyet kontrolüdür ve çoğu kişi bunu gözden kaçırır.

Mekanizma şu şekildedir: Uzun, istikrarlı bir ön eki (bir sistem istemi, bir kodlama aracısının araç tanımları, sürekli referans verdiğiniz büyük bir dosya) tekrar tekrar gönderdiğinizde, sağlayıcı işlenmiş ön eki önbelleğe alabilir. Bir sonraki çağrıda, önbelleğe alınmış kısım, tam girdi oranı (1.40 dolar / 1M) yerine önbelleğe alınmış girdi oranından (~0.26 dolar / 1M) faturalandırılır. Bu, isteminizin tekrarlanan kısmı için yaklaşık %81 indirim demektir.

Bunun karşılığını nerede verir:

Kodlama aracıları. Claude Code, Cline ve Cursor gibi araçlar, her dönüşte büyük bir istikrarlı giriş (talimatlar, araç şemaları, repo bağlamı) yeniden gönderir. Bu girişi önbelleğe almak, her dönüşteki girdi faturasını önemli ölçüde azaltır. Kurulum detayları GLM-5.2 Claude Code, Cline ve Cursor rehberinde yer almaktadır.
RAG ve belge Soru-Cevap. Aynı uzun belgeye karşı birçok soru sorarsanız, belgeyi bir kez önbelleğe alın ve yalnızca her kısa soru artı yanıt için tam fiyat ödeyin.
Uzun konuşmalar. Büyüyen bir sohbet geçmişi, büyüyen istikrarlı bir ön ektir. Önbellekleme, konuşmayı "hatırlamanın" maliyetini düşük tutar.

İki pratik kural. Birincisi, yeniden kullanılan içeriği istemin önüne, değişken içeriği ise sonuna koyun; önbellekler ön eke göre anahtarlama yapar. İkincisi, önbelleklerin süresi dolar, bu nedenle indirim, birbirine yakın zamanlarda yapılan çağrılar için geçerlidir, saatte bir yaptığınız bir istek için değil.

Düşünmeyi maliyet kontrolü olarak devre dışı bırakma

GLM-5.2, iki düşünme çabası seviyesi olan (Yüksek ve Maks) bir akıl yürütme modelidir. Z.ai, kodlama için Maks'ı önermektedir. Ancak düşünme tokenları çıktı tokenlarıdır ve çıktı, 4.40 dolar / 1M ile faturanın pahalı tarafıdır. Daha fazla düşünme, daha fazla üretilen token anlamına gelir ve bu da daha büyük bir fatura demektir.

Bunun için doğrudan bir kaldıraçınız var. API'de düşünmeyi tamamen devre dışı bırakabilirsiniz:

{
  "model": "glm-5.2",
  "messages": [
    { "role": "user", "content": "Bu JSON'u yeniden biçimlendir ve geri döndür." }
  ],
  "thinking": { "type": "disabled" }
}

Seviyeleri bilinçli olarak kullanın:

Ucuz, mekanik işler için düşünme devre dışı: biçimlendirme, veri çıkarma, basit yeniden yazmalar, sınıflandırma. Akıl yürütme izini atlar ve sadece kısa bir yanıt için ödeme yaparsınız.
Maksimum token harcamadan iyi bir akıl yürütme istediğiniz günlük kodlama ve analizler için Yüksek çaba.
Ekstra düşünmenin doğrulukta maliyetini hak ettiği zor, uzun ufuklu kodlama ve matematik için Maksimum çaba.

Çaba seviyesini göreve göre eşleştirmek, aynı istem üzerinde 4.40 dolarlık bir çıktı faturası ile 1 dolarlık bir fatura arasındaki farktır. reasoning_effort ve akış dahil olmak üzere tüm parametre referansı GLM-5.2 API rehberinde yer almaktadır ve önceki GLM-5 API adım adım rehberi, geçiş yapıyorsanız aynı OpenAI uyumlu şekli kapsar.

Çalışılan maliyet örnekleri

Token başına soyut oranlar, gerçek işe eşleştirilmedikçe pek bir anlam ifade etmez. İşte teyit edilmiş oranlarla fiyatlandırılmış üç oturum.

Örnek 1: tek bir 100K tokenlık kodlama oturumu. Diyelim ki 100K token bağlamı (deponuz, talimatlar, dosya içerikleri) okuyan ve 20K token kod ve akıl yürütme üreten ajans tabanlı bir kodlama görevi çalıştırıyorsunuz.

Girdi: 100,000 × 1.40 dolar / 1,000,000 = 0.140 dolar
Çıktı: 20,000 × 4.40 dolar / 1,000,000 = 0.088 dolar
Toplam: ~0.23 dolar

Örnek 2: önbellekleme ile aynı oturum. Şimdi o 100K girdinin 80K'sının önbellekten sunulan istikrarlı bir ön ek (sistem istemi, araç tanımları, değişmemiş dosyalar) olduğunu ve 20K'sının yeni olduğunu varsayalım.

Önbelleğe alınmış girdi: 80,000 × 0.26 dolar / 1,000,000 = 0.021 dolar
Yeni girdi: 20,000 × 1.40 dolar / 1,000,000 = 0.028 dolar
Çıktı: 20,000 × 4.40 dolar / 1,000,000 = 0.088 dolar
Toplam: ~0.14 dolar

İstikrarlı ön eki önbelleğe almak, oturum maliyetini yaklaşık %40 oranında azalttı ve aynı bağlama karşı ne kadar çok dönüş yaparsanız tasarruflar o kadar artar.

Örnek 3: düşünme kapalıyken çıkarma yapan bir sohbet asistanı. Bir destek botu günde 500 mesaj işler. Her çağrı 2K girdi tokenı gönderir ve 300 çıktı tokenı döndürür, düşünme devre dışıdır.

Girdi: 500 × 2,000 × 1.40 dolar / 1,000,000 = 1.40 dolar
Çıktı: 500 × 300 × 4.40 dolar / 1,000,000 = 0.66 dolar
Toplam: ~2.06 dolar / gün, günde 500 çağrılık bir iş yükü için ayda yaklaşık 62 dolar.

Bunlar liste fiyatı tahminleridir. Gerçek faturanız, ne kadar düşünmeye izin verdiğinize ve girdinizin ne kadarının önbelleğe düştüğüne bağlıdır.

GLM Kodlama Planı katmanları

Eğer bütün gün bir kodlama ajansının içinde yaşıyorsanız, abonelik yolu genellikle ölçülü API çağrılarından daha ucuzdur. Z.ai, Anthropic uyumlu bir uç nokta aracılığıyla Claude Code ve benzeri araçlara sunulan adlandırılmış katmanlara (Lite, Pro, Max artı Team) sahip bir GLM Kodlama Planı satmaktadır.

Plan anahtarı, standart API anahtarından farklı bir kimlik bilgisidir. GLM-5.2'yi Claude Code'a bağlamak için, onu kodlama uç noktasına yönlendirir ve [1m] model son eki aracılığıyla 1M bağlam varyantını seçersiniz:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="sizin-glm-kodlama-planı-anahtarınız"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

API_TIMEOUT_MS değeri önemlidir. Uzun bir zaman aşımı olmadan, Claude Code, GLM-5.2 bitmeden uzun ve büyük bağlamlı çağrıları sonlandırabilir. Bazı kaynaklar kodlama temel URL'sini open.z.ai/api/paas/v4 olarak göstermektedir, bu nedenle tam ana bilgisayarı canlı olarak doğrulayın. Cline ve Cursor dahil olmak üzere tam ajan kurulumu, GLM-5.2 kodlama ajanları rehberinde yer almaktadır ve önceki GLM-5.1 Claude Code yazısı, önceki nesil için aynı deseni kapsar.

GLM-5.2, GPT-5.5'ten daha mı ucuz?

Evet, ölçülü API'de ve geniş bir farkla. En net çerçeve, VentureBeat'ten geliyor; GLM-5.2'nin "uzun ufuklu kodlamada GPT-5.5'i yaklaşık 1/6 maliyetle yendiğini" bildirdi. Bu iddia VentureBeat'e aittir, Apidog ölçümü değildir ve kıyaslama performansını fiyatla birleştirir, bu nedenle token başına bir oran yerine yönlü bir değer ifadesi olarak okuyun.

Fiyat kartı düzeyinde, işte üst düzey karşılaştırma. GLM-5.2, 1M token başına 1.40 dolar girdi / 4.40 dolar çıktı olarak listelenir. OpenAI, Anthropic ve Google'dan gelen kapalı öncü modeller, en üst akıl yürütme seviyeleri için genellikle bunun oldukça üzerindedir, bu yüzden "maliyetin bir kısmı" ifadesi sürekli olarak karşımıza çıkmaktadır. Modeller arasında sayı odaklı hız ve maliyet dökümü için hız ve maliyette GLM-5 vs DeepSeek vs GPT-5 ve daha geniş GLM-5.1 vs Claude, GPT, Gemini ve DeepSeek karşılaştırmasına bakın.

Abonelik karşılaştırması daha nüanslıdır. Tahmini 80 dolar/ay olan ağır bir GLM Kodlama Planı katmanı, diğer satıcıların en pahalı tek kişilik kodlama abonelikleriyle aynı aralıkta yer alır, bu nedenle belirleyici faktörler, görevlerinizdeki model kalitesi ve planların kullanımı nasıl ölçtüğü haline gelir. Plan-plan karşılaştırması (GLM Planı Claude Code, Codex, Cursor ve MiniMax'a karşı), Claude Code vs Codex vs Cursor vs MiniMax Plan vs GLM Plan'da ayrıntılı olarak işlenmiştir.

Kıyaslamalarla ilgili bir uyarı: değer teklifini motive eden lansman sonuçları (SWE-bench Pro 62.1, Terminal-Bench 2.1'de 81.0, MCP-Atlas 77.0) Z.ai'nin yayınladığı sonuçlardır. Tam set, GLM-5.2 kıyaslamaları derinlemesine incelemesinde dökümlenmiştir ve kapalı laboratuvarlarla kafa kafaya mücadele GLM-5.2 vs GPT-5.5, Claude Opus ve Gemini'de yer almaktadır.

Hangi fiyatlandırma yolunu seçmelisiniz?

Hızlı bir karar rehberi:

Ani veya düşük hacimli kullanım: Kullandıkça öde API. Yalnızca kullandığınız kadar ödersiniz ve oranlar o kadar düşüktür ki, az kullanım ucuz kalır.
Bir ajan içinde tüm gün kodlama: Bir GLM Kodlama Planı katmanı. Günde yüzlerce çağrı yapmaya başladığınızda tahmin edilebilir aylık maliyet, ölçülü faturalandırmadan daha iyidir. Önce katman fiyatını doğrulayın.
Gizlilik, çevrimdışı veya sıfır marjinal maliyet: Açık ağırlıkları kendiniz barındırın. Token başına hiçbir fatura yok, sadece kendi bilgi işlem gücünüz. GLM-5'i yerel olarak ücretsiz çalıştırma veya Ollama ile GLM-5'i ücretsiz kullanarak başlayın.

Hangi yolu seçerseniz seçin, iki maliyet kaldıracı aynı kalır: istikrarlı ön eklerinizi önbelleğe alın ve ihtiyacı olmayan işler için düşünme çabasını azaltın.

Bağlanmadan önce GLM-5.2 maliyetlerini test etme

Bir plan seçmeden önce, gerçek istemlerinizin ne kadara mal olduğunu ve ne kadar sürdüğünü görmek yardımcı olur. Herhangi bir OpenAI uyumlu istemciyi GLM-5.2 uç noktasına yönlendirebilir ve çağrı başına token kullanımını izleyebilirsiniz. Apidog burada faydalıdır: API'leri tasarlamak, hata ayıklamak, test etmek ve belgelemek için hepsi bir arada bir API platformudur, böylece https://api.z.ai/api/paas/v4/chat/completions adresine istek gönderebilir, yanıtı ve token sayılarını inceleyebilir ve düşünme seviyelerini ve önbellekleme davranışını karşılaştırırken çağrıları yeniden kullanılabilir bir koleksiyon olarak kaydedebilirsiniz. Çalışılmış bir örneğe güvenmek yerine, kendi trafiğinize karşı fiyat kartını kıyaslamak isterseniz Apidog'u indirin.

button

Kısa versiyon: GLM-5.2'nin onaylanmış API oranı olan 1.40 dolar girdi ve 4.40 dolar çıktı, temel alınacak sayıdır. Ön eklerinizi önbelleğe alın, düşünme çabasını yönetin ve herhangi bir Kodlama Planı katmanı fiyatını taahhüt etmeden önce canlı olarak doğrulayın.