Çinli laboratuvarlar, 2026'nın ilk yarısında LLM API fiyatlarını altı kez düşürdü ve bu indirimlerin üçü kalıcı olarak ilan edildi. DeepSeek V4-Pro'nun çıkış token'ı başına maliyeti şu anda milyon başına 0,87 dolar. Xiaomi MiMo V2.5, uzun bağlam katmanını çıktı başına 3 dolara sabitledi. Alibaba'nın Qwen3 Max'i 3,90 dolardan piyasaya sürüldü. Moonshot'un Kimi K2.6'sı önbellek isabet tabanını 0,07 dolarda tutuyor. Zhipu'nun GLM-5'i çıktı başına 3,20 dolardır. Aşağıda, Mayıs 2026'da Çin'den çıkan en iyi beş öncü API'nin tüm fiyat dökümü, yetenek notları ve iş yükünüz için doğru olanı seçebilmeniz için sonunda bir alıcı matrisi bulunmaktadır.
Düğme
ÖZET
- Token başına en ucuz (çıktı): DeepSeek V4-Pro, 0,87 $/MTok ile. Yaklaşık olarak GPT-5.5'in 34 katı altında.
- 1M bağlamda en ucuz: Xiaomi MiMo V2.5 Pro, çıktı başına 3 $/MTok ile, girdi uzunluğundan bağımsız olarak sabit fiyat.
- Genel üretim için en iyi fiyat-kalite dengesi: Alibaba Qwen3 Max, çıktı başına 3,90 $/MTok ile, 262K bağlam.
- En düşük önbellek isabet tabanı (uzun sistem istemleri): Moonshot Kimi K2.6, önbelleğe alınmış 0,07 $/MTok ile.
- Akıl yürütmeye dayalı iş yükleri: Zhipu GLM-5, çıktı başına 3,20 $/MTok ile, 200K bağlam, yapılandırılmış düşünce zincirinde en güçlü.
- Beş laboratuvarın hepsi fiyat konusunda rekabet ediyor. Üçü (DeepSeek, MiMo, Kimi) 2026 indirimlerini kalıcı olarak kabul ediyor.
2026 Çin LLM fiyat savaşı nasıl gelişti
Desen 2025'in 4. çeyreğinde başladı ve 2026'nın 2. çeyreğinde hızlandı. Kabaca bir zaman çizelgesi:
- 2025 4. Çeyrek: DeepSeek V3.2, 0,28 $/MTok girdi fiyatıyla piyasaya sürüldü ve ABD'nin öncü fiyatlarını bir büyüklük sırası kadar düşürdü. Kimi K2.6, kademeli bağlam duyarlı fiyatlandırma ve sektörün en düşük 0,07 $/MTok önbellek isabet oranıyla onu takip etti.
- Mart 2026: Xiaomi, MiMo V2-Pro'yu OpenRouter'da rekabetçi ancak kademeli oranlarla tanıttı.
- Nisan 2026: DeepSeek V4, 31 Mayıs'ta sona erecek %75'lik bir promosyon indirimiyle piyasaya sürüldü.
- 22 Mayıs 2026: DeepSeek, %75'lik indirimin kalıcı olduğunu duyurdu. V4-Pro, süresiz olarak 0,435 $/0,87 $ fiyatında kaldı. Tam döküm burada.
- 27 Mayıs 2026: Xiaomi, MiMo V2.5 fiyatlandırmasını 1 $/3 $ olarak kalıcı hale getirdi ve uzun bağlam çarpanını kaldırdı. MiMo indirimi hakkında daha fazla bilgi.
İndirimler rastgele değil. Her laboratuvar belirli bir rekabet açığını hedefliyor. DeepSeek, token başına ham maliyeti hedefliyor. MiMo, diğer modellerin pahalı bulduğu uzun bağlamlı iş yüklerini hedefliyor. Qwen ve GLM orta kademe fiyatları koruyor ve bunun yerine yetenek konusunda rekabet ediyor. Kimi, önbellek isabet tabanı aracılığıyla aracı ve kodlama iş akışlarında rekabet ediyor.
Bir Bakışta: Mayıs 2026'da En İyi 5 Çin LLM API'si
| Model | Girdi ($/MTok) | Çıktı ($/MTok) | Önbellek isabeti | Bağlam | En iyi olduğu alan |
|---|---|---|---|---|---|
| DeepSeek V4-Pro | $0.435 | $0.87 | $0.003625 | 128K | Token başına en ucuz, kodlama |
| Xiaomi MiMo V2.5 Pro | $1.00 | $3.00 | $0.20 | 1M | Uzun belge RAG, depo ajanları |
| Alibaba Qwen3 Max | $0.78 | $3.90 | $0.156 | 262K | Üretim dengesi |
| Moonshot Kimi K2.6 | $0.16–$2.00 (kademeli) | ~$2.50 | $0.07 | 128K | Uzun sistem istemleri, kodlama ajanları |
| Zhipu GLM-5 | $1.00 | $3.20 | (sağlayıcı tarafından tanımlanır) | 200K | Yapılandırılmış akıl yürütme |
Tabloya ilişkin birkaç ayrıntı:
- DeepSeek ve MiMo sabit oranlıdır. Bu setteki diğer tüm laboratuvarlar hala bir tür kademeli fiyatlandırma veya bağlam çarpanı kullanmaktadır. Sabit fiyatlandırma, üretim kapasitesi planlamasını öngörülebilir hale getirir. Kademeli fiyatlandırma, uzun bağlamlı aylarda sizi şaşırtabilir.
- Önbellek isabet oranları büyük ölçüde değişir. Kimi K2.6'nın 0,07 doları ve DeepSeek V4-Pro'nun 0,003625 doları iki uç noktadır. Sabit bir sistem istemine sahip herhangi bir aracı için, karşılaştırma yapmanız gereken oranlar bunlar olmalı, önbellek isabeti olmayan liste fiyatı değil. Mekanizmalar için istem önbellekleme derinlemesine incelememize bakın.
- Bağlam pencereleri keskin bir şekilde ayrılır. Sadece MiMo V2.5, ucuz katmanda size 1 milyon token sunar. Bu setteki bir sonraki en büyük, Qwen3 Max'in 262K'sidir. İş yükünüz 300K'dan fazla token gerektiriyorsa, MiMo isteğe bağlı değildir.
Aşağıda: her modelin fiyatlandırma, yetenek ve hangi iş yükünde başarılı olduğuna dair bir bölüm yer almaktadır.
DeepSeek: token başına en ucuz
Modeller: V4-Pro (0,435 dolar girdi / 0,87 dolar çıktı / 0,003625 dolar önbellek isabeti, 128K bağlam), V4-Flash (0,14 dolar / 0,28 dolar).
DeepSeek'in V4-Pro'su, Çin'in öncü seviye rafının taban fiyatıdır. 22 Mayıs'taki kalıcı indirim, çıktı token'larını MToken başına 0,87 dolara düşürdü; bu, GPT-5.5'in yaklaşık 34 katı ve Claude Opus 4.7'nin 17 katı altındadır. MToken başına 0,003625 dolarlık önbellek isabeti, herhangi bir büyük laboratuvardan gelen en düşük birinci taraf oranıdır. DeepSeek'in resmi fiyatlandırma sayfasıyla doğrulandı.
V4-Pro'nun kazandığı alanlar:
- Token bütçenizin %70'inden fazlasını çıktıya harcadığınız çıktı yoğun iş yükleri (kod üretimi, ajan zincirleri, içerik araçları).
- Sabit 5K ila 10K token'lık sistem istemine sahip her şey. Önbellek isabetleri, etkili girdi maliyetini sıfıra yakın hale getirir.
- GPT-5.5'e göre 3 ila 7 puanlık kıyaslama farkını tolere edebileceğiniz maliyet duyarlı üretim.
Uymadığı alanlar:
- Uzun belge iş yükleri (128K bağlamdan fazla). MiMo V2.5, DeepSeek'in istemi sığdıramaması nedeniyle, token başına daha yüksek oranlarda bile mutlak terimlerde daha ucuz bir seçenektir.
- Gecikmeye duyarlı gerçek zamanlı sohbet. V4-Pro, ilk tokene ulaşma süresi 600 ila 900ms olan düşünen bir modeldir.
Daha derin kapsam için: DeepSeek V4-Pro kalıcı fiyat indirimi, DeepSeek V4 nedir, DeepSeek V4 API nasıl kullanılır.
Xiaomi MiMo: en ucuz 1M bağlam seçeneği
Modeller: MiMo V2.5 Pro (1,00 $ girdi / 3,00 $ çıktı / 0,20 $ önbellek, 1M bağlam), MiMo V2 Flash (~0,10 $ / ~0,40 $, 256K bağlam).
Xiaomi'nin 27 Mayıs'taki kalıcı indirimi, MiMo V2.5 fiyatlandırmasını tüm bağlam pencerelerinde sabitledi. 256K girdi token'ının üzerindeki uzun bağlam katmanları, eskiden yüksek çarpanlar uygulayan, artık yok. Yeni fiyatlandırma, 5K veya 950K token gönderip göndermediğinize bakılmaksızın aynı 1 $/3 $ oranını uyguluyor. Resmi fiyat güncelleme bildirimi indirimi "kalıcı" olarak etiketliyor.
V2.5 Pro'nun kazandığı alanlar:
- Uzun belge RAG, depo çapında kod analizi, çoklu belge özetleme, 300K ila 1M token bağlamına uyan her türlü iş yükü.
- Fiyatlandırma öngörülebilirliğinin mutlak tabandan daha önemli olduğu yüksek hacimli belge işleme.
Uymadığı alanlar:
- Kısa istemli sohbet. V2.5 Pro, DeepSeek'in ele alabileceği herhangi bir bağlam uzunluğunda DeepSeek V4-Pro'dan daha pahalıdır.
- Gecikmeye duyarlı iş yükleri. Bir saniyenin altında yanıt bütçeleri için daha hızlı Çin modelleri mevcuttur.
1M bağlam penceresi ve rekabetçi önbellek oranı, MiMo'ya piyasada yapısal olarak benzersiz bir yer veriyor. DeepSeek bağlamı 128K'nın üzerine genişletene veya Alibaba Qwen'in fiyatlandırmasını sabitleyene kadar, MiMo ucuz ve uzun quadrant'a sahip.
Daha derin kapsam için: 2026'da Xiaomi MiMo V2.5 Kullanmak Ne Kadara Mal Olacak, MiMo V2-Pro & Omni fiyatlandırması, Xiaomi MiMo Orbit ücretsiz 100T token programı.
Alibaba Qwen: üretim işgücü
Modeller: Qwen3 Max (0,78 $ girdi / 3,90 $ çıktı / 0,156 $ önbellek, 262K bağlam). Yeni Qwen 3.7 Max, 1M bağlamla 2,50 $/MTok girdi fiyatıyla erken dağıtımda. Oranlar, pricepertoken'ın Qwen3 Max tablosu ile doğrulandı.
Qwen3 Max, Alibaba'nın amiral gemisi ve uluslararası üretimde en çok dağıtılan Çin modelidir. Rekabetçi ancak taban seviyesinde olmayan bir fiyat noktasında yer alır: DeepSeek V4-Pro'nun girdide 1,8 katı, çıktıda 4,5 katı. Bu prim, en geniş araç ekosistemi (Anthropic protokolü bırakma, OpenAI uyumlu, Alibaba Cloud kurumsal barındırma) ve çoğu kurumsal belge iş yükünü yöneten 262K bağlam penceresi için ödenir.
Qwen3 Max'in kazandığı alanlar:
- Çok dilli üretim. Qwen'in eğitim veri kümesi büyük ölçüde Mandarin ve Asya dillerine yöneliktir, bu da onu bu setteki en güçlü İngilizce olmayan performans gösteren yapar.
- Kurumsal uyumluluk senaryoları. Alibaba'nın kurumsal SLA ve bulut bölgesi seçenekleri, herhangi bir Çin laboratuvarının en olgunudur.
- 200K ila 262K bağlam gerektiren ancak MiMo'nun premium kalite bandını haklı çıkarmayan iş yükleri.
Uymadığı alanlar:
- Maliyete duyarlı çıktı yoğun iş yükleri. Çıktı başına 3,90 $/MTok ile DeepSeek'in oranının 4,5 katını ödüyorsunuz. İş yükünüz DeepSeek'in kalitesini tolere ediyorsa, geçiş yapın.
Daha derin kapsam için: Qwen 3 vs OpenAI & DeepSeek: API geliştiricileri için derinlemesine teknik karşılaştırma.
Moonshot Kimi: kodlama uzmanı
Modeller: Kimi K2.6, bağlam katmanlı girdi fiyatlandırmasıyla (8K, 32K, 64K ve 128K bantlarında 0,16 dolardan 2,00 dolara kadar), 0,07 $/MTok önbellek isabet tabanı, orta bantta çıktı oranları yaklaşık 2,50 $/MTok.
Kimi K2.6, önbellek isabeti şampiyonudur. İsabetli 0,07 $/MTok oranı, herhangi bir büyük laboratuvardan gelen en düşük birinci taraf sayısıdır. Kimi'nin güçlü araç çağırma ve uzun süreli ajan desteğiyle birleştiğinde, K2.6, birçok dönüşte kalın bir sistem istemini yeniden kullandığınız iş akışlarında kazanan modeldir: kodlama ajanları, sabit persona istemleriyle müşteri destek sohbet robotları, sabit bağlam bloklarına sahip geri çağırma boru hatları.
K2.6'nın kazandığı alanlar:
- Kodlama ajanları (Claude Kod tarzı iş akışları). Güçlü araç çağırma formatı uyumluluğu ve en düşük önbellek isabet tabanı, tekrar eden bağlam modellerini neredeyse ücretsiz hale getirir.
- Sistem isteminin ve birkaç örnekli örneklerin sabit olduğu uzun süreli sohbet oturumları.
Uymadığı alanlar:
- Her istekte öneklerin değiştiği ani, çeşitli iş yükleri. Kademeli girdi fiyatı, bağlam uzunluğu sürprizlerinin faturanızı yükseltebileceği anlamına gelir.
- Öngörülebilir bütçeleme. 32K, 64K ve 128K girdi token'larındaki katman geçişleri, aynı sorgu türünün uzun bir günde kısa bir günden 4 kat daha pahalıya mal olabileceği anlamına gelir.
Daha derin kapsam için: Kimi K2 API fiyatlandırması 2026'da geliştiriciler için gerçekten abartıldığı kadar iyi mi?.
Zhipu GLM: muhakeme konusunda iddialı
Modeller: GLM-5 (1,00 $ girdi / 3,20 $ çıktı, 200K bağlam), GLM-5.1 (0,98 $ / 3,08 $, 200K bağlam). Oranlar Z.AI'nin resmi fiyatlandırma genel bakışıyla doğrulandı.
Zhipu'nun GLM-5'i, GLM-4.7'ye göre %30'luk bir fiyat artışıyla piyasaya sürüldü (pazarda dibe doğru koşan bir harekette çelişkili bir hamle), ardından marjinal bir indirimle GLM-5.1'i piyasaya sürdü. Fiyatlandırma Zhipu'nun konumunu yansıtıyor: en ucuzu değil, ancak yapılandırılmış akıl yürütme ve düşünce zinciri görevlerinde en güçlüsü.
GLM-5'in kazandığı alanlar:
- Matematik, biçimsel akıl yürütme, yapılandırılmış düşünce zinciri görevleri. GLM-5, Çin'deki öncü modeller arasında birden fazla GPQA sınıfı kıyaslamasında liderliği elinde tutuyor.
- Yanlış cevapların maliyetine göre marjinal maliyetin küçük olduğu iş yükleri (finansal analiz, yasal özetleme, bilimsel akıl yürütme).
- Temiz akıl yürütme izlerinden faydalanan çok adımlı ajan iş akışları.
Uymadığı alanlar:
- Maliyete duyarlı uygulamalar. GLM-5, bu sette girdi ve çıktı birleştirildiğinde en pahalı seçenektir. Optimize ettiğiniz şey ham maliyet ise, başka yere bakın.
- Güçlü akıl yürütmeyi ödüllendirmeyen iş yükleri. Doğrudan içerik oluşturma veya özetleme için GLM primi buna değmez.
Daha derin kapsam için: GLM-5 vs DeepSeek V3 vs GPT-5: hız, maliyet ve pratik geliştirici karşılaştırması, GLM-5.1 vs Claude, GPT, Gemini, DeepSeek.
İş Yüküne Göre En Ucuz: Bir Alıcı Matrisi
Beş yaygın üretim iş yükü için hangi modelin kazandığı aşağıdadır:
| İş Yükü | Kazanan | Neden |
|---|---|---|
| Kod üretimi (çıktı ağırlıklı) | DeepSeek V4-Pro | 0,87 $/MTok çıktı rakipsizdir |
| Uzun belge RAG (300K'dan fazla bağlam) | Xiaomi MiMo V2.5 Pro | Tek sabit fiyatlı 1M bağlam seçeneği |
| Sabit sistem istemli kodlama ajanı | Kimi K2.6 | 0,07 $/MTok önbellek isabet tabanı |
| Çok dilli müşteri desteği | Alibaba Qwen3 Max | En güçlü İngilizce olmayan performans |
| Matematik, biçimsel akıl yürütme, yapısal analiz | Zhipu GLM-5 | En iyi düşünce zinciri kalitesi |
Bildirmeye değer üç birleşik desen:
- İki model yönlendirme. Birçok üretim ekibi, trafiğin %70 ila %85'ini DeepSeek V4-Pro'ya yönlendirir ve ikincil modelini zorlu kuyrukta tutar. Tasarruflar büyüktür ve çoğu iş yükü için kalite kaybı küçüktür.
- Uzun bağlam segmentasyonu. İş yükünüz kısa ve uzun bağlamlar arasında bölünüyorsa, kısa olanı DeepSeek'e, uzun olanı MiMo'ya yönlendirin. Birleşik faturalandırma acısı gerçek ama maliyet arbitrajı göz ardı edilemeyecek kadar büyük.
- Önbellek önek birleşimi. Hangi modeli seçerseniz seçin, sistem istemlerinizi denetleyin. Önbellek isabetleri, herhangi bir model değişiminden sonra da varlığını sürdüren ucuz bir kazançtır.
Kalite ve Kıyaslama Notları
Kalite üzerine bir not, çünkü model işi yapamıyorsa fiyatlandırmanın hiçbir anlamı yoktur.
Artificial Analysis'e göre, bu karşılaştırmadaki beş model, çoğu genel kıyaslamada birbirlerinden 5 ila 10 puan içinde kümeleniyor. İlginç kuyruk farklılıkları:
- DeepSeek V4-Pro: Kodlamada (SWE-bench Pro yaklaşık %55) ve akıl yürütmede (GPQA yaklaşık %90) güçlü. Uzun vadeli ajan görevlerinde GPT-5.5'e karşı hafif bir fark.
- MiMo V2.5 Pro: Uzun bağlamlı alımda güçlü (800K'da %95'in üzerinde doğruluk), kodlamada orta seviye.
- Qwen3 Max: En iyi İngilizce olmayan performans, güçlü genel üretim kalitesi.
- Kimi K2.6: Özellikle paralel araç çağrıları için en güçlü araç çağırma formatı uyumluluğu.
- GLM-5: Setteki en iyi düşünce zinciri akıl yürütme kalitesi.
Taahhütte bulunmadan önce kendi 100 örnekli değerlendirmenizi yapın. Genel kıyaslamalar yönlendirici olsa da, önemli olan fark sizin trafiğinizdeki farktır.
Apidog ile beşini de test etme
Çok modelli bir üretim dağıtımı, çok modelli bir test donanımı gerektirir. Apidog, beş Çin API'sinin hepsini tek bir çalışma alanından yönetir, çünkü beşi de OpenAI Sohbet Tamamlama istek gövdelerini, küçük uyumluluk tuhaflıklarıyla kabul eder. İş akışı:

- Apidog'da her sağlayıcı için bir ortam oluşturun:
api.deepseek.com,platform.xiaomimimo.com, Alibaba Cloud Model Studio, Moonshot'unapi.moonshot.cnve Zhipu'nunopen.bigmodel.cn. - OpenAI Sohbet Tamamlama şemasını bir kez içe aktarın. Temel URL'yi her ortama göre değiştirin.
- Aynı test senaryosunu tek bir tıklamayla beşinde de çalıştırın. Yanıtları, puanları ve gecikmeleri karşılaştırın.
- Her sağlayıcıya özgü akış formatı tuhaflıklarını yakalamak için
tool_callsşekillerine karşı JSON Şema doğrulaması yapın.
Apidog'u indirin, test senaryolarınızı içe aktarın ve on beş dakikadan kısa sürede çalışan beş yönlü bir karşılaştırmaya sahip olun. Model başına derinlemesine incelemelerde önerdiğimiz aynı iş akışı: DeepSeek V4-Pro kalıcı indirimi, MiMo V2.5 maliyeti, Kimi K2 fiyatlandırması.
Fiyat savaşı nereye gidiyor?
Fiyat tabanı Mayıs ayında iki kez değişti. 3. çeyrek bitmeden iki hamle daha bekleniyor.
- Qwen yanıtı. Alibaba nadiren ilk kesinti yapan oldu, ancak tutarlı bir şekilde haftalar içinde takip ediyor. Temmuz ayına kadar bir Qwen3 Max revizyonu veya Qwen 3.8 duyurusu bekleyin.
- GLM yanıtı. Zhipu'nun GLM-5'teki %30'luk artışı giderek daha çelişkili görünüyor. Yapısal bir kesintiye sahip bir GLM-5.2 olası.
- Kimi yapısal basitleştirme. Kademeli bağlam fiyatlandırması modası geçiyor. Moonshot, K2.6'yı MiMo'nun yapısına uyacak şekilde düzleştirebilir.
Buna göre inşa edin. Sonraki üç adım:
- En iyi üç iş yükünüzü yukarıdaki alıcı matrisine göre denetleyin. Bu hafta bir geçiş testi için birini seçin.
- Önbellek öneklerinizi kilitleyin. Bu, hangi modeli seçerseniz seçin kazanacağınız bir şeydir.
- Beş sağlayıcının hepsini işaret eden bir Apidog regresyon paketi oluşturun, böylece bir sonraki kesinti turunu değerlendirmek haftalar yerine saatler sürsün.
Fiyat tabanı düşmeye devam edecek. Sisteminizi bir sonraki duruma göre konumlandırın.
