Xiaomi MiMo V2.5 API fiyatlandırması 27 Mayıs 2026'da milyon giriş jetonu başına 1 dolar ve milyon çıkış jetonu başına 3 dolar olarak sabitlendi ve ekip bu yeni oranı kalıcı hale getirdi. Eski uzun bağlam katmanı, yani 256K jetonu aşan istemlerin taban orana yüksek bir çarpan uyguladığı katman, artık yok. Bağlam uzunluğuna bakılmaksızın artık tek fiyat var. Çoğu iş yükü için manşet tek bir cümle: MiMo V2.5, üretimdeki en ucuz üç 1M-bağlam modelinden biridir ve öyle kalmaya devam edecektir.
ÖZET
- Xiaomi MiMo V2.5'in 27 Mayıs 2026 itibarıyla kalıcı fiyatlandırması: milyon jeton başına 1,00 $ giriş, 3,00 $ çıkış, 0,20 $ önbelleğe alınmış, 1M jetonluk bağlam penceresi ile.
- "Yüzde 99'a varan indirim" iddiası uzun bağlam katmanında gerçektir. Önceki program, 256K giriş jetonunu aştığında sert bir şekilde ölçekleniyordu. Yeni sabit oran çarpanı ortadan kaldırıyor.
- Jeton Planı müşterileri 5 ila 8 kat kota artışı ve geçerlilik süreleri içindeki kullanılan kredilerin tam sıfırlanmasını elde etti.
- Kesinti kalıcıdır, promosyon amaçlı değildir. Xiaomi'nin resmi bildirimi "tüm model fiyatlandırma sistemini kalıcı olarak yenileme" diyor.
- Bağlam: Xiaomi, bu hafta kalıcı bir sınır katmanı indirimi yapan ikinci Çin laboratuvarıdır. DeepSeek, üç gün önce V4-Pro'yu liste fiyatının dörtte birine kalıcı hale getirmişti.
27 Mayıs 2026'da Ne Değişti?
Xiaomi'nin resmi fiyat güncelleme bildirimi üç değişiklik ortaya koyuyor. Üçü de 27 Mayıs'ta Pekin saatiyle 00:00'da, yani 26 Mayıs'ta UTC 16:00'da yürürlüğe girdi.

1. Bağlam pencerelerinde sabit fiyatlandırma. Eski MiMo V2.5 programı kademeli oranlar kullanıyordu: 32K giriş jetonuna kadar olan istemler için bir taban fiyat, 32K ila 256K bandı için bir çarpan ve 256K'nın üzerinde daha da yüksek bir oran. Yeni program, jeton türü başına tek bir sayıya sahip. Uzun bağlamlı uygulamalar artık uzun bağlam vergisi ödemiyor.
2. Kalıcı, promosyon amaçlı değil. Bildirimde iki kez "Kalıcı Fiyat İndirimi" ve bir kez "tüm model fiyatlandırma sistemini kalıcı olarak yenileme" ifadesi kullanılıyor. Son kullanma tarihi yok. Geri alma maddesi yok. Bunu yeni liste fiyatı olarak kabul edin.
3. Jeton Planı ödülleri sıfırlandı. Bir Jeton Planınız (Xiaomi'nin ön ödemeli kota sistemi) varsa, kredi bakiyeniz 5 ila 8 kat artırıldı ve geçerlilik süreniz içinde daha önce kullandığınız her kredi iade edildi. Geçerlilik süresi uzatılmadı, bu nedenle mevcut planlar bütçe açısından bir rüzgar elde etti ancak daha fazla süre almadı.

"Yüzde 99'a varan indirim" iddiası özellikle uzun bağlam bandı için geçerlidir. 256K+ giriş jetonları için önceki fiyat o kadar yüksekti ki, bunu 1$/M'ye düşürmek %90'dan fazla bir azalma sağlıyor. Temel katmanda yer alan iş yükleri için indirim daha küçük ama yine de önemli.
Yeni Kalıcı Fiyat Listesi
1 milyon jeton başına fiyatlandırma, USD, derhal geçerli ve kalıcı:
| Model | Giriş | Çıkış | Önbelleğe Alınan | Bağlam |
|---|---|---|---|---|
| MiMo V2.5 Pro | $1.00 | $3.00 | $0.20 | 1M jeton |
| MiMo V2 Flash | ~$0.10 | ~$0.40 | $0.02 | 256K jeton |
Tablonun açıkça belirtmediği birkaç ayrıntı:
- Önbellek oranı (V2.5 Pro için 0,20$/M), giriş oranının 5 katıdır. Bu, DeepSeek'in 120:1 giriş-kaçırma-giriş-isabet oranından daha kötü bir orandır. Xiaomi'nin önbelleği yinelenen sistem istemleri için hala kullanışlıdır, ancak tasarruflar mutlak terimlerle daha küçüktür.
- 1M bağlam penceresi, çoğu makalenin yeterince vurgulamadığı kısımdır. ABD merkezli çoğu öncü model 200K ila 400K ile sınırlıdır. MiMo V2.5 Pro tüm belgeyi alır.
- Bildirim, V2.5 Omni ve TTS varyantlarından bahsediyor ancak bunları ayrıntılı olarak listelemiyor. Bunları platformda ayrı ayrı doğrulayın.
Referans noktası olarak eski V2-Pro fiyatlandırması için, sürekli güncel MiMo V2-Pro & Omni fiyatlandırma kılavuzumuza bakın.
MiMo V2.5'in Daha Ucuz Fiyatlandırmanın Ötesinde Sundukları
27 Mayıs duyurusu bir fiyatlandırma etkinliği olsa da, V2.5'in kendisi de Nisan ayında piyasaya sürülen V2-Pro'ya göre anlamlı bir yükseltmedir. Dikkate değer üç değişiklik:
- Daha uzun pratik bağlam. V2.5 Pro 1M jetonluk teorik pencereyi koruyor, ancak Xiaomi çoğu uzun bağlamlı modelin performansının düştüğü 200K ila 800K bandında alım kalitesini sıkılaştırdı. Samanlıkta iğne doğruluğu 800K jetona kadar %95'in üzerinde kalıyor.
- Daha iyi araç çağırma formatı uyumluluğu. V2-Pro'da, akışlı yanıtların içinde hatalı JSON döndüren paralel araç çağrılarıyla bilinen sorunlar vardı. V2.5 bu hataları sıfıra indirmese de azaltıyor. Her iki durumda da JSON şema doğrulaması yapmayı planlayın.
- Yenilenmiş eğitim veri kümesi. V2.5, 2026'nın ilk çeyreğine kadar olan verilerle eğitildi. Atıflar ve bilgi kesme noktası V2-Pro'dan kabaca üç ay ileridedir.
Bunların hiçbiri manşet niteliğinde ölçütler değil, ancak gerçek üretim dağıtımlarında ortaya çıkan değişikliklerdir. Daha ucuz fiyatlandırmayı daha uzun güvenilir bağlam penceresiyle birleştirdiğinizde, 27 Mayıs'tan önce ciddi uzun belge çalışmaları için var olmayan bir seçeneğe sahip olursunuz.
MiMo V2.5'in Diğer Modellerle Karşılaştırması
İlginç karşılaştırma V2.5'in eski haliyle değil. Mayıs 2026'da piyasaya sürülen diğer öncü API seçenekleriyle yapılıyor:
| Model | Giriş ($/M Jeton) | Çıkış ($/M Jeton) | Bağlam |
|---|---|---|---|
| Xiaomi MiMo V2.5 Pro | $1.00 | $3.00 | 1M |
| DeepSeek V4-Pro | $0.435 | $0.87 | 128K |
| GPT-5.5 | $5.00 | $30.00 | 200K |
| Claude Opus 4.7 | $3.00 | $15.00 | 200K |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | 1M |
Üç çıkarım:
- DeepSeek V4-Pro, jeton başına bazda MiMo V2.5'ten hala daha ucuzdur. Girişte yaklaşık 2,3 kat, çıkışta 3,5 kat daha ucuz. Eğer tek metriğiniz ham jeton başına maliyetse, DeepSeek kazanır.
- MiMo V2.5, 1M bağlamlı iş yüklerinde kazanır. Tablodaki diğer tek 1M bağlam seçeneği Gemini 3.5 Flash'tır ve girişte 1,5 kat, çıkışta 3 kat daha pahalıdır.
- MiMo V2.5, girişte GPT-5.5'ten 5 kat, çıkışta ise 10 kat daha ucuzdur; Artificial Analysis'e göre kıyaslanabilir benchmark performansı sunar.
Bu karşılaştırmanın DeepSeek tarafı için DeepSeek V4-Pro %75 Fiyat İndirimi Artık Kalıcı başlıklı makaleye bakın. İki makale birbirini tamamlayıcı niteliktedir. Her ikisi de bu haftaki Çin laboratuvarlarından gelen kalıcı sınır katmanı indirimlerini kapsamaktadır.
Üç İş Yükü, Üç Yeni Fatura
Yeni kalıcı oranları kullanan üç somut örnek:
1. Kurumsal PDF'ler üzerinde Uzun Belge RAG. Günde 50.000 sorgu, sorgu başına 800K jeton bağlam, 1K jeton yanıt. Eski MiMo V2.5 uzun bağlam katmanı (tahmini 50$/M etkin oran): ayda yaklaşık 60.000$. Yeni sabit oran: ayda yaklaşık 1.225$. Tasarruf: ayda 58.775$.
2. Kod inceleme ajanı. Günde 5.000 çekme isteği, 30K jeton depo bağlamı, 2K jeton yorum çıkışı. Eski GPT-5.5 aylık fatura: yaklaşık 5.250$. Yeni MiMo V2.5: yaklaşık 510$. Tasarruf: ayda 4.740$.
3. Müşteri destek sohbet botu. Günde 200.000 dönüş, 4K jeton sistem istemi, 300 jeton yanıt. Eski Claude Opus 4.7 aylık fatura: yaklaşık 11.250$. Yeni MiMo V2.5: yaklaşık 805$. Tasarruf: ayda 10.445$.
1 numaralı iş yükü, MiMo V2.5'in diğerlerinden ayrıldığı yerdir. Bu indirimden önce uzun bağlamlı işler her öncü API'de aşırı derecede pahalıydı. Artık değiller. Eskiden özetleyicilere ve öbekleme süreçlerine gönderilen aynı belgeler, jeton bütçesi jimnastiği olmadan modele bütün olarak gidebilir.
Önbellek İsabetleri Üzerine Kısa Bir Not
0,20$/M önbelleğe alınmış giriş oranı, 1,00$ önbellek kaçırma oranından 5 kat daha ucuzdur. Bu, DeepSeek'in 120:1 oranından daha küçük bir önbellek indirimi olsa da, kararlı bir sistem istemini yeniden kullanan herhangi bir ajan için hala anlamlıdır.
Çalışan bir örnek. Yardımcınızın 6.000 jetonluk bir sistem istemi kullandığını ve günde 80.000 sohbet dönüşünü ele aldığını, ortalama kullanıcı mesajının 250 giriş jetonu ve ortalama yanıtın 600 çıkış jetonu olduğunu varsayalım:
- Önbellek isabetleri olmadan: 80.000 dönüş × 6.250 giriş × 1,00 $ / 1.000.000 = yalnızca giriş için günde 500 $.
- Sistem istemi ön ekinde %60 önbellek isabetiyle: 80.000 × (250 × 1,00 $ + 6.000 × (0,6 × 0,20 $ + 0,4 × 1,00 $)) / 1.000.000 = günde yaklaşık 271 $. %46'lık bir azalma.
Bu, DeepSeek önbelleklemenin sağladığı %88 değildir, ancak giriş için günde 500 $ tutarında bir iş yükünde, yarı yarıya indirim gerçek bir paradır. Sistem istemini sabitleyin, alınan bağlamı istikrarlı bir şekilde sıralayın ve ön eke istek başına zaman damgası eklemeyin. Her yerde önbellek isabetleri kazandıran aynı kurallar burada da geçerlidir.
MiMo V2.5 Ne Zaman Doğru Seçim, Ne Zaman Değil
Yeni fiyatlandırma, MiMo V2.5'i iki iş yükü sınıfı için varsayılan seçim, bir iş yükü için ise kötü bir seçim haline getiriyor.
Doğru seçim:
- Uzun belge RAG, kod tabanlı ajanlar, depo genelinde yeniden düzenlemeler. Doğal olarak >200K jetonluk bir bağlama uyan her şey. Sabit fiyatlandırma artı 1M pencere, ucuz katmanda eşsizdir.
- Yüksek hacimli belge işleme. Fiyatlandırma tahmin edilebilir ve önbelleğe alınmış oran (0,20$/M), aynı önekleri ucuza toplu olarak işlemenizi sağlar. Sağlayıcılar arası önbellek mekanikleri için Prompt önbelleklemenin LLM performansını nasıl süper şarj ettiğini ve maliyetleri nasıl azalttığını görün.
Kötü seçim:
- Gecikmeye kritik etkileşimli sohbet. MiMo V2.5 Pro en hızlı ilk jeton modeli değildir. Yazım önerme, otomatik tamamlama veya saniye altı sohbet için DeepSeek V4-Flash veya Gemini 3.5 Flash, benzer maliyetle daha iyi gecikme profillerine sahiptir.
Uyarılar:
- Veri yerleşimi. Çağrılar Xiaomi'nin Çin'deki altyapısı üzerinden yönlendirilir. DeepSeek ile aynı satın alma konuşması.
- Güvenilirlik. Xiaomi'nin birinci taraf API'si, ABD merkezli öncü modellerden daha kısa bir operasyonel geçmişe sahiptir. SLA destekli üretim için OpenRouter veya başka bir toplayıcı aracılığıyla yönlendirin.
- Fonksiyon çağırma eşitliği. Şema düzeyinde OpenAI uyumlu, akışlı araç argümanları ve paralel araç çağrıları etrafındaki uç durumlar mevcut. Dağıtımdan önce test edin.
V2.5'i hazırlayan V2-Pro lansman bağlamı için, Xiaomi Kendi Yapay Zeka Modelini Piyasaya Sürdü ve OpenRouter'da Ücretsiz başlıklı makaleye bakın. Ücretsiz katmanlı başlangıç için, Xiaomi MiMo Orbit ücretsiz 100T jeton programı uygunluk ve kaydolmayı kapsar.
MiMo V2.5'i Apidog ile Test Etme
Platformun OpenAI uyumluluğu iyi, ancak mükemmel değil. Üretim trafiğini yönlendirmeden önce entegrasyonunuzu doğrulayın.

Apidog, MiMo API anahtarınızla https://platform.xiaomimimo.com/v1 adresine bir Sohbet Tamamlama isteği göndermenize olanak tanır ve ardından:
- V2.5 Pro'dan "golden" yanıtları kaydedin ve her istem değişikliğinde tekrarlayın, böylece sapma kullanıcılardan önce ortaya çıkar.
tool_callsşekillerini JSON Şema doğrulamaları ile onaylayın. Akışlı fonksiyon argümanları, OpenAI uyumluluğundaki çatlakların ortaya çıktığı yerlerdir.- Apidog'un test senaryolarını kullanarak aynı giriş toplu işiyle mevcut modeliniz (GPT-5.5, Claude, DeepSeek V4-Pro) ile yan yana karşılaştırmalar yapın.
Apidog'u indirin, OpenAI Sohbet Tamamlama şemasını içe aktarın, temel URL'yi değiştirin ve on dakikadan kısa sürede çalışan bir V2.5 test donanımına sahip olun. DeepSeek V4 API nasıl kullanılır başlıklı makalede önerdiğimiz aynı iş akışı.
2026 LLM Fiyat Savaşı Nasıl Şekilleniyor?
MiMo V2.5, bir Çin laboratuvarından bir hafta içinde gelen ikinci kalıcı sınır katmanı indirimidir. DeepSeek, 22 Mayıs'ta V4-Pro'yu liste fiyatının dörtte birine kalıcı hale getirdi. Kimi K2, ilk çeyrekte daha erken indirim yaptı. OpenAI O3 Şubat'ta %80 düştü. Desen açık:
- Çin laboratuvarları fiyat üzerinden rekabet ediyor. Bu indirimler promosyon bayrakları değil. Yapısal.
- ABD laboratuvarları yetenek ve paketleme üzerinden rekabet ediyor. OpenAI ve Anthropic, amiral gemisi katman fiyatlarını koruyor ve primlerini haklı çıkarmak için özellikler (düşünme modları, MCP sunucuları, ajans tabanlı iş akışları) sunuyor.
- Benchmark farkı o kadar küçük ki çoğu iş yükü yeniden test edilmeli. Genel benchmark'lar, Artificial Analysis'e göre MiMo V2.5'i çoğu kodlama ve akıl yürütme görevinde GPT-5.5'in tek haneli yüzde puanları içinde gösteriyor.
Bu resmin geri kalanı için:
- DeepSeek V4-Pro kalıcı fiyat indirimi, karşılaştırılabilir Çin laboratuvarının hamlesini kapsar.
- Kimi K2 API fiyatlandırması, 2026'nın üçüncü büyük Çin indirimini ayrıntılarıyla anlatır.
- OpenAI O3 fiyat düşüşü, ABD'nin Şubat ayındaki yanıtını kapsar.
- Gemini 3.0 API maliyeti, Google'ın katman stratejisini haritalandırır.
- Tam Claude API maliyet dökümü, Opus, Sonnet ve Haiku'nun nereye uyduğunu açıklar. MiMo-7B farklı bir nişte yer alır; Xiaomi'nin ürün yelpazesinin küçük model tarafı için MiMo-7B-RL benchmark'larına bakın.
Bu, Yapınızı Nerede Bırakıyor?
MiMo V2.5 indirimi bir pazarlama hilesi değildir. 1M-bağlam katmanının yapısal bir yeniden fiyatlandırmasıdır ve indirim kalıcıdır. Uzun belge RAG'i, depo genelindeki kod ajanlarını veya maliyet nedeniyle 200K jetonluk bağlam gerektiren herhangi bir iş yükünü erteliyorsanız, geçen çeyrekte fiyatlandırdığınız bütçe muhtemelen bu çeyreğin ihtiyacını bir büyüklük mertebesinde abartıyor.
Üç somut sonraki adım:
- Jeton hacmine göre en iyi üç iş yükünüzü çekin ve bunları yeni sabit oran üzerinden yeniden maliyetlendirin. Uzun bağlamlarda çalışanlar sizi şaşırtacak.
- Aynı istemlerle V2.5 Pro ve mevcut modeliniz arasında 100 örnekli bir değerlendirme yapın. Çoğu ekip, kalite bandının trafiğin %70 ila %85'i için kabul edilebilir olduğunu bulur.
- Bir Apidog regresyon paketi kurun, böylece bir sonraki fiyat indirimi, ki olacaktır, haftalar yerine saatler içinde değerlendirilebilir.
Fiyat tabanı tekrar değişti. Buna göre inşa edin.
