DeepSeek, 2026 LLM fiyatlandırmasındaki en agresif geçici indirimi yeni normale dönüştürdü. Ekip, 22 Mayıs'ta, başlangıçta 31 Mayıs 2026 TSİ 15:59'da sona erecek olan %75 indirimli DeepSeek-V4-Pro teklifinin geri çekilmeyeceğini duyurdu. Promosyon oranı, kalıcı liste fiyatı haline geldi. Giriş tokenları milyon başına 0,435 dolara, çıkış tokenları 0,87 dolara ve önbellek isabetleri 0,003625 dolara düştü. Aşağıda, neyin değiştiğini, neyin aynı kaldığını ve her API geliştiricisinin bu hafta neyi yeniden düşünmesi gerektiğini açıklıyoruz.
ÖZET
- DeepSeek-V4-Pro API fiyatlandırması artık orijinal liste fiyatının 1/4'ü oranında kalıcı hale geldi: Giriş için 0,435 $/MTok, çıkış için 0,87 $/MTok, önbellek isabeti için 0,003625 $/MTok.
- 31 Mayıs 2026'da sona ermesi beklenen %75'lik promosyon indirimi artık normal tarife oldu. Geri çekilme yok. Sürpriz bir bitiş tarihi yok.
- V4-Pro, çıkışta GPT-5.5'ten yaklaşık 34 kat daha ucuzken, çoğu kodlama ve muhakeme kıyaslama testinde GPT-5.5'in yaklaşık %95'i içinde yer alıyor.
- Manşet indirime ek olarak %90'lık bir kesinti olan 0,003625 $/MTok önbellek isabet fiyatı, hafife alınan bir detaydır. Uzun sistem istemleri artık önekte neredeyse ücretsizdir.
- Geçen çeyrekte AI özelliklerinizi GPT-5.5 veya Claude Opus 4.7'ye göre fiyatlandırdıysanız, bu hafta maliyet hesaplaması değişti.
Bu neden önemli?
LLM fiyatlandırması genellikle tek yönde ilerler: yavaşça, dipnotlarla birlikte aşağı doğru. DeepSeek dipnotları atladı. Ekip, Mayıs boyunca agresif bir promosyon yürüttü, geliştirici trafiğinin arttığını gördü ve fiyatın eski haline dönmesine izin vermek yerine sabitlemeye karar verdi. Bu, Çin'in öncü model ekonomisinin nereye gittiğine dair yapısal bir sinyaldir, tek seferlik bir numara değil.
Eğer kritik bir yolda (otomatik tamamlama, geri getirme destekli sohbet, kod incelemesi, ajan döngüleri) bir LLM çağıran herhangi bir ürün yayınlıyorsanız, milyon çıkış tokenı başına 3,48 dolar ile 0,87 dolar arasındaki fark bu ay faturanıza yansıyacaktır. Günde 50 milyon çıkış tokenı gönderin, bu önemli kullanıcılara sahip herhangi bir ajan için gerçekçi bir yüktür ve yeni fiyat aylık LLM faturanızı yaklaşık 5.200 dolardan 1.300 dolara düşürür. Bu, bir satış elemanı işe almak veya bir yıllık GPU kredisi demektir.
DeepSeek üzerine mi inşa ediyorsunuz? Apidog, akış, araç çağrıları ve JSON şema doğrulama dahil olmak üzere V4-Pro API çağrılarını tek bir çalışma alanında oluşturmanıza, test etmenize ve izlemenize olanak tanır. Apidog'u indirin ve bu makaledeki istekleri bir dakikadan kısa sürede kopyalayabilirsiniz.
Bu yazının geri kalanında, tam yeni fiyat listesini, GPT-5.5 ve Claude Opus 4.7 ile doğrudan karşılaştırmayı, çoğu makalede gözden kaçan önbellek isabeti matematiğini, üç gerçek fatura senaryosunu ve bugün geçiş yapıp yapmayacağınıza dair beş adımlı bir karar çerçevesini göreceksiniz.
Ne değişti: duyurunun şifresi çözüldü
DeepSeek'in resmi fiyatlandırma bildirimi kısadır, ancak her satır bir sayıyı hareket ettirir. Öne çıkarılması gereken üç gerçek:
- %75 indirim kalıcıdır. 31 Mayıs 2026 TSİ 15:59'a kadar süren promosyonun 1 Haziran'da lansman liste fiyatına geri dönmesi bekleniyordu. Dönmeyecek. Promosyon oranı, lansmandan itibaren geçerli ve süresiz olarak yeni liste fiyatıdır.
- İndirim sadece V4-Pro için geçerlidir. DeepSeek-V4-Flash, milyon token başına 0,14 $ / 0,28 $ ile zaten ucuzdu. Düşen, öncü seviye model olan V4-Pro'dur. Flash ve Pro ayrımını öğrenmek için DeepSeek V4 Nedir başlıklı makaleye bakın.
- Önbellek isabeti fiyatlandırması, 26 Nisan 2026 TSİ 12:15'ten itibaren geçerli olmak üzere lansman fiyatının 1/10'una düşürüldü. Bu, manşet %75'lik indirimden ayrı bir değişikliktir ve ikisi üst üste biner. Sonuç: önbellek isabetleri 0,003625 $/MTok ile 2026'da piyasadaki en düşük birinci taraf öncü model önbellek fiyatıdır.
Duyuru birlikte okunduğunda şunu söylüyor: DeepSeek, geliştirici payını korumak için amiral gemisi modeldeki brüt kar marjını feda etmeye istekli. Önbellek isabeti hamlesi ise şunu ifade ediyor: Özellikle V4-Pro üzerinde ajanlar ve uzun bağlam araçları oluşturmanızı istiyorlar. Her iki hamle de aynı oyun planına işaret ediyor. Çıkarım iş yükünü şimdi kazanın, platformu sonra paraya çevirin.
Yeni kalıcı fiyat listesi
Milyon token başına fiyatlandırma, USD, hemen ve kalıcı olarak geçerlidir:
| Token türü | Eski liste | Yeni kalıcı | İndirim |
|---|---|---|---|
| Giriş (önbellek ıskası) | $1.74 | $0.435 | 75% |
| Giriş (önbellek isabeti) | $0.0145 | $0.003625 | 75% |
| Çıkış | $3.48 | $0.87 | 75% |
Tablonun gizlediği birkaç önemli nokta:
- Çıkış düşüşü, faturanıza en çok etki eden faktördür, çünkü modelin muhakeme yaptığı veya kod yazdığı herhangi bir ajan döngüsünde çıkış tokenları baskın gelir.
- Önbellek isabet satırı, mutlak sayıların çok küçük olması nedeniyle önemsiz görünür. Tasarruflar oranda gizlidir. Giriş ıskası ile giriş isabeti oranı yaklaşık 120:1'dir. Zamanın %90'ında önbelleğe isabet eden iyi tasarlanmış bir sistem istemi, giriş için neredeyse hiçbir şey ödemez, bu da istikrarlı bir iskeleye sahip herhangi bir ajan için bir avantajdır.
- Bu oranlar yalnızca API için geçerlidir. DeepSeek'in web sohbeti bireyler için ücretsiz kalmaktadır.
V4 fiyatlandırma katmanları ve Flash-Pro dengeleri hakkında daha derin tarihsel bağlam için, kalıcı DeepSeek V4 API Fiyatlandırması referansımıza bakın.
V4-Pro şimdi GPT-5.5, Claude Opus 4.7 ve Gemini 3.5 Flash ile nasıl karşılaştırılıyor?
İlginç karşılaştırma, V4-Pro'nun eski haliyle değil. Frontier kategorisindeki diğer modellerle olanıdır.
| Model | Giriş ($/MTok) | Çıkış ($/MTok) | SWE-bench Pro |
|---|---|---|---|
| DeepSeek-V4-Pro (yeni) | $0.435 | $0.87 | 55.4% |
| GPT-5.5 | $5.00 | $30.00 | 58.6% |
| Claude Opus 4.7 | $3.00 | $15.00 | ~62% |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | ~48% |
| DeepSeek-V4-Flash | $0.14 | $0.28 | ~42% |
Unutulmaması gereken iki sayı. Faturanızı yükselten kalem olan çıkış tokenlarında DeepSeek-V4-Pro, GPT-5.5'ten 34 kat ve Claude Opus 4.7'den 17 kat daha ucuzdur. Kıyaslama testlerinde, DataCamp karşılaştırmasına göre V4-Pro, çoğu herkese açık kodlama ve muhakeme değerlendirmesinde GPT-5.5'in 3 ila 7 yüzde puanı içinde yer almaktadır.
İş yükünüz gecikmeye dayanıklı ve o küçük aralıkta kalite kabul edilebilir ise, geçiş tek cevabı olan bir matematik problemidir. Kıyaslama puanının son 5 puanının önemli olduğu iş yüklerinde (ajan aracı güvenilirliği, uzun ufuklu planlama, zor matematik), V4-Pro, spekülatif kod çözme veya eleştirel bir desenin arkasında taslak model olarak kullanmak için hala daha ucuzdur.
Daha derin birebir incelemeler için Kodlama için DeepSeek V4 vs Claude Opus 4.5 ve GLM-5 vs DeepSeek V3 vs GPT-5: hız, maliyet ve pratik geliştirici karşılaştırması makalelerine bakın.
Çoğu makalenin gözden kaçırdığı önbellek isabeti açısı
Herkes 0,87 dolarlık çıkış sayısını aktarıyor. Çok az kişi 0,003625 dolarlık önbellek isabetli giriş fiyatının sistem tasarımına ne yaptığını açıklıyor.
DeepSeek'in istem önbelleği, isteğinizin öneki yaklaşık 30 dakikalık bir pencere içinde yakın zamandaki bir önceki istekle bayt olarak aynı olduğunda isabet eder. Sohbet ajanları ve geri getirme boru hatları için önek genellikle sistem isteminiz, araç tanımları ve talimat iskelelerinizdir. Bu, genellikle turlar arasında değişmeyen 4.000 ila 10.000 tokendir.
Somut örnek. Yardımcınızın 6.000 tokenlık bir sistem istemi kullandığını ve günde 100.000 sohbet turunu ele aldığını varsayalım, ortalama kullanıcı mesajı 200 giriş tokenı ve ortalama yanıt 800 çıkış tokenıdır.
- Önbellek isabetleri olmadan: 100.000 tur × 6.200 giriş tokenı × 0,435 $ / 1.000.000 = Giriş için günde yalnızca 269,70 $.
- Bu sistem istemi tokenlarının %90'ının önbelleğe isabet etmesiyle: aynı 100.000 tur, milyon token başına 200 × 0,435 $ artı 6.000 × (0,9 × 0,003625 $ + 0,1 × 0,435 $) öder. Bu da günde yaklaşık 32 $ eder. Giriş maliyetinde %88'lik bir azalma.
Bu bir yuvarlama hatası değil. Modelin sürdürülebilir bir gider kalemi olması ile lüks bir kalem olması arasındaki farktır. Sağlayıcılar arasında önek önbelleklemesinin nasıl çalıştığı hakkında daha fazla bilgi için istem önbellekleme derinlemesine analizimiz mekaniği anlatır.
Gerçek ajanlarda önbellek isabeti almak için üç desen:
- Öneki sabitleyin. Sistem istemini, araç şemalarını ve birkaç örnek örneği her isteğin başında tek bir blokta tutun. Oturum özgü metni öneke karıştırmayın.
- Dinamik bağlamı sıralayın veya hashleyin. Getirilen öbekleri eklerseniz, bunları istikrarlı bir şekilde sıralayın veya isteği hashleyip aynı hashleri aynı düğüme yönlendirin. Küçük parmak izi kaymaları önbelleği öldürür.
- Bir ısınma çağrısı çalıştırın. Ajan başlatılırken, kullanıcı trafiği gelmeden önce tam önek ile bir istek göndererek sağlayıcının önbelleğine yerleşmesini sağlayın.
Bu hafta ne yapmalısınız?
Geçiş kararı ikili değildir. Hangi tür LLM iş yükünü çalıştırdığınıza bağlıdır. Beş adımlı bir çerçeve:
1. Mevcut çıkış:giriş oranınızı ölçün. Token bütçenizin %80'ini çıkışa (herhangi bir ajan, kod üreteci veya içerik aracı) harcıyorsanız, V4-Pro'dan elde edeceğiniz tasarruf büyüktür. %80'ini girişe (uzun belgeler üzerinde RAG) harcıyorsanız, tasarruflar daha küçüktür ancak önbellek isabetleri gerçekleştiğinde hala gerçektir.
2. Gerçek iş yükünüz üzerinde 100 örnekli bir değerlendirme yapın. Genel kıyaslamalara güvenmeyin. Üretim trafiğinizden 100 izleme çekin, bunları V4-Pro ve mevcut modelinize aynı istemlerle karşılaştırın ve kendi değerlendiricinizle puanlayın. Çoğu ekip, V4-Pro'nun trafiklerinin %70 ila %85'i için "yeterince iyi" olduğunu bulmaktadır.
3. Rotaya göre desen eşleştirin. Trafiğin %70 ila %85'ini V4-Pro'ya yönlendirin ve premium modelinizi zor kısımda tutun. Bu tek değişiklik, maliyet tasarrufunun %70'inden fazlasını neredeyse sıfır kalite gerilemesiyle sağlar.
4. Önbellek öneklerini kilitleyin. Sistem istemlerinizi denetleyin. İstek başına değişen her şey (zaman damgaları, kullanıcı kimlikleri, oturum kimlikleri) sistem isteminde değil, kullanıcı mesajında olmalıdır. Onu taşıyın.
5. Göndermeden önce regresyon testleri kurun. İşte Apidog'un faydası burada ortaya çıkıyor. Mevcut modelinizden altın yanıtları kaydedin, ardından aynı istekleri V4-Pro'ya karşı yeniden oynatın ve çıktıları karşılaştırın. Apidog'un JSON şema doğrulaması, araç çağrısı şekillerindeki kaymaları üretime ulaşmadan önce yakalar. Apidog'u indirin, OpenAI uyumlu koleksiyonunuzu içe aktarın, temel URL'yi https://api.deepseek.com olarak değiştirin ve on dakikadan kısa sürede yan yana bir duman testi çalıştırabilirsiniz.
V4-Pro uç nokta şeklinin uygulamalı bir incelemesi için DeepSeek V4 API Nasıl Kullanılır başlıklı makaleye bakın.
V4-Pro, diğer 2026 fiyat düşüşlerine karşı nasıl duruyor?
DeepSeek fiyatları düşüren tek laboratuvar değil. 2026 LLM pazarı net bir kar marjı sıkışması aşamasındadır:
- OpenAI O3 bu yılın başlarında %80 düştü. Hesaplama için O3 fiyatlandırma dökümümüze bakın.
- Kimi K2, DeepSeek'in V3 katmanıyla rekabet etmek için agresif bir şekilde fiyatları yeniden belirledi. Kimi K2 API fiyatlandırması detayları kapsar.
- Anthropic Claude, Opus fiyatlandırmasını sürdürdü ancak daha ucuz Haiku ve Sonnet katmanlarını tanıttı. Tam Claude API maliyet dökümü, her katmanın nereye oturduğunu anlatır.
V4-Pro'nun indirimi yılın en agresif olanıdır çünkü bütçe katmanını değil, öncü yetenek bandını hedef alıyor. Bu duyurunun piyasayı sıfırlamasının, diğerlerinin yapmamasının nedeni budur.
Maliyet hesaplaması değişti
DeepSeek fiyatı düşürmedi. Eğriyi yeniden çizdiler. Dolar altı çıkış fiyatlandırmasında öncü yetenek artık bir sapma değil, temel bir referans noktasıdır ve piyasanın geri kalanı buna tepki verecektir. Eğer bir LLM özelliğini maliyet gerekçesiyle erteliyorsanız, geçen çeyrekte fiyatlandırdığınız 2026 bütçeniz muhtemelen ihtiyaçlarınızı 4 kat abartmıştır.
Üç sonraki adım:
- En iyi üç LLM iş yükünüzü yukarıdaki çerçeveye göre denetleyin ve bu hafta geçiş yapmak için birini seçin.
- Önbellek öneklerinizi kilitleyin. Hangi modeli kullanırsanız kullanın, bu ucuz bir kazançtır.
- Bir Apidog regresyon paketi hazırlayın, böylece bir sonraki fiyat indirimi, ki mutlaka olacak, haftalar yerine saatler içinde değerlendirilebilir.
Promosyon bayrağı kalktı. İndirim kalkmadı.
