DeepSeek, 23 Nisan 2026'da V4'ü piyasaya sürdü ve bu, küçük bir sürüm güncellemesi değil. Hangzhou laboratuvarı, dört kontrol noktasını aynı anda yayınladı; başında 1.6 trilyon toplam parametreye, MIT lisansına ve 1 milyon token bağlam penceresine sahip DeepSeek-V4-Pro geliyordu. Daha küçük kardeşi DeepSeek-V4-Flash ise 284 milyar parametreye, aynı bağlama ve aynı açık ağırlıklara sahip. Kıyaslama testleri, Pro varyantını LiveCodeBench ve Codeforces'ta Claude Opus 4.6'nın önüne koyuyor ve MMLU-Pro'da GPT-5.4 xHigh'a yakın bir konumda.
Claude, GPT-5.5 veya Qwen'i DeepSeek V4 ile değiştirmeye karar veriyorsanız, bu rehber modelin ne olduğunu, V3.2'den nelerin değiştiğini, kıyaslama hikayesini yönlendiren mimari seçimleri ve bugün nerede çalıştırılacağını kapsar.
İlgili geliştirici rehberleri için, bir DeepSeek V4 API rehberi, bir ücretsiz erişim rehberi ve tam bir DeepSeek V4 kullanım rehberi sunuyoruz. İstek formatı OpenAI'ın formatına sorunsuz bir şekilde uyuyor, böylece bir anahtar gelen kutunuza düşmeden önce Apidog'da koleksiyonu önceden oluşturabilirsiniz.
ÖZET
- DeepSeek V4, 23 Nisan 2026'da MIT lisansı altında yayınlanan bir Uzmanlar Karışımı (Mixture-of-Experts) ailesidir.
- Lansmanla birlikte dört kontrol noktası sunuluyor: V4-Pro, V4-Pro-Base, V4-Flash ve V4-Flash-Base.
- V4-Pro, 1.6T toplam parametreye ve 49B aktif parametreye sahipken; V4-Flash 284B toplam parametreye ve 13B aktif parametreye sahiptir.
- Her iki varyant da 1M token bağlam penceresi ve üç muhakeme moduna sahiptir: Düşünmesiz (Non-Think), Yüksek Düşünme (Think High) ve Maksimum Düşünme (Think Max).
- Manşet skorları: LiveCodeBench 93.5, Codeforces 3206, MMLU-Pro 87.5 (Pro varyantı).
- API,
api.deepseek.comadresindedeepseek-v4-provedeepseek-v4-flashmodel ID'leri ile canlıdır; ağırlıklar Hugging Face ve ModelScope'da mevcuttur.
DeepSeek V4 aslında nedir?
DeepSeek V4, geçen yıl laboratuvarı tanınır hale getiren V3 ve V3.2 serilerinin halefidir. Mimari hala Uzmanlar Karışımı (Mixture-of-Experts) olsa da, modelin şekli değişti. V4-Pro, 1.6 trilyon parametresinden token başına yalnızca 49 milyarını etkinleştiriyor, bu nedenle token başına hesaplama maliyeti, trilyon parametreli bir sınır sisteminden ziyade 50 milyar yoğun bir modele daha yakın görünüyor. Tüm teknik raporu DeepSeek V4 model kartında okuyun.

Lansmanla birlikte dört kontrol noktası sunuluyor:
- DeepSeek-V4-Pro — amiral gemisi. Toplam 1.6T, aktif 49B, 1M bağlam. Çoğu ekibin API aracılığıyla çağıracağı model budur.
- DeepSeek-V4-Pro-Base — önceden eğitilmiş, eğitim sonrası aşama olmayan temel. Araştırmacılara ve özel ince ayarlar (fine-tune) yapan ekiplere yöneliktir.
- DeepSeek-V4-Flash — verimlilik varyantı. Toplam 284B, aktif 13B, aynı 1M bağlam. Gecikmeye duyarlı iş yüklerini ve iki veya üç H100 üzerinde yerel dağıtımı hedefler.
- DeepSeek-V4-Flash-Base — Flash için eşleşen temel kontrol noktası.
Dördü de MIT lisansı altında yayınlanıyor, ki bu da önemli bir detay. GPT-5.5 kapalı kaynaklıdır ve milyon giriş tokenı başına 5 dolara mal olur; Claude Opus 4.6 kapalı kaynaklıdır ve fiyatları 15 dolara yakındır. DeepSeek V4-Pro, lisans ücreti ödemeden kendi donanımınızda indirebileceğiniz, yansıtabileceğiniz, ince ayar yapabileceğiniz ve dağıtabileceğiniz açık ağırlıklara sahiptir.
V3.2'den neler değişti?
V3 zaten muhakeme ve kodlama konusunda rekabetçiydi. V4, aynı anda uzun bağlamı ve verimliliği artırmak için dikkat katmanını ve eğitim hattını yeniden yazıyor.
| Yetkinlik | V3.2 | V4-Pro |
|---|---|---|
| Toplam parametre | 685B | 1.6T |
| Aktif parametreler | 37B | 49B |
| Bağlam penceresi | 128K | 1M |
| Çıkarım FLOP'ları (1M bağlam) | temel | %27 (V3.2'nin) |
| KV önbelleği (1M bağlam) | temel | %10 (V3.2'nin) |
| Hassasiyet | FP8 | FP4 + FP8 karışık |
| Lisans | DeepSeek Lisansı | MIT |
| Muhakeme modları | tek | üç |
Sıçramayı üç şey tetikliyor. İlk olarak, Sıkıştırılmış Seyrek Dikkat (Compressed Sparse Attention) ile Yoğun Sıkıştırılmış Dikkat (Heavily Compressed Attention) birleştiren yeni bir hibrit dikkat katmanı; %10'luk KV önbellek sayısı buradan geliyor. İkincisi, V4'ün ihtiyaç duyduğu derinlikte gradyanları stabilize eden Manifold Kısıtlı Hiper Bağlantılar. Üçüncüsü, daha hızlı yakınsama için Muon iyileştiricisine geçiş. Eğitim veri kümesi de 32 trilyon tokenı aştı ve eğitim sonrası, önce alana özgü uzmanları yetiştiren, ardından bunları politika tabanlı damıtma (on-policy distillation) ile pekiştiren iki aşamalı bir pipeline kullanır.

Önemli kıyaslama testleri
DeepSeek'in raporladığı sayılar, V4-Pro'yu kodlama ve bilgi alanında öncülerin arasına yerleştiriyor, uzun bağlamlı erişimde ise boşluklar bulunuyor.

Daha küçük varyant olan V4-Flash için DeepSeek şunları rapor ediyor: MMLU-Pro 86.2, GPQA Diamond 88.1, LiveCodeBench 91.6, Codeforces 3052 ve SWE Verified 79.0. Bu, 13B aktif parametreli bir model için öncü bir bölge ve Flash'ın kendi donanımında dağıtım yapacak herkes için ilginç bir kontrol noktası olmasının nedeni de budur. Tam tablo için DeepSeek V4-Flash kartına bakın.
Dürüst değerlendirme: V4-Pro kodlamada, açık uçlu olgusal hatırlamada önde, genel bilgide Gemini 3.1 Pro'nun gerisinde ve 1 milyon tokenlık erişim kıyaslama testlerinde Claude Opus'un gerisinde kalıyor. İş yükünüz ajan tabanlı kodlama veya muhakeme ağırlıklı analiz ise, V4-Pro değerlendirilmeye değerdir. Eğer milyonlarca token arasında iğne aramak gibi bir erişim görevi ise, Claude hala avantajlıdır.
Üç muhakeme modu
Her V4 kontrol noktası üç muhakeme çabası sunar ve doğru olanı seçmek en büyük maliyet kaldıraçıdır.
- Düşünmesiz (Non-Think) — hızlı yol. Tek geçişli üretim, düşünce zinciri yok, ek muhakeme tokenları yok. Sınıflandırma, yönlendirme, kısa özetler ve doğruluğun gecikmeden daha önemli olduğu her şey için kullanın.
- Yüksek Düşünme (Think High) — zorlu işler için varsayılan. Model, cevaptan önce muhakeme tokenları yazar, araç çağrılarını planlar ve çıktısını kontrol eder. GPT-5.5'in "düşünme modu" dediği ve Claude'un "genişletilmiş düşünme" dediği şeye karşılık gelir.
- Maksimum Düşünme (Think Max) — tavan. Daha uzun muhakeme izleri, daha agresif öz-eleştiri ve minimum 384K token bağlam penceresi önerisi. 93.5 LiveCodeBench skorunu üreten budur; token maliyetinde de buna uygun bir artış bekleyin.
API'da tek bir thinking_mode parametresiyle veya yerel çıkarım betiğinde bir işaretçiyle aralarında geçiş yapın. DeepSeek'in örnekleme önerisi üç mod için de temperature=1.0, top_p=1.0 şeklindedir.
Mimari açık bir dille
V4 mimarisi makalesi yoğundur, ancak üç seçim verimlilik hikayesini açıklıyor.
- Hibrit dikkat (Hybrid attention). Çoğu transformatör katmanı, yüksek değerli tokenların küçük bir havuzuna tamamen dikkat eden ve geri kalanını sıkıştıran Sıkıştırılmış Seyrek Dikkat (Compressed Sparse Attention) kullanır. Birkaç katman ise dizilim uzunluğunda doğrusal maliyete daha yakın olan Yoğun Sıkıştırılmış Dikkat (Heavily Compressed Attention) kullanır. Bu karışım, 1 milyon tokende %27 FLOP ve %10 KV önbellek sayılarını sağlar.
- Manifold Kısıtlı Hiper Bağlantılar (Manifold-Constrained Hyper-Connections). Basit artık bağlantılar yerine, V4 her katmanın artıklarını, aktivasyonları sabit bir manifold üzerinde tutan bir kısıtlama ile sarar. Pratik etkisi, gradyan kaosuna yol açmadan daha fazla katman istifleyebilmenizdir.
- Muon iyileştirici (Muon optimizer). Eğitimin çoğu için AdamW'nin yerini alır. Muon daha hızlı yakınsar ve Uzmanlar Karışımı (MoE) modellerinin ürettiği büyük gradyan normlarını AdamW'den daha iyi yönetir.
Bu fikirlerin hiçbiri kendi başına yepyeni değil. V4'ün katkısı, bu üçünü trilyon parametre ölçeğinde, eğitimi patlatmadan bir arada çalıştırmaktır.
Bugünkü erişilebilirlik
DeepSeek, dört kontrol noktasını ve API'yi aynı gün başlattı. 24 Nisan 2026 itibarıyla durumun özeti aşağıdadır.
| Platform | Erişim |
|---|---|
| chat.deepseek.com | Ücretsiz web sohbeti, V4-Pro varsayılan, oturum açma gerekli |
| DeepSeek API | api.deepseek.com adresinde canlı; model ID'leri deepseek-v4-pro, deepseek-v4-flash |
| Hugging Face ağırlıkları | V4-Pro, V4-Flash, her ikisi de MIT |
| ModelScope | Çin'deki kullanıcılar için yansıtılmış ağırlıklar |
| OpenRouter ve toplayıcılar | Birkaç gün içinde bekleniyor; tipik DeepSeek lansman modeli |
deepseek-chat / deepseek-reasoner |
24 Temmuz 2026'da kullanımdan kaldırılacak |
Kullanımdan kaldırma bildirimine dikkat etmekte fayda var. Eğer hala üretimde deepseek-chat kullanıyorsanız, deepseek-v4-pro veya deepseek-v4-flash'e geçmek için üç ayınız var.
GPT-5.5 ve Claude ile nasıl karşılaştırılır?
Çoğu ekibin gerçekten önem verdiği üç yönlü karşılaştırma:
- Maliyet. V4-Pro ve V4-Flash açık ağırlıklara sahiptir. GPT-5.5 ve Claude Opus 4.6 ise yoktur. Kendi başınıza barındırabiliyorsanız, V4 herhangi bir ciddi ölçekte birim ekonomisi açısından kazanır.
- Kodlama. V4-Pro'nun LiveCodeBench'te 93.5 ve Codeforces'ta 3206'lık skorları, aynı süitlerde hem GPT-5.5 kıyaslama çizgisini hem de Claude Opus'u geride bırakıyor.
- Bilgi genişliği. Gemini 3.1 Pro, MMLU-Pro'da hala 91.0 ile önde. GPT-5.5 ve V4-Pro 87.5 ile berabere. SimpleQA-Verified'da V4, GPT-5.5 ve Claude'u çift haneli sayılarla geride bırakıyor.
- Uzun bağlam erişimi. Claude Opus, MRCR 1M'yi yaklaşık 9 puanla kazanıyor. Eğer iş yükünüz "milyonlarca token arasında tek bir cümleyi bulmak" ise, Claude hala daha güvenli bir seçenektir.
- Lisans. MIT, V4-Pro'yu bir kullanım sözleşmesi olmadan bir ürün içinde dağıtabileceğiniz anlamına gelir. OpenAI veya Anthropic'in sunduğu hiçbir şey bunu karşılamaz.
Onunla ne inşa etmeli?
Dört iş yükü V4'ün güçlü yönleriyle uyumlu:
- Ajan tabanlı kodlama döngüleri. SWE Verified 79.0 ve Codeforces 3206 sayıları, çoklu dosya hata ayıklama, repo farkındalıklı yeniden düzenlemeler ve otonom test düzeltmelerine doğrudan işaret ediyor. İstekleri ayarlarken her isteği ve yanıtı incelemek için Apidog gibi iyi bir API istemcisiyle eşleştirin.
- Uzun belgeler üzerinde muhakeme. 1 milyon token çoğu monorepo, çoğu sözleşme ve çoğu araştırma veri kümesi için yeterlidir. Bunun için Yüksek Düşünme (Think High) doğru moddur.
- Kendi kendine barındırılan yapay zeka ürünleri. Uyumluluk hikayeniz yerinde çıkarım gerektiriyorsa, V4-Flash, kapalı kaynaklı öncü API'lerle kalite açısından rekabet eden ilk açık ağırlıklı modeldir.
- Araştırma ve ince ayar (fine-tuning). Temel kontrol noktaları özellikle özel eğitim için mevcuttur. Bunları bir alan veri kümesiyle eşleştirin ve üretim seviyesinde uzman modellere ulaşırsınız.
Uygun olmadığı yerler: yüksek hacimli sınıflandırma, embedding (gömme) erişimi veya kısa istemli sohbet. V4-Flash bunlar için hala aşırıdır ve daha eski DeepSeek kontrol noktaları daha az maliyetlidir.
Tek satırda fiyatlandırma
DeepSeek, bu yazının yazıldığı sırada nihai API fiyat listesini yayınlamamıştı. V3.2, yaklaşık olarak milyon giriş tokenı başına 0.28$ ve milyon çıkış tokenı başına 0.42$ ile çalışıyordu ve laboratuvarın V serisi fiyatlandırmasını bu tabana yakın tutma geçmişi var. V4-Flash'i aynı aralıkta ve V4-Pro'yu mütevazı bir primle bekleyin. Kapalı kaynaklı rakipler, milyon giriş tokenı başına 5$ ila 15$ fiyat belirler, bu nedenle V3.2'den 3 katlık bir artış bile DeepSeek'i öncü API medyanının çok altında bırakır. Canlı rakamları DeepSeek fiyatlandırma sayfasından takip edin.
V4'ü bugün nasıl test edebilirsiniz?
İlk tokena kadar geçen süreye göre sıralanmış üç yol.
- Web sohbeti. chat.deepseek.com adresini açın ve oturum açın. V4-Pro varsayılan modeldir; kullanıcı arayüzünde Yüksek Düşünme (Think High) moduna geçin. Ücretsiz, kart gerektirmez, şimdi çalışıyor.
- API. Bir anahtar alın, istemcinizi
https://api.deepseek.comadresine yönlendirin,"model": "deepseek-v4-pro"olarak ayarlayın ve başlayın. İstek formatı OpenAI ile uyumludur, bu nedenle mevcut herhangi bir OpenAI istemcisi temel URL'yi değiştirerek çalışır. Tam rehber için DeepSeek V4 API rehberine bakın. - Yerel ağırlıklar. Hugging Face veya ModelScope'dan çekin. V4-Flash 2 ila 4 H100 üzerinde çalışır; V4-Pro ciddi bir küme gerektirir. Çıkarım kodu, model deposunun
/inferenceklasöründe bulunur.
Apidog tabanlı istem tekrarlaması da dahil olmak üzere tam rehber için DeepSeek V4 nasıl kullanılır bölümüne bakın. Harcamayı sıfırda tutmak için DeepSeek V4'ü ücretsiz nasıl kullanacağınızı görün. Apidog'u indirin ve koleksiyonunuzu önceden oluşturun; OpenAI uyumlu format, tek bir isteğin DeepSeek, OpenAI ve diğer tüm öncü API'lerde çalıştığı anlamına gelir.
Sıkça Sorulan Sorular
DeepSeek V4 gerçekten açık kaynaklı mı?Evet. Dört kontrol noktasının tamamı, ayrı bir kullanım sözleşmesi olmaksızın ticari kullanıma, değiştirmeye ve yeniden dağıtıma izin veren bir MIT lisansı taşır.
V4-Flash'i çalıştırmak için bir GPU kümesine ihtiyacım var mı?Tam hassasiyette V4-Flash için iki ila dört H100 veya H200'e ihtiyacınız var, eğer niceleme (quantize) yaparsanız daha azına. V4-Pro gerçek bir küme gerektirir. V4'ü donanım olmadan denemek isterseniz, API'yi veya chat.deepseek.com'u kullanın.
V4, DeepSeek API'sine ne zaman gelecek?23 Nisan 2026 itibarıyla zaten canlıdır. Model ID'leri deepseek-v4-pro ve deepseek-v4-flash'tir. Daha eski deepseek-chat ve deepseek-reasoner ID'leri 24 Temmuz 2026'da kullanımdan kaldırılacaktır.
V4, Kimi ve Qwen ile nasıl karşılaştırılır?DeepSeek'in raporladığı tablolarda V4-Pro, Kimi K2 ve Qwen 3 Max'ten daha yüksek LiveCodeBench ve Codeforces sayıları gösteriyor. Üçü de benzer dağıtım profillerine sahip açık ağırlıklı MoE sistemleridir. İş yükünüze en yakın kıyaslama testine göre seçim yapın.
V4'ü kendi verilerim üzerinde ince ayar yapabilir miyim?Evet. Temel kontrol noktaları bunun için mevcuttur; bunları alan verilerinizle ve standart bir SFT pipeline'ı ile eşleştirin. MIT lisansı, ortaya çıkan modelin ticari yeniden dağıtımını kapsar.
V4, mevcut OpenAI uyumlu araçlarımla çalışacak mı?Evet. API, OpenAI ve Anthropic mesaj formatlarını sırasıyla https://api.deepseek.com ve https://api.deepseek.com/anthropic adreslerinde kabul eder. Mevcut OpenAI istemcilerinin çoğu, tek bir temel URL değişikliğiyle çalışır. Paralel desen için ilgili GPT-5.5 API rehberine bakın.
