DeepSeek V4 Nedir?

Ashley Innocent

Ashley Innocent

24 April 2026

DeepSeek V4 Nedir?

Kurumsal Apidog

Şirket İçi Dağıtım

SSO & RBAC

SOC 2 Uyumlu

Apidog Enterprise'ı Keşfet

DeepSeek, 23 Nisan 2026'da V4'ü piyasaya sürdü ve bu, küçük bir sürüm güncellemesi değil. Hangzhou laboratuvarı, dört kontrol noktasını aynı anda yayınladı; başında 1.6 trilyon toplam parametreye, MIT lisansına ve 1 milyon token bağlam penceresine sahip DeepSeek-V4-Pro geliyordu. Daha küçük kardeşi DeepSeek-V4-Flash ise 284 milyar parametreye, aynı bağlama ve aynı açık ağırlıklara sahip. Kıyaslama testleri, Pro varyantını LiveCodeBench ve Codeforces'ta Claude Opus 4.6'nın önüne koyuyor ve MMLU-Pro'da GPT-5.4 xHigh'a yakın bir konumda.

Claude, GPT-5.5 veya Qwen'i DeepSeek V4 ile değiştirmeye karar veriyorsanız, bu rehber modelin ne olduğunu, V3.2'den nelerin değiştiğini, kıyaslama hikayesini yönlendiren mimari seçimleri ve bugün nerede çalıştırılacağını kapsar.

İlgili geliştirici rehberleri için, bir DeepSeek V4 API rehberi, bir ücretsiz erişim rehberi ve tam bir DeepSeek V4 kullanım rehberi sunuyoruz. İstek formatı OpenAI'ın formatına sorunsuz bir şekilde uyuyor, böylece bir anahtar gelen kutunuza düşmeden önce Apidog'da koleksiyonu önceden oluşturabilirsiniz.

Düğme

ÖZET

DeepSeek V4 aslında nedir?

DeepSeek V4, geçen yıl laboratuvarı tanınır hale getiren V3 ve V3.2 serilerinin halefidir. Mimari hala Uzmanlar Karışımı (Mixture-of-Experts) olsa da, modelin şekli değişti. V4-Pro, 1.6 trilyon parametresinden token başına yalnızca 49 milyarını etkinleştiriyor, bu nedenle token başına hesaplama maliyeti, trilyon parametreli bir sınır sisteminden ziyade 50 milyar yoğun bir modele daha yakın görünüyor. Tüm teknik raporu DeepSeek V4 model kartında okuyun.

Lansmanla birlikte dört kontrol noktası sunuluyor:

Dördü de MIT lisansı altında yayınlanıyor, ki bu da önemli bir detay. GPT-5.5 kapalı kaynaklıdır ve milyon giriş tokenı başına 5 dolara mal olur; Claude Opus 4.6 kapalı kaynaklıdır ve fiyatları 15 dolara yakındır. DeepSeek V4-Pro, lisans ücreti ödemeden kendi donanımınızda indirebileceğiniz, yansıtabileceğiniz, ince ayar yapabileceğiniz ve dağıtabileceğiniz açık ağırlıklara sahiptir.

V3.2'den neler değişti?

V3 zaten muhakeme ve kodlama konusunda rekabetçiydi. V4, aynı anda uzun bağlamı ve verimliliği artırmak için dikkat katmanını ve eğitim hattını yeniden yazıyor.

Yetkinlik V3.2 V4-Pro
Toplam parametre 685B 1.6T
Aktif parametreler 37B 49B
Bağlam penceresi 128K 1M
Çıkarım FLOP'ları (1M bağlam) temel %27 (V3.2'nin)
KV önbelleği (1M bağlam) temel %10 (V3.2'nin)
Hassasiyet FP8 FP4 + FP8 karışık
Lisans DeepSeek Lisansı MIT
Muhakeme modları tek üç

Sıçramayı üç şey tetikliyor. İlk olarak, Sıkıştırılmış Seyrek Dikkat (Compressed Sparse Attention) ile Yoğun Sıkıştırılmış Dikkat (Heavily Compressed Attention) birleştiren yeni bir hibrit dikkat katmanı; %10'luk KV önbellek sayısı buradan geliyor. İkincisi, V4'ün ihtiyaç duyduğu derinlikte gradyanları stabilize eden Manifold Kısıtlı Hiper Bağlantılar. Üçüncüsü, daha hızlı yakınsama için Muon iyileştiricisine geçiş. Eğitim veri kümesi de 32 trilyon tokenı aştı ve eğitim sonrası, önce alana özgü uzmanları yetiştiren, ardından bunları politika tabanlı damıtma (on-policy distillation) ile pekiştiren iki aşamalı bir pipeline kullanır.

Önemli kıyaslama testleri

DeepSeek'in raporladığı sayılar, V4-Pro'yu kodlama ve bilgi alanında öncülerin arasına yerleştiriyor, uzun bağlamlı erişimde ise boşluklar bulunuyor.

Daha küçük varyant olan V4-Flash için DeepSeek şunları rapor ediyor: MMLU-Pro 86.2, GPQA Diamond 88.1, LiveCodeBench 91.6, Codeforces 3052 ve SWE Verified 79.0. Bu, 13B aktif parametreli bir model için öncü bir bölge ve Flash'ın kendi donanımında dağıtım yapacak herkes için ilginç bir kontrol noktası olmasının nedeni de budur. Tam tablo için DeepSeek V4-Flash kartına bakın.

Dürüst değerlendirme: V4-Pro kodlamada, açık uçlu olgusal hatırlamada önde, genel bilgide Gemini 3.1 Pro'nun gerisinde ve 1 milyon tokenlık erişim kıyaslama testlerinde Claude Opus'un gerisinde kalıyor. İş yükünüz ajan tabanlı kodlama veya muhakeme ağırlıklı analiz ise, V4-Pro değerlendirilmeye değerdir. Eğer milyonlarca token arasında iğne aramak gibi bir erişim görevi ise, Claude hala avantajlıdır.

Üç muhakeme modu

Her V4 kontrol noktası üç muhakeme çabası sunar ve doğru olanı seçmek en büyük maliyet kaldıraçıdır.

API'da tek bir thinking_mode parametresiyle veya yerel çıkarım betiğinde bir işaretçiyle aralarında geçiş yapın. DeepSeek'in örnekleme önerisi üç mod için de temperature=1.0, top_p=1.0 şeklindedir.

Mimari açık bir dille

V4 mimarisi makalesi yoğundur, ancak üç seçim verimlilik hikayesini açıklıyor.

  1. Hibrit dikkat (Hybrid attention). Çoğu transformatör katmanı, yüksek değerli tokenların küçük bir havuzuna tamamen dikkat eden ve geri kalanını sıkıştıran Sıkıştırılmış Seyrek Dikkat (Compressed Sparse Attention) kullanır. Birkaç katman ise dizilim uzunluğunda doğrusal maliyete daha yakın olan Yoğun Sıkıştırılmış Dikkat (Heavily Compressed Attention) kullanır. Bu karışım, 1 milyon tokende %27 FLOP ve %10 KV önbellek sayılarını sağlar.
  2. Manifold Kısıtlı Hiper Bağlantılar (Manifold-Constrained Hyper-Connections). Basit artık bağlantılar yerine, V4 her katmanın artıklarını, aktivasyonları sabit bir manifold üzerinde tutan bir kısıtlama ile sarar. Pratik etkisi, gradyan kaosuna yol açmadan daha fazla katman istifleyebilmenizdir.
  3. Muon iyileştirici (Muon optimizer). Eğitimin çoğu için AdamW'nin yerini alır. Muon daha hızlı yakınsar ve Uzmanlar Karışımı (MoE) modellerinin ürettiği büyük gradyan normlarını AdamW'den daha iyi yönetir.

Bu fikirlerin hiçbiri kendi başına yepyeni değil. V4'ün katkısı, bu üçünü trilyon parametre ölçeğinde, eğitimi patlatmadan bir arada çalıştırmaktır.

Bugünkü erişilebilirlik

DeepSeek, dört kontrol noktasını ve API'yi aynı gün başlattı. 24 Nisan 2026 itibarıyla durumun özeti aşağıdadır.

Platform Erişim
chat.deepseek.com Ücretsiz web sohbeti, V4-Pro varsayılan, oturum açma gerekli
DeepSeek API api.deepseek.com adresinde canlı; model ID'leri deepseek-v4-pro, deepseek-v4-flash
Hugging Face ağırlıkları V4-Pro, V4-Flash, her ikisi de MIT
ModelScope Çin'deki kullanıcılar için yansıtılmış ağırlıklar
OpenRouter ve toplayıcılar Birkaç gün içinde bekleniyor; tipik DeepSeek lansman modeli
deepseek-chat / deepseek-reasoner 24 Temmuz 2026'da kullanımdan kaldırılacak

Kullanımdan kaldırma bildirimine dikkat etmekte fayda var. Eğer hala üretimde deepseek-chat kullanıyorsanız, deepseek-v4-pro veya deepseek-v4-flash'e geçmek için üç ayınız var.

GPT-5.5 ve Claude ile nasıl karşılaştırılır?

Çoğu ekibin gerçekten önem verdiği üç yönlü karşılaştırma:

Onunla ne inşa etmeli?

Dört iş yükü V4'ün güçlü yönleriyle uyumlu:

  1. Ajan tabanlı kodlama döngüleri. SWE Verified 79.0 ve Codeforces 3206 sayıları, çoklu dosya hata ayıklama, repo farkındalıklı yeniden düzenlemeler ve otonom test düzeltmelerine doğrudan işaret ediyor. İstekleri ayarlarken her isteği ve yanıtı incelemek için Apidog gibi iyi bir API istemcisiyle eşleştirin.
  2. Uzun belgeler üzerinde muhakeme. 1 milyon token çoğu monorepo, çoğu sözleşme ve çoğu araştırma veri kümesi için yeterlidir. Bunun için Yüksek Düşünme (Think High) doğru moddur.
  3. Kendi kendine barındırılan yapay zeka ürünleri. Uyumluluk hikayeniz yerinde çıkarım gerektiriyorsa, V4-Flash, kapalı kaynaklı öncü API'lerle kalite açısından rekabet eden ilk açık ağırlıklı modeldir.
  4. Araştırma ve ince ayar (fine-tuning). Temel kontrol noktaları özellikle özel eğitim için mevcuttur. Bunları bir alan veri kümesiyle eşleştirin ve üretim seviyesinde uzman modellere ulaşırsınız.

Uygun olmadığı yerler: yüksek hacimli sınıflandırma, embedding (gömme) erişimi veya kısa istemli sohbet. V4-Flash bunlar için hala aşırıdır ve daha eski DeepSeek kontrol noktaları daha az maliyetlidir.

Tek satırda fiyatlandırma

DeepSeek, bu yazının yazıldığı sırada nihai API fiyat listesini yayınlamamıştı. V3.2, yaklaşık olarak milyon giriş tokenı başına 0.28$ ve milyon çıkış tokenı başına 0.42$ ile çalışıyordu ve laboratuvarın V serisi fiyatlandırmasını bu tabana yakın tutma geçmişi var. V4-Flash'i aynı aralıkta ve V4-Pro'yu mütevazı bir primle bekleyin. Kapalı kaynaklı rakipler, milyon giriş tokenı başına 5$ ila 15$ fiyat belirler, bu nedenle V3.2'den 3 katlık bir artış bile DeepSeek'i öncü API medyanının çok altında bırakır. Canlı rakamları DeepSeek fiyatlandırma sayfasından takip edin.

V4'ü bugün nasıl test edebilirsiniz?

İlk tokena kadar geçen süreye göre sıralanmış üç yol.

  1. Web sohbeti. chat.deepseek.com adresini açın ve oturum açın. V4-Pro varsayılan modeldir; kullanıcı arayüzünde Yüksek Düşünme (Think High) moduna geçin. Ücretsiz, kart gerektirmez, şimdi çalışıyor.
  2. API. Bir anahtar alın, istemcinizi https://api.deepseek.com adresine yönlendirin, "model": "deepseek-v4-pro" olarak ayarlayın ve başlayın. İstek formatı OpenAI ile uyumludur, bu nedenle mevcut herhangi bir OpenAI istemcisi temel URL'yi değiştirerek çalışır. Tam rehber için DeepSeek V4 API rehberine bakın.
  3. Yerel ağırlıklar. Hugging Face veya ModelScope'dan çekin. V4-Flash 2 ila 4 H100 üzerinde çalışır; V4-Pro ciddi bir küme gerektirir. Çıkarım kodu, model deposunun /inference klasöründe bulunur.

Apidog tabanlı istem tekrarlaması da dahil olmak üzere tam rehber için DeepSeek V4 nasıl kullanılır bölümüne bakın. Harcamayı sıfırda tutmak için DeepSeek V4'ü ücretsiz nasıl kullanacağınızı görün. Apidog'u indirin ve koleksiyonunuzu önceden oluşturun; OpenAI uyumlu format, tek bir isteğin DeepSeek, OpenAI ve diğer tüm öncü API'lerde çalıştığı anlamına gelir.

Sıkça Sorulan Sorular

DeepSeek V4 gerçekten açık kaynaklı mı?Evet. Dört kontrol noktasının tamamı, ayrı bir kullanım sözleşmesi olmaksızın ticari kullanıma, değiştirmeye ve yeniden dağıtıma izin veren bir MIT lisansı taşır.

V4-Flash'i çalıştırmak için bir GPU kümesine ihtiyacım var mı?Tam hassasiyette V4-Flash için iki ila dört H100 veya H200'e ihtiyacınız var, eğer niceleme (quantize) yaparsanız daha azına. V4-Pro gerçek bir küme gerektirir. V4'ü donanım olmadan denemek isterseniz, API'yi veya chat.deepseek.com'u kullanın.

V4, DeepSeek API'sine ne zaman gelecek?23 Nisan 2026 itibarıyla zaten canlıdır. Model ID'leri deepseek-v4-pro ve deepseek-v4-flash'tir. Daha eski deepseek-chat ve deepseek-reasoner ID'leri 24 Temmuz 2026'da kullanımdan kaldırılacaktır.

V4, Kimi ve Qwen ile nasıl karşılaştırılır?DeepSeek'in raporladığı tablolarda V4-Pro, Kimi K2 ve Qwen 3 Max'ten daha yüksek LiveCodeBench ve Codeforces sayıları gösteriyor. Üçü de benzer dağıtım profillerine sahip açık ağırlıklı MoE sistemleridir. İş yükünüze en yakın kıyaslama testine göre seçim yapın.

V4'ü kendi verilerim üzerinde ince ayar yapabilir miyim?Evet. Temel kontrol noktaları bunun için mevcuttur; bunları alan verilerinizle ve standart bir SFT pipeline'ı ile eşleştirin. MIT lisansı, ortaya çıkan modelin ticari yeniden dağıtımını kapsar.

V4, mevcut OpenAI uyumlu araçlarımla çalışacak mı?Evet. API, OpenAI ve Anthropic mesaj formatlarını sırasıyla https://api.deepseek.com ve https://api.deepseek.com/anthropic adreslerinde kabul eder. Mevcut OpenAI istemcilerinin çoğu, tek bir temel URL değişikliğiyle çalışır. Paralel desen için ilgili GPT-5.5 API rehberine bakın.

API Tasarım-Öncelikli Yaklaşımı Apidog'da Uygulayın

API'leri oluşturmanın ve kullanmanın daha kolay yolunu keşfedin