DeepSeek V4, ilk günden itibaren canlı API ile kullanıma sunuldu. Model kimlikleri deepseek-v4-pro ve deepseek-v4-flash, uç nokta OpenAI uyumludur ve temel URL https://api.deepseek.com'dur. Bu, GPT-5.5 veya diğer OpenAI şeklindeki API'lere karşı halihazırda kullandığınız herhangi bir istemcinin, tek bir temel-URL değişikliğiyle V4'e karşı çalışacağı anlamına gelir.

Bu rehber; kimlik doğrulamayı, önemli her parametreyi, Python ve Node örneklerini, düşünme modu matematiğini, araç çağrısını, akışları ve siz yineleme yaparken maliyeti görünür tutan Apidog tabanlı bir iş akışını kapsar.
Ürün düzeyindeki genel bakış için DeepSeek V4 nedir makalesine bakın. Maliyetsiz yol için DeepSeek V4'ü ücretsiz nasıl kullanacağınız konusuna bakın.
TL;DR
- DeepSeek V4,
https://api.deepseek.com/v1/chat/completionsadresindeki OpenAI uyumlu uç noktada vehttps://api.deepseek.com/anthropicadresindeki Anthropic uyumlu uç noktada sunulur. - Model Kimlikleri:
deepseek-v4-pro(toplam 1.6T, aktif 49B) vedeepseek-v4-flash(toplam 284B, aktif 13B). - Her iki varyant da 1M token bağlamını ve üç akıl yürütme modunu destekler:
non-thinking,thinking,thinking_max. - DeepSeek'in önerdiği gibi
temperature=1.0, top_p=1.0kullanın; GPT-5.5 veya Claude varsayılanlarını içe aktarmayın. - Eski kimlikler
deepseek-chatvedeepseek-reasoner24 Temmuz 2026 tarihinde kullanımdan kaldırılacaktır; bu tarihten önce geçiş yapın. - İstekleri tekrarlamak, düşünme modlarını karşılaştırmak ve anahtarı kabuk geçmişinizden uzak tutmak için Apidog'u indirin.

Önkoşullar
İlk istekten önce dört şeyi hazırlayın.
- En az 2 dolarlık bir ödeme yapmış, platform.deepseek.com adresinde bir DeepSeek geliştirici hesabı. Bakiyeniz yoksa, çağrılar
402 Yetersiz Bakiyedöndürür. - Faturalandıracağınız proje için kapsamlandırılmış bir API anahtarı. Proje kapsamlı anahtarlar, üretim ortamında hesap anahtarlarından daha güvenlidir.
- OpenAI uyumlu bir temel URL'yi kullanabilen bir SDK. Python
openai>=1.30.0ve Nodeopenai@4.xher ikisi de değişiklik yapmadan çalışır. - Terminali spam'lemeden istekleri tekrarlayabilen bir API istemcisi. Curl tek bir çağrı için çalışır; sonrasında Apidog kullanın.
Anahtarı bir kez dışa aktarın:
export DEEPSEEK_API_KEY="sk-..."
Uç nokta ve kimlik doğrulama
İki temel URL, iki istek şeklini kapsar.
POST https://api.deepseek.com/v1/chat/completions # OpenAI formatı
POST https://api.deepseek.com/anthropic/v1/messages # Anthropic formatı
Mevcut bir Anthropic şekilli kod tabanınız yoksa OpenAI uyumlu olanı seçin. Bu rehberin geri kalanı OpenAI formatını kullanır.
Kimlik doğrulama, standart Authorization başlığında bir taşıyıcı (bearer) tokendir. Minimum geçerli istek:
curl https://api.deepseek.com/v1/chat/completions \
-H "Authorization: Bearer $DEEPSEEK_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v4-pro",
"messages": [
{"role": "user", "content": "MoE yönlendirmesini iki cümlede açıklayın."}
]
}'
Başarılı yanıtlar, bir choices dizisi, girdi ve çıktı token'larına (ve düşünme modu açıksa reasoning_tokens'a) ayrılmış bir usage bloğu ve izleme için kullanabileceğiniz bir id içeren bir JSON gövdesi döndürür. Hatalar, error.code ve error.message içeren standart OpenAI zarfını döndürür.
İstek parametreleri
Her alan maliyet veya davranışla eşleşir. İşte deepseek-v4-pro ve deepseek-v4-flash için harita.
| Parametre | Tür | Değerler | Notlar |
|---|---|---|---|
model |
string | deepseek-v4-pro, deepseek-v4-flash |
Zorunlu. |
messages |
array | rol/içerik çiftleri | Zorunlu. OpenAI ile aynı şema. |
thinking_mode |
string | non-thinking, thinking, thinking_max |
Varsayılan non-thinking. |
temperature |
float | 0 ila 2 | DeepSeek 1.0 öneriyor. |
top_p |
float | 0 ila 1 | DeepSeek 1.0 öneriyor. |
max_tokens |
int | 1 ila 131,072 | Çıkış uzunluğunu sınırlar. |
stream |
bool | doğru veya yanlış | SSE akışını etkinleştirir. |
tools |
array | OpenAI araç belirtimi | Fonksiyon çağrısı için. |
tool_choice |
string veya object | auto, required, none, veya belirli araç |
Araç kullanımını kontrol eder. |
response_format |
object | {"type": "json_object"} |
JSON modlu çıktı. |
seed |
int | herhangi bir int | Tekrarlanabilirlik için. |
presence_penalty |
float | -2 ila 2 | Tekrarlanan konuları cezalandırır. |
frequency_penalty |
float | -2 ila 2 | Tekrarlanan token'ları cezalandırır. |
thinking_mode en büyük maliyet kaldıraçıdır. non-thinking akıl yürütme izini tamamen atlar ve token'ları yaklaşık V3.2 hızında döndürür. thinking, ek token'lara mal olan ancak kod ve matematik doğruluğunu artıran bir akıl yürütme bloğunu etkinleştirir. thinking_max, DeepSeek'in manşet tablosundaki puanları üretir; ayrıca en çok token'ı harcar ve 384K+ bağlam bütçesi gerektiren tek moddur.
Python istemcisi
Resmi openai SDK, temel URL geçersiz kılma ile çalışır. LangChain, LlamaIndex ve DSPy dahil olmak üzere mevcut tüm OpenAI uyumlu sarmalayıcılar da çalışır.
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com/v1",
)
response = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[
{"role": "system", "content": "Sadece kodla yanıt ver."},
{"role": "user", "content": "Olayları debounc eden bir Rust fonksiyonu yaz."},
],
extra_body={"thinking_mode": "thinking"},
temperature=1.0,
top_p=1.0,
max_tokens=2048,
)
choice = response.choices[0]
print("İçerik:", choice.message.content)
print("Akıl yürütme tokenları:", response.usage.reasoning_tokens)
print("Toplam tokenlar:", response.usage.total_tokens)
extra_body hilesi, DeepSeek'e özgü parametreleri OpenAI SDK'sı üzerinden kitaplığı yamalamadan nasıl geçireceğinizi gösterir.
Node istemcisi
Node'da aynı yapı:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DEEPSEEK_API_KEY,
baseURL: "https://api.deepseek.com/v1",
});
const response = await client.chat.completions.create({
model: "deepseek-v4-flash",
messages: [
{ role: "user", content: "Muon optimizatörünü basit İngilizce ile açıkla." },
],
thinking_mode: "thinking",
temperature: 1.0,
top_p: 1.0,
});
console.log(response.choices[0].message.content);
console.log("Kullanım:", response.usage);
Node SDK'sı bilinmeyen alanları sessizce kabul eder, bu nedenle thinking_mode, extra_body olmadan üst düzeyden geçer.
Yanıtların akışı
stream: true ayarını yapın ve SSE parçaları üzerinde yineleme yapın. Şekil, OpenAI ile tamamen eşleşir.
stream = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[{"role": "user", "content": "MoE hakkında 300 kelimelik bir deneme akışla gönder."}],
stream=True,
extra_body={"thinking_mode": "non-thinking"},
)
for chunk in stream:
delta = chunk.choices[0].delta.content or ""
print(delta, end="", flush=True)
Akıl yürütme modu açıkken akıl yürütme izleri ayrı ayrı akışa alınır; delta.reasoning_content alanı bunları taşır ve bunları kullanıcı arayüzünde gösterebilir veya bırakabilirsiniz.
Araç çağrısı
V4, standart OpenAI araç çağrısı şemasını destekler. tools dizisinde tanımlanan işlevler çağrılabilir hale gelir ve model ne zaman çağırılacağına karar verir.
tools = [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Bir şehir için mevcut hava durumunu döndürür.",
"parameters": {
"type": "object",
"properties": {
"city": {"type": "string"},
"unit": {"type": "string", "enum": ["c", "f"]},
},
"required": ["city"],
},
},
}]
response = client.chat.completions.create(
model="deepseek-v4-pro",
messages=[{"role": "user", "content": "Lagos'ta hava durumu Celsius cinsinden nedir?"}],
tools=tools,
tool_choice="auto",
extra_body={"thinking_mode": "thinking"},
)
tool_call = response.choices[0].message.tool_calls[0]
print(tool_call.function.name, tool_call.function.arguments)
Buradan, fonksiyonu çağırın, sonucu role: "tool" mesajı olarak ekleyin ve döngüyü devam ettirmek için API'yi tekrar çağırın. Bu desen, OpenAI ve Anthropic araç kullanım döngüleri ile aynıdır.
JSON modu
Yapılandırılmış çıktı için açıkça JSON isteyin ve yanıt formatını ayarlayın.
response = client.chat.completions.create(
model="deepseek-v4-flash",
messages=[
{"role": "system", "content": "Tek bir JSON nesnesiyle yanıt ver."},
{"role": "user", "content": "Bu sürüm notunu {başlık, tarih, madde işaretleri} olarak özetle: ..."},
],
response_format={"type": "json_object"},
extra_body={"thinking_mode": "non-thinking"},
)
JSON modu geçerli JSON'u zorunlu kılar ancak belirli bir şemayı zorunlu kılmaz. Şema doğrulaması için, istemci tarafında Pydantic veya Zod ile eşleştirin.
Apidog'da koleksiyonu oluşturun
Terminalden istekleri tekrarlamak kredileri yakar ve çalıştırmalar arasındaki farkı gizler. Gerçek kullanıma dayanıklı iş akışı:
- Apidog'u indirin ve bir proje oluşturun.
{{DEEPSEEK_API_KEY}}'in gizli bir değişken olarak depolandığı bir ortam ekleyin.Authorization: Bearer {{DEEPSEEK_API_KEY}}başlığıyla{{BASE_URL}}/chat/completionsadresine bir POST isteği kaydedin.- İstekleri tekrarlamadan varyantlar arasında A/B testi yapabilmek için
modelvethinking_modeparametrelerini ayarlayın. - Her çalıştırmada
usage.reasoning_tokensdeğerini incelemek için yanıt görüntüleyiciyi kullanın. Bu, ihtiyacınız olmayan düşünme modu için ödeme yapıp yapmadığınızın en net göstergesidir.
Apidog'da eşleşen GPT-5.5 API koleksiyonunu zaten çalıştıran ekipler, bunu kopyalayabilir, temel URL'yi https://api.deepseek.com/v1 olarak değiştirebilir, model kimliğini değiştirebilir ve her iki sağlayıcıda da karşılaştırma istemlerini dakikalar içinde çalıştırabilir.
Hata yönetimi
Zarf, OpenAI'yi tamamen takip eder. İlk karşılaşacağınız hatalar:
| Kod | Anlamı | Çözüm |
|---|---|---|
| 400 | Hatalı istek | JSON şemasını, özellikle messages ve tools'u kontrol edin. |
| 401 | Geçersiz anahtar | platform.deepseek.com adresinde yeniden oluşturun. |
| 402 | Yetersiz bakiye | Hesaba para yükleyin. |
| 403 | Modele izin verilmiyor | Anahtarın kapsamını ve model kimliğinin yazımını kontrol edin. |
| 422 | Parametre aralık dışında | max_tokens veya thinking_mode muhtemelen uyuşmuyor. |
| 429 | Oran sınırlaması | Geri çekilin, ardından üstel gecikme ile tekrar deneyin. |
| 500 | Sunucu hatası | Bir kez tekrar deneyin; tekrar ederse, durum sayfasını kontrol edin. |
| 503 | Aşırı yüklenmiş | V4-Flash'e geri dönün veya 30 saniye içinde tekrar deneyin. |
Çağrıları, üstel geri çekilme ile 429 ve 5xx hatalarını ele alan bir yeniden deneme yardımcısı içine sarın. 4xx hatalarını otomatik olarak yeniden denemeyin; bunlar mantık hatalarıdır, geçici sorunlar değil.
Maliyet kontrol desenleri
Dört desen, harcamaları öngörülebilir kılar.
- Varsayılan olarak V4-Flash kullanın. Yalnızca kalite artışını ölçtüğünüz istemler için V4-Pro'ya geçin.
thinking_max'i bir bayrak arkasına saklayın. En pahalı moddur; sadece doğruluk gecikmeden daha önemliyse ona yönlendirin.max_tokens'ı sınırlayın. Çoğu yanıt 2.000 çıktı token'ına sığar. 1M bağlam, çıktı için değil, girdi içindir.- Her çağrıda
usage'ı günlüğe kaydedin. Girdi, çıktı ve akıl yürütme sayılarını gözlemlenebilirlik yığınıza gönderin; ani bir akıl yürütme tokenı artışında bir uyarı, değişen istemleri yakalar.
Eski DeepSeek modellerinden geçiş
Eski deepseek-chat ve deepseek-reasoner kimlikleri 24 Temmuz 2026'da kullanımdan kaldırılacaktır. Geçiş, çağrı başına tek bir satır farkı gerektirir; istek ve yanıt şekilleri değişmez.
- model="deepseek-chat"
+ model="deepseek-v4-pro"
Üretimi yayına almadan önce, Apidog'da yan yana A/B karşılaştırmaları yapın. Yanıt kalitesindeki sıçrama genellikle geçişi ödüllendirir; kullanımdan kaldırma son tarihi her iki durumda da bunu zorunlu kılar.
SSS
DeepSeek V4 API üretime hazır mı?Evet. API, 23 Nisan 2026'da ağırlıklarla birlikte kullanıma sunuldu. DeepSeek V3 ve V3.2, bir yıldan fazla süredir aynı altyapıda ölçekli olarak çalıştı, bu nedenle API yüzeyi olgundur.
V4, Anthropic mesaj formatını destekliyor mu?Evet. https://api.deepseek.com/anthropic/v1/messages adresine yönelin ve Anthropic şekilli yükü gönderin. Her iki format da aynı temel modeli kullanır.
Bağlam penceresi nedir?Hem V4-Pro hem de V4-Flash'te 1 milyon token. Think Max modunun minimum 384K çalışma penceresi önerdiğini unutmayın.
Göndermeden önce girdi tokenlarını nasıl sayarım?Yaklaşık değerler için standart OpenAI tokenlaştırıcıyı kullanın; DeepSeek, her yanıtta usage bloğunda tam sayıları yayınlar. Üretim bütçelemesi için, yanıt tarafı sayısına güvenin.
API aracılığıyla ince ayar yapabilir miyim?Lansmanda hayır. İnce ayar şu anda Hugging Face'teki kendi barındırılan Temel kontrol noktaları aracılığıyla yapılır.
API'yi denemek ücretsiz mi?Hesap düzeyinde ücretsiz bir katman yoktur, ancak yeni kayıt olanlar zaman zaman deneme kredisi alır.
