DeepSeek V4 API Nasıl Kullanılır?

DeepSeek V4, ilk günden itibaren canlı API ile kullanıma sunuldu. Model kimlikleri deepseek-v4-pro ve deepseek-v4-flash, uç nokta OpenAI uyumludur ve temel URL https://api.deepseek.com'dur. Bu, GPT-5.5 veya diğer OpenAI şeklindeki API'lere karşı halihazırda kullandığınız herhangi bir istemcinin, tek bir temel-URL değişikliğiyle V4'e karşı çalışacağı anlamına gelir.

Bu rehber; kimlik doğrulamayı, önemli her parametreyi, Python ve Node örneklerini, düşünme modu matematiğini, araç çağrısını, akışları ve siz yineleme yaparken maliyeti görünür tutan Apidog tabanlı bir iş akışını kapsar.

button

Ürün düzeyindeki genel bakış için DeepSeek V4 nedir makalesine bakın. Maliyetsiz yol için DeepSeek V4'ü ücretsiz nasıl kullanacağınız konusuna bakın.

TL;DR

DeepSeek V4, https://api.deepseek.com/v1/chat/completions adresindeki OpenAI uyumlu uç noktada ve https://api.deepseek.com/anthropic adresindeki Anthropic uyumlu uç noktada sunulur.
Model Kimlikleri: deepseek-v4-pro (toplam 1.6T, aktif 49B) ve deepseek-v4-flash (toplam 284B, aktif 13B).
Her iki varyant da 1M token bağlamını ve üç akıl yürütme modunu destekler: non-thinking, thinking, thinking_max.
DeepSeek'in önerdiği gibi temperature=1.0, top_p=1.0 kullanın; GPT-5.5 veya Claude varsayılanlarını içe aktarmayın.
Eski kimlikler deepseek-chat ve deepseek-reasoner 24 Temmuz 2026 tarihinde kullanımdan kaldırılacaktır; bu tarihten önce geçiş yapın.
İstekleri tekrarlamak, düşünme modlarını karşılaştırmak ve anahtarı kabuk geçmişinizden uzak tutmak için Apidog'u indirin.

Önkoşullar

İlk istekten önce dört şeyi hazırlayın.

En az 2 dolarlık bir ödeme yapmış, platform.deepseek.com adresinde bir DeepSeek geliştirici hesabı. Bakiyeniz yoksa, çağrılar 402 Yetersiz Bakiye döndürür.
Faturalandıracağınız proje için kapsamlandırılmış bir API anahtarı. Proje kapsamlı anahtarlar, üretim ortamında hesap anahtarlarından daha güvenlidir.
OpenAI uyumlu bir temel URL'yi kullanabilen bir SDK. Python openai>=1.30.0 ve Node openai@4.x her ikisi de değişiklik yapmadan çalışır.
Terminali spam'lemeden istekleri tekrarlayabilen bir API istemcisi. Curl tek bir çağrı için çalışır; sonrasında Apidog kullanın.

Anahtarı bir kez dışa aktarın:

export DEEPSEEK_API_KEY="sk-..."

Uç nokta ve kimlik doğrulama

İki temel URL, iki istek şeklini kapsar.

POST https://api.deepseek.com/v1/chat/completions    # OpenAI formatı
POST https://api.deepseek.com/anthropic/v1/messages  # Anthropic formatı

Mevcut bir Anthropic şekilli kod tabanınız yoksa OpenAI uyumlu olanı seçin. Bu rehberin geri kalanı OpenAI formatını kullanır.

Kimlik doğrulama, standart Authorization başlığında bir taşıyıcı (bearer) tokendir. Minimum geçerli istek:

curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "user", "content": "MoE yönlendirmesini iki cümlede açıklayın."}
    ]
  }'

Başarılı yanıtlar, bir choices dizisi, girdi ve çıktı token'larına (ve düşünme modu açıksa reasoning_tokens'a) ayrılmış bir usage bloğu ve izleme için kullanabileceğiniz bir id içeren bir JSON gövdesi döndürür. Hatalar, error.code ve error.message içeren standart OpenAI zarfını döndürür.

İstek parametreleri

Her alan maliyet veya davranışla eşleşir. İşte deepseek-v4-pro ve deepseek-v4-flash için harita.

Parametre	Tür	Değerler	Notlar
`model`	string	`deepseek-v4-pro`, `deepseek-v4-flash`	Zorunlu.
`messages`	array	rol/içerik çiftleri	Zorunlu. OpenAI ile aynı şema.
`thinking_mode`	string	`non-thinking`, `thinking`, `thinking_max`	Varsayılan `non-thinking`.
`temperature`	float	0 ila 2	DeepSeek 1.0 öneriyor.
`top_p`	float	0 ila 1	DeepSeek 1.0 öneriyor.
`max_tokens`	int	1 ila 131,072	Çıkış uzunluğunu sınırlar.
`stream`	bool	doğru veya yanlış	SSE akışını etkinleştirir.
`tools`	array	OpenAI araç belirtimi	Fonksiyon çağrısı için.
`tool_choice`	string veya object	`auto`, `required`, `none`, veya belirli araç	Araç kullanımını kontrol eder.
`response_format`	object	`{"type": "json_object"}`	JSON modlu çıktı.
`seed`	int	herhangi bir int	Tekrarlanabilirlik için.
`presence_penalty`	float	-2 ila 2	Tekrarlanan konuları cezalandırır.
`frequency_penalty`	float	-2 ila 2	Tekrarlanan token'ları cezalandırır.

thinking_mode en büyük maliyet kaldıraçıdır. non-thinking akıl yürütme izini tamamen atlar ve token'ları yaklaşık V3.2 hızında döndürür. thinking, ek token'lara mal olan ancak kod ve matematik doğruluğunu artıran bir akıl yürütme bloğunu etkinleştirir. thinking_max, DeepSeek'in manşet tablosundaki puanları üretir; ayrıca en çok token'ı harcar ve 384K+ bağlam bütçesi gerektiren tek moddur.

Python istemcisi

Resmi openai SDK, temel URL geçersiz kılma ile çalışır. LangChain, LlamaIndex ve DSPy dahil olmak üzere mevcut tüm OpenAI uyumlu sarmalayıcılar da çalışır.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/v1",
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "Sadece kodla yanıt ver."},
        {"role": "user", "content": "Olayları debounc eden bir Rust fonksiyonu yaz."},
    ],
    extra_body={"thinking_mode": "thinking"},
    temperature=1.0,
    top_p=1.0,
    max_tokens=2048,
)

choice = response.choices[0]
print("İçerik:", choice.message.content)
print("Akıl yürütme tokenları:", response.usage.reasoning_tokens)
print("Toplam tokenlar:", response.usage.total_tokens)

extra_body hilesi, DeepSeek'e özgü parametreleri OpenAI SDK'sı üzerinden kitaplığı yamalamadan nasıl geçireceğinizi gösterir.

Node istemcisi

Node'da aynı yapı:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DEEPSEEK_API_KEY,
  baseURL: "https://api.deepseek.com/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [
    { role: "user", content: "Muon optimizatörünü basit İngilizce ile açıkla." },
  ],
  thinking_mode: "thinking",
  temperature: 1.0,
  top_p: 1.0,
});

console.log(response.choices[0].message.content);
console.log("Kullanım:", response.usage);

Node SDK'sı bilinmeyen alanları sessizce kabul eder, bu nedenle thinking_mode, extra_body olmadan üst düzeyden geçer.

Yanıtların akışı

stream: true ayarını yapın ve SSE parçaları üzerinde yineleme yapın. Şekil, OpenAI ile tamamen eşleşir.

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "MoE hakkında 300 kelimelik bir deneme akışla gönder."}],
    stream=True,
    extra_body={"thinking_mode": "non-thinking"},
)

for chunk in stream:
    delta = chunk.choices[0].delta.content or ""
    print(delta, end="", flush=True)

Akıl yürütme modu açıkken akıl yürütme izleri ayrı ayrı akışa alınır; delta.reasoning_content alanı bunları taşır ve bunları kullanıcı arayüzünde gösterebilir veya bırakabilirsiniz.

Araç çağrısı

V4, standart OpenAI araç çağrısı şemasını destekler. tools dizisinde tanımlanan işlevler çağrılabilir hale gelir ve model ne zaman çağırılacağına karar verir.

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "Bir şehir için mevcut hava durumunu döndürür.",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string"},
                "unit": {"type": "string", "enum": ["c", "f"]},
            },
            "required": ["city"],
        },
    },
}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "Lagos'ta hava durumu Celsius cinsinden nedir?"}],
    tools=tools,
    tool_choice="auto",
    extra_body={"thinking_mode": "thinking"},
)

tool_call = response.choices[0].message.tool_calls[0]
print(tool_call.function.name, tool_call.function.arguments)

Buradan, fonksiyonu çağırın, sonucu role: "tool" mesajı olarak ekleyin ve döngüyü devam ettirmek için API'yi tekrar çağırın. Bu desen, OpenAI ve Anthropic araç kullanım döngüleri ile aynıdır.

JSON modu

Yapılandırılmış çıktı için açıkça JSON isteyin ve yanıt formatını ayarlayın.

response = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "Tek bir JSON nesnesiyle yanıt ver."},
        {"role": "user", "content": "Bu sürüm notunu {başlık, tarih, madde işaretleri} olarak özetle: ..."},
    ],
    response_format={"type": "json_object"},
    extra_body={"thinking_mode": "non-thinking"},
)

JSON modu geçerli JSON'u zorunlu kılar ancak belirli bir şemayı zorunlu kılmaz. Şema doğrulaması için, istemci tarafında Pydantic veya Zod ile eşleştirin.

Apidog'da koleksiyonu oluşturun

Terminalden istekleri tekrarlamak kredileri yakar ve çalıştırmalar arasındaki farkı gizler. Gerçek kullanıma dayanıklı iş akışı:

Apidog'u indirin ve bir proje oluşturun.
{{DEEPSEEK_API_KEY}}'in gizli bir değişken olarak depolandığı bir ortam ekleyin.
Authorization: Bearer {{DEEPSEEK_API_KEY}} başlığıyla {{BASE_URL}}/chat/completions adresine bir POST isteği kaydedin.
İstekleri tekrarlamadan varyantlar arasında A/B testi yapabilmek için model ve thinking_mode parametrelerini ayarlayın.
Her çalıştırmada usage.reasoning_tokens değerini incelemek için yanıt görüntüleyiciyi kullanın. Bu, ihtiyacınız olmayan düşünme modu için ödeme yapıp yapmadığınızın en net göstergesidir.

Apidog'da eşleşen GPT-5.5 API koleksiyonunu zaten çalıştıran ekipler, bunu kopyalayabilir, temel URL'yi https://api.deepseek.com/v1 olarak değiştirebilir, model kimliğini değiştirebilir ve her iki sağlayıcıda da karşılaştırma istemlerini dakikalar içinde çalıştırabilir.

Hata yönetimi

Zarf, OpenAI'yi tamamen takip eder. İlk karşılaşacağınız hatalar:

Kod	Anlamı	Çözüm
400	Hatalı istek	JSON şemasını, özellikle `messages` ve `tools`'u kontrol edin.
401	Geçersiz anahtar	platform.deepseek.com adresinde yeniden oluşturun.
402	Yetersiz bakiye	Hesaba para yükleyin.
403	Modele izin verilmiyor	Anahtarın kapsamını ve model kimliğinin yazımını kontrol edin.
422	Parametre aralık dışında	`max_tokens` veya `thinking_mode` muhtemelen uyuşmuyor.
429	Oran sınırlaması	Geri çekilin, ardından üstel gecikme ile tekrar deneyin.
500	Sunucu hatası	Bir kez tekrar deneyin; tekrar ederse, durum sayfasını kontrol edin.
503	Aşırı yüklenmiş	V4-Flash'e geri dönün veya 30 saniye içinde tekrar deneyin.

Çağrıları, üstel geri çekilme ile 429 ve 5xx hatalarını ele alan bir yeniden deneme yardımcısı içine sarın. 4xx hatalarını otomatik olarak yeniden denemeyin; bunlar mantık hatalarıdır, geçici sorunlar değil.

Maliyet kontrol desenleri

Dört desen, harcamaları öngörülebilir kılar.

Varsayılan olarak V4-Flash kullanın. Yalnızca kalite artışını ölçtüğünüz istemler için V4-Pro'ya geçin.
thinking_max'i bir bayrak arkasına saklayın. En pahalı moddur; sadece doğruluk gecikmeden daha önemliyse ona yönlendirin.
max_tokens'ı sınırlayın. Çoğu yanıt 2.000 çıktı token'ına sığar. 1M bağlam, çıktı için değil, girdi içindir.
Her çağrıda usage'ı günlüğe kaydedin. Girdi, çıktı ve akıl yürütme sayılarını gözlemlenebilirlik yığınıza gönderin; ani bir akıl yürütme tokenı artışında bir uyarı, değişen istemleri yakalar.

Eski DeepSeek modellerinden geçiş

Eski deepseek-chat ve deepseek-reasoner kimlikleri 24 Temmuz 2026'da kullanımdan kaldırılacaktır. Geçiş, çağrı başına tek bir satır farkı gerektirir; istek ve yanıt şekilleri değişmez.

-  model="deepseek-chat"
+  model="deepseek-v4-pro"

Üretimi yayına almadan önce, Apidog'da yan yana A/B karşılaştırmaları yapın. Yanıt kalitesindeki sıçrama genellikle geçişi ödüllendirir; kullanımdan kaldırma son tarihi her iki durumda da bunu zorunlu kılar.

SSS

DeepSeek V4 API üretime hazır mı?Evet. API, 23 Nisan 2026'da ağırlıklarla birlikte kullanıma sunuldu. DeepSeek V3 ve V3.2, bir yıldan fazla süredir aynı altyapıda ölçekli olarak çalıştı, bu nedenle API yüzeyi olgundur.

V4, Anthropic mesaj formatını destekliyor mu?Evet. https://api.deepseek.com/anthropic/v1/messages adresine yönelin ve Anthropic şekilli yükü gönderin. Her iki format da aynı temel modeli kullanır.

Bağlam penceresi nedir?Hem V4-Pro hem de V4-Flash'te 1 milyon token. Think Max modunun minimum 384K çalışma penceresi önerdiğini unutmayın.

Göndermeden önce girdi tokenlarını nasıl sayarım?Yaklaşık değerler için standart OpenAI tokenlaştırıcıyı kullanın; DeepSeek, her yanıtta usage bloğunda tam sayıları yayınlar. Üretim bütçelemesi için, yanıt tarafı sayısına güvenin.

API aracılığıyla ince ayar yapabilir miyim?Lansmanda hayır. İnce ayar şu anda Hugging Face'teki kendi barındırılan Temel kontrol noktaları aracılığıyla yapılır.

API'yi denemek ücretsiz mi?Hesap düzeyinde ücretsiz bir katman yoktur, ancak yeni kayıt olanlar zaman zaman deneme kredisi alır.