DeepSeek V4 API Nasıl Kullanılır?

Ashley Innocent

Ashley Innocent

24 April 2026

DeepSeek V4 API Nasıl Kullanılır?

Kurumsal Apidog

Şirket İçi Dağıtım

SSO & RBAC

SOC 2 Uyumlu

Apidog Enterprise'ı Keşfet

DeepSeek V4, ilk günden itibaren canlı API ile kullanıma sunuldu. Model kimlikleri deepseek-v4-pro ve deepseek-v4-flash, uç nokta OpenAI uyumludur ve temel URL https://api.deepseek.com'dur. Bu, GPT-5.5 veya diğer OpenAI şeklindeki API'lere karşı halihazırda kullandığınız herhangi bir istemcinin, tek bir temel-URL değişikliğiyle V4'e karşı çalışacağı anlamına gelir.

Bu rehber; kimlik doğrulamayı, önemli her parametreyi, Python ve Node örneklerini, düşünme modu matematiğini, araç çağrısını, akışları ve siz yineleme yaparken maliyeti görünür tutan Apidog tabanlı bir iş akışını kapsar.

button

Ürün düzeyindeki genel bakış için DeepSeek V4 nedir makalesine bakın. Maliyetsiz yol için DeepSeek V4'ü ücretsiz nasıl kullanacağınız konusuna bakın.

TL;DR

Önkoşullar

İlk istekten önce dört şeyi hazırlayın.

Anahtarı bir kez dışa aktarın:

export DEEPSEEK_API_KEY="sk-..."

Uç nokta ve kimlik doğrulama

İki temel URL, iki istek şeklini kapsar.

POST https://api.deepseek.com/v1/chat/completions    # OpenAI formatı
POST https://api.deepseek.com/anthropic/v1/messages  # Anthropic formatı

Mevcut bir Anthropic şekilli kod tabanınız yoksa OpenAI uyumlu olanı seçin. Bu rehberin geri kalanı OpenAI formatını kullanır.

Kimlik doğrulama, standart Authorization başlığında bir taşıyıcı (bearer) tokendir. Minimum geçerli istek:

curl https://api.deepseek.com/v1/chat/completions \
  -H "Authorization: Bearer $DEEPSEEK_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v4-pro",
    "messages": [
      {"role": "user", "content": "MoE yönlendirmesini iki cümlede açıklayın."}
    ]
  }'

Başarılı yanıtlar, bir choices dizisi, girdi ve çıktı token'larına (ve düşünme modu açıksa reasoning_tokens'a) ayrılmış bir usage bloğu ve izleme için kullanabileceğiniz bir id içeren bir JSON gövdesi döndürür. Hatalar, error.code ve error.message içeren standart OpenAI zarfını döndürür.

İstek parametreleri

Her alan maliyet veya davranışla eşleşir. İşte deepseek-v4-pro ve deepseek-v4-flash için harita.

Parametre Tür Değerler Notlar
model string deepseek-v4-pro, deepseek-v4-flash Zorunlu.
messages array rol/içerik çiftleri Zorunlu. OpenAI ile aynı şema.
thinking_mode string non-thinking, thinking, thinking_max Varsayılan non-thinking.
temperature float 0 ila 2 DeepSeek 1.0 öneriyor.
top_p float 0 ila 1 DeepSeek 1.0 öneriyor.
max_tokens int 1 ila 131,072 Çıkış uzunluğunu sınırlar.
stream bool doğru veya yanlış SSE akışını etkinleştirir.
tools array OpenAI araç belirtimi Fonksiyon çağrısı için.
tool_choice string veya object auto, required, none, veya belirli araç Araç kullanımını kontrol eder.
response_format object {"type": "json_object"} JSON modlu çıktı.
seed int herhangi bir int Tekrarlanabilirlik için.
presence_penalty float -2 ila 2 Tekrarlanan konuları cezalandırır.
frequency_penalty float -2 ila 2 Tekrarlanan token'ları cezalandırır.

thinking_mode en büyük maliyet kaldıraçıdır. non-thinking akıl yürütme izini tamamen atlar ve token'ları yaklaşık V3.2 hızında döndürür. thinking, ek token'lara mal olan ancak kod ve matematik doğruluğunu artıran bir akıl yürütme bloğunu etkinleştirir. thinking_max, DeepSeek'in manşet tablosundaki puanları üretir; ayrıca en çok token'ı harcar ve 384K+ bağlam bütçesi gerektiren tek moddur.

Python istemcisi

Resmi openai SDK, temel URL geçersiz kılma ile çalışır. LangChain, LlamaIndex ve DSPy dahil olmak üzere mevcut tüm OpenAI uyumlu sarmalayıcılar da çalışır.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com/v1",
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[
        {"role": "system", "content": "Sadece kodla yanıt ver."},
        {"role": "user", "content": "Olayları debounc eden bir Rust fonksiyonu yaz."},
    ],
    extra_body={"thinking_mode": "thinking"},
    temperature=1.0,
    top_p=1.0,
    max_tokens=2048,
)

choice = response.choices[0]
print("İçerik:", choice.message.content)
print("Akıl yürütme tokenları:", response.usage.reasoning_tokens)
print("Toplam tokenlar:", response.usage.total_tokens)

extra_body hilesi, DeepSeek'e özgü parametreleri OpenAI SDK'sı üzerinden kitaplığı yamalamadan nasıl geçireceğinizi gösterir.

Node istemcisi

Node'da aynı yapı:

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.DEEPSEEK_API_KEY,
  baseURL: "https://api.deepseek.com/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek-v4-flash",
  messages: [
    { role: "user", content: "Muon optimizatörünü basit İngilizce ile açıkla." },
  ],
  thinking_mode: "thinking",
  temperature: 1.0,
  top_p: 1.0,
});

console.log(response.choices[0].message.content);
console.log("Kullanım:", response.usage);

Node SDK'sı bilinmeyen alanları sessizce kabul eder, bu nedenle thinking_mode, extra_body olmadan üst düzeyden geçer.

Yanıtların akışı

stream: true ayarını yapın ve SSE parçaları üzerinde yineleme yapın. Şekil, OpenAI ile tamamen eşleşir.

stream = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "MoE hakkında 300 kelimelik bir deneme akışla gönder."}],
    stream=True,
    extra_body={"thinking_mode": "non-thinking"},
)

for chunk in stream:
    delta = chunk.choices[0].delta.content or ""
    print(delta, end="", flush=True)

Akıl yürütme modu açıkken akıl yürütme izleri ayrı ayrı akışa alınır; delta.reasoning_content alanı bunları taşır ve bunları kullanıcı arayüzünde gösterebilir veya bırakabilirsiniz.

Araç çağrısı

V4, standart OpenAI araç çağrısı şemasını destekler. tools dizisinde tanımlanan işlevler çağrılabilir hale gelir ve model ne zaman çağırılacağına karar verir.

tools = [{
    "type": "function",
    "function": {
        "name": "get_weather",
        "description": "Bir şehir için mevcut hava durumunu döndürür.",
        "parameters": {
            "type": "object",
            "properties": {
                "city": {"type": "string"},
                "unit": {"type": "string", "enum": ["c", "f"]},
            },
            "required": ["city"],
        },
    },
}]

response = client.chat.completions.create(
    model="deepseek-v4-pro",
    messages=[{"role": "user", "content": "Lagos'ta hava durumu Celsius cinsinden nedir?"}],
    tools=tools,
    tool_choice="auto",
    extra_body={"thinking_mode": "thinking"},
)

tool_call = response.choices[0].message.tool_calls[0]
print(tool_call.function.name, tool_call.function.arguments)

Buradan, fonksiyonu çağırın, sonucu role: "tool" mesajı olarak ekleyin ve döngüyü devam ettirmek için API'yi tekrar çağırın. Bu desen, OpenAI ve Anthropic araç kullanım döngüleri ile aynıdır.

JSON modu

Yapılandırılmış çıktı için açıkça JSON isteyin ve yanıt formatını ayarlayın.

response = client.chat.completions.create(
    model="deepseek-v4-flash",
    messages=[
        {"role": "system", "content": "Tek bir JSON nesnesiyle yanıt ver."},
        {"role": "user", "content": "Bu sürüm notunu {başlık, tarih, madde işaretleri} olarak özetle: ..."},
    ],
    response_format={"type": "json_object"},
    extra_body={"thinking_mode": "non-thinking"},
)

JSON modu geçerli JSON'u zorunlu kılar ancak belirli bir şemayı zorunlu kılmaz. Şema doğrulaması için, istemci tarafında Pydantic veya Zod ile eşleştirin.

Apidog'da koleksiyonu oluşturun

Terminalden istekleri tekrarlamak kredileri yakar ve çalıştırmalar arasındaki farkı gizler. Gerçek kullanıma dayanıklı iş akışı:

  1. Apidog'u indirin ve bir proje oluşturun.
  2. {{DEEPSEEK_API_KEY}}'in gizli bir değişken olarak depolandığı bir ortam ekleyin.
  3. Authorization: Bearer {{DEEPSEEK_API_KEY}} başlığıyla {{BASE_URL}}/chat/completions adresine bir POST isteği kaydedin.
  4. İstekleri tekrarlamadan varyantlar arasında A/B testi yapabilmek için model ve thinking_mode parametrelerini ayarlayın.
  5. Her çalıştırmada usage.reasoning_tokens değerini incelemek için yanıt görüntüleyiciyi kullanın. Bu, ihtiyacınız olmayan düşünme modu için ödeme yapıp yapmadığınızın en net göstergesidir.

Apidog'da eşleşen GPT-5.5 API koleksiyonunu zaten çalıştıran ekipler, bunu kopyalayabilir, temel URL'yi https://api.deepseek.com/v1 olarak değiştirebilir, model kimliğini değiştirebilir ve her iki sağlayıcıda da karşılaştırma istemlerini dakikalar içinde çalıştırabilir.

Hata yönetimi

Zarf, OpenAI'yi tamamen takip eder. İlk karşılaşacağınız hatalar:

Kod Anlamı Çözüm
400 Hatalı istek JSON şemasını, özellikle messages ve tools'u kontrol edin.
401 Geçersiz anahtar platform.deepseek.com adresinde yeniden oluşturun.
402 Yetersiz bakiye Hesaba para yükleyin.
403 Modele izin verilmiyor Anahtarın kapsamını ve model kimliğinin yazımını kontrol edin.
422 Parametre aralık dışında max_tokens veya thinking_mode muhtemelen uyuşmuyor.
429 Oran sınırlaması Geri çekilin, ardından üstel gecikme ile tekrar deneyin.
500 Sunucu hatası Bir kez tekrar deneyin; tekrar ederse, durum sayfasını kontrol edin.
503 Aşırı yüklenmiş V4-Flash'e geri dönün veya 30 saniye içinde tekrar deneyin.

Çağrıları, üstel geri çekilme ile 429 ve 5xx hatalarını ele alan bir yeniden deneme yardımcısı içine sarın. 4xx hatalarını otomatik olarak yeniden denemeyin; bunlar mantık hatalarıdır, geçici sorunlar değil.

Maliyet kontrol desenleri

Dört desen, harcamaları öngörülebilir kılar.

  1. Varsayılan olarak V4-Flash kullanın. Yalnızca kalite artışını ölçtüğünüz istemler için V4-Pro'ya geçin.
  2. thinking_max'i bir bayrak arkasına saklayın. En pahalı moddur; sadece doğruluk gecikmeden daha önemliyse ona yönlendirin.
  3. max_tokens'ı sınırlayın. Çoğu yanıt 2.000 çıktı token'ına sığar. 1M bağlam, çıktı için değil, girdi içindir.
  4. Her çağrıda usage'ı günlüğe kaydedin. Girdi, çıktı ve akıl yürütme sayılarını gözlemlenebilirlik yığınıza gönderin; ani bir akıl yürütme tokenı artışında bir uyarı, değişen istemleri yakalar.

Eski DeepSeek modellerinden geçiş

Eski deepseek-chat ve deepseek-reasoner kimlikleri 24 Temmuz 2026'da kullanımdan kaldırılacaktır. Geçiş, çağrı başına tek bir satır farkı gerektirir; istek ve yanıt şekilleri değişmez.

-  model="deepseek-chat"
+  model="deepseek-v4-pro"

Üretimi yayına almadan önce, Apidog'da yan yana A/B karşılaştırmaları yapın. Yanıt kalitesindeki sıçrama genellikle geçişi ödüllendirir; kullanımdan kaldırma son tarihi her iki durumda da bunu zorunlu kılar.

SSS

DeepSeek V4 API üretime hazır mı?Evet. API, 23 Nisan 2026'da ağırlıklarla birlikte kullanıma sunuldu. DeepSeek V3 ve V3.2, bir yıldan fazla süredir aynı altyapıda ölçekli olarak çalıştı, bu nedenle API yüzeyi olgundur.

V4, Anthropic mesaj formatını destekliyor mu?Evet. https://api.deepseek.com/anthropic/v1/messages adresine yönelin ve Anthropic şekilli yükü gönderin. Her iki format da aynı temel modeli kullanır.

Bağlam penceresi nedir?Hem V4-Pro hem de V4-Flash'te 1 milyon token. Think Max modunun minimum 384K çalışma penceresi önerdiğini unutmayın.

Göndermeden önce girdi tokenlarını nasıl sayarım?Yaklaşık değerler için standart OpenAI tokenlaştırıcıyı kullanın; DeepSeek, her yanıtta usage bloğunda tam sayıları yayınlar. Üretim bütçelemesi için, yanıt tarafı sayısına güvenin.

API aracılığıyla ince ayar yapabilir miyim?Lansmanda hayır. İnce ayar şu anda Hugging Face'teki kendi barındırılan Temel kontrol noktaları aracılığıyla yapılır.

API'yi denemek ücretsiz mi?Hesap düzeyinde ücretsiz bir katman yoktur, ancak yeni kayıt olanlar zaman zaman deneme kredisi alır.

API Tasarım-Öncelikli Yaklaşımı Apidog'da Uygulayın

API'leri oluşturmanın ve kullanmanın daha kolay yolunu keşfedin

DeepSeek V4 API Nasıl Kullanılır?