DeepSeek V4, 23 Nisan 2026'da kullanıma sunuldu ve çoğu öncü lansmanın aksine, ücretsiz yolları gerçektir. Resmi web sohbeti, kredi kartı gerektirmeden V4-Pro'yu çalıştırır. Ağırlıklar MIT lisanslıdır ve bugün indirilebilir. OpenRouter ve Chutes gibi toplayıcılar, DeepSeek sürümünden sonraki birkaç gün içinde genellikle ücretsiz katmanlar sunar. Tüm bunları bir araya getirdiğinizde, bir hesaba para yatırmaya karar vermeden önce ciddi V4 iş yüklerini sıfır maliyetle çalıştırabilirsiniz.
Bu kılavuz, doğrulayabildiğimiz her ücretsiz yolu, hangi kullanım durumuna hangisinin uygun olduğunu ve kullanım arttığında ücretli faturalandırmaya geçişin sorunsuz olması için Apidog'da üretime hazır bir koleksiyonu nasıl kuracağınızı anlatmaktadır.
düğme
Ürün düzeyinde genel bir bakış için DeepSeek V4 nedir makalesine bakın. Tam API rehberliği için DeepSeek V4 API nasıl kullanılır makalesine bakın.
ÖZET
- chat.deepseek.com — Think High ve Think Max geçişleri ile V4-Pro üzerinde ücretsiz web sohbeti. Kart yok. Bugün çalışıyor.
- Hugging Face ağırlıkları + kendi GPU'nuz — MIT lisansı, V4-Flash 2 ila 4 H100 üzerinde çalışır, V4-Pro bir küme gerektirir.
- OpenRouter ve Chutes ücretsiz katmanları — DeepSeek modellerinde lansmandan sonraki bir hafta içinde genellikle ücretsiz kota açan üçüncü taraf ağ geçitleri.
- Hugging Face Inference Sağlayıcıları — erken deneyler için V4'ü sunan, paylaşılan, hız sınırlı bir uç nokta.
- Kaggle, Colab ve RunPod deneme kredileri — kendi kendine barındırmayı test etmek istediğinizde tek seferlik çalıştırmalar için ücretsiz işlem gücü.
- Her ücretsiz yol kullanımı sınırlar. Üretim iş yükleri için, sınır dolmadan önce ücretli faturalandırmaya geçin.

Yol 1: chat.deepseek.com (varsayılan ücretsiz yol)
En hızlı, en güvenilir ücretsiz yol, resmi sohbet arayüzüdür. V4-Pro varsayılan modeldir; oluşturucunun üstündeki geçiş düğmesi Düşünmeyen, Yüksek Düşünce ve Maksimum Düşünce akıl yürütme modları arasında geçiş yapar.

Kurulum
- chat.deepseek.com adresini açın.
- E-posta, Google veya WeChat ile giriş yapın.
- Aktif modelin V4-Pro olduğunu doğrulayın.
- Yazmaya başlayın.
Ne elde edersiniz
- Tam 1M jetonluk bağlam penceresi.
- PDF'ler, görseller ve kod paketleri için dosya yükleme.
- İsteğe bağlı web araması.
- Think Max dahil tüm üç akıl yürütme modu.
- Konuşma geçmişi ve klasörler.
Sınırlar nasıl görünür
DeepSeek günlük kesin bir mesaj sayısı yayınlamaz; ücretsiz katman yük altında yumuşak bir şekilde kısıtlanır. Yoğun kullanım yanıtları yavaşlatabilir veya istekleri kuyruğa alabilir ancak nadiren tamamen engeller. Kalıcı hız sınırlamaları görmeye başlarsanız, bu ya hızı yavaşlatmanız ya da API'ye geçmeniz gerektiğinin bir işaretidir.
Web arayüzü için iyi görevler: En zor isteminizde V4'ün Claude'u yenip yenmediğini test etmek, mimari inceleme için bir depo tarball'ı yapıştırmak, aksi takdirde bir avukata okutacağınız bir sözleşmeye karşı Think Max çalıştırmak. Kötü görevler: Otomasyon veya tekrarlanabilirlik gerektiren her şey.
Yol 2: Kendi GPU'nuzda V4-Flash'i kendi kendine barındırma
V4-Flash, çoğu kişinin gerçekçi olarak kendi kendine barındırabileceği MIT lisanslı varyanttır. Toplamda 284B ve aktif olarak 13B ile, çoklu H100 kutusu bunu FP8'de ciddi bir verimle çalıştırır ve bir INT4 nicemlemesi onu tek bir 80GB karta sığdırır.
Buradaki maliyet donanımdır, lisanslama değil. Zaten GPU kapasiteniz varsa, bu en dayanıklı ücretsiz yoldur; hız sınırlamasına tabi tutulamaz, kullanımdan kaldırılamaz veya geri çekilemez.
Ağırlıkları çekin
pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
--local-dir ./models/deepseek-v4-flash
FP8'de yaklaşık 500GB bekleyin. Disk alanı ayırın.
vLLM ile sunun
pip install "vllm>=0.9.0"
vllm serve deepseek-ai/DeepSeek-V4-Flash \
--tensor-parallel-size 4 \
--max-model-len 1048576 \
--dtype auto \
--port 8000
Çalışmaya başladıktan sonra, herhangi bir OpenAI uyumlu istemciyi http://localhost:8000/v1 adresine yönlendirin. Uç nokta, ücretli DeepSeek API'si ile aynı istek biçimini kabul eder; Apidog bunu başka bir temel URL olarak görür ve kaydedilmiş tüm koleksiyonlarınız olduğu gibi çalışır.
Donanım gerçeklik kontrolü
| Varyant | Minimum kartlar (FP8) | Minimum kartlar (INT4) | Gerçekçi verim |
|---|---|---|---|
| V4-Flash | 2 × H100 80GB | 1 × H100 80GB | 50 ila 150 jeton/sn |
| V4-Pro | 16 × H100 80GB | 8 × H100 80GB | küme bağımlı |
Boşta duran kartlarınız yoksa, matematik genellikle saatlik GPU kiralamak yerine API'yi tercih eder. Kendi kendine barındırma yolu çoğunlukla mevcut kapasiteye veya katı uyumluluk gereksinimlerine sahip ekipler içindir.
Yol 3: OpenRouter ücretsiz katmanı
OpenRouter, açık ağırlıklı ve kapalı modelleri tek bir API arkasında toplayan istek düzeyinde bir ağ geçididir. Platform, yeni DeepSeek sürümlerinde rutin olarak ücretsiz katmanlar açar ve bu düzen V3, V3.1 ve V3.2 için de geçerliliğini korumuştur.

Kurulum
- openrouter.ai adresinden kaydolun.
- Bir API anahtarı oluşturun.
- Model kataloğunu
deepseek/deepseek-v4-proveyadeepseek/deepseek-v4-flashiçin kontrol edin; ücretsiz varyantlar genellikle:freeson eki ile gelir. - OpenAI uyumlu SDK ile çağırın.
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat_completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)
print(response.choices[0].message.content)
Sınırlar
OpenRouter'daki ücretsiz katmanlar genellikle anahtar başına günlük birkaç yüz istekle sınırlıdır ve yük altında önceliği düşürür. Prototipleme için mükemmel, üretim için güvenilmez.
Yol 4: Hugging Face Inference Sağlayıcıları
Hugging Face, V4 kontrol noktalarını piyasaya sürüldükten kısa bir süre sonra sunan barındırılan bir çıkarım yüzeyi çalıştırır. Hız sınırları sıkıdır ve gecikme süresi değişir, ancak çağırmak ücretsizdir.
from huggingface_hub import InferenceClient
client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")
response = client.chat_completion(
messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
max_tokens=512,
)
print(response.choices[0].message.content)
HF jetonu ücretsizdir. Daha yoğun kullanım için Pro hesaba yükseltin; hız sınırları gevşer ancak maliyet, karşılaştırılabilir iş yükleri için resmi API'nin hala bir büyüklük derecesi altındadır.
Yol 5: Colab, Kaggle, RunPod ve Lambda'da deneme kredileri
Her büyük GPU kiralama sağlayıcısı deneme kredileri sunar. İyi kullanıldığında, gerçek para harcamadan tek seferlik V4-Flash deneylerini karşılarlar.
- Google Colab. Ücretsiz T4 katmanı V4 için çok küçüktür. Colab Pro+, ayda 500 işlem birimi verir, bu da bir A100 üzerinde birkaç V4-Flash deneyi için yeterlidir.
- Kaggle. T4 ve P100 üzerinde haftalık ücretsiz GPU saatleri. V4-Pro için çok küçük, bazen nicemlenmiş V4-Flash deneyleri için yeterli.
- RunPod. 10 dolarlık deneme kredisi bir H100 üzerinde birkaç saati kapsar. vLLM'yi başlatmak, bir karşılaştırma paketi çalıştırmak ve kapatmak için yeterli.
- Lambda. H100 ve H200'de ara sıra ücretsiz saat promosyonları; aktif teklifler için kayıt sayfasını takip edin.
Bunların hiçbiri uzun vadeli ücretsiz yollar değildir. Sınırlı bir deney için iyi çalışırlar ve başka hiçbir şey için değil.
Sağlayıcıdan bağımsız bir Apidog koleksiyonu oluşturun
Bu kadar çok ücretsiz yolun pratik getirisi, aynı istemi işi tekrarlamadan hepsinde test edebilmenizdir. İş akışı:
- Apidog'u indirin.
- Dört ortamlı bir koleksiyon oluşturun:
chat(yer tutucu),deepseek(https://api.deepseek.com/v1),openrouter(https://openrouter.ai/api/v1),self-hosted(http://localhost:8000/v1). {{BASE_URL}}/chat/completionsadresine tek bir POST isteği kaydedin.- İstek gövdesinin ortamlar arasında aynı olması için her sağlayıcının anahtarını gizli bir değişken olarak saklayın.
- Aynı istemi her arka uçta A/B test etmek için ortamları değiştirin.
Bu, GPT-5.5 ücretsiz katman koleksiyonu için kullanılan aynı desendir; tek araç, her sağlayıcı, tekrarlanan iş yok.
Hangi ücretsiz yolu seçmelisiniz?
Dört sezgisel yaklaşım çoğu kararı kapsar.
- Beş dakikada bir fikir edinmek istiyorum. chat.deepseek.com adresini kullanın.
- Bir ürün prototipi oluşturmak istiyorum. Sınıra ulaşana kadar OpenRouter'ın ücretsiz katmanını kullanın, ardından DeepSeek'e para yükleyin.
- GPU'larım ve bir uyumluluk geçmişim var. V4-Flash'i vLLM üzerinde kendi kendine barındırın.
- Uzun vadeli ücretsiz kullanım istiyorum. Böyle bir şey yok. Her barındırılan ücretsiz katmanın bir sınırı vardır. Etkileşimli çalışmalar için chat.deepseek.com'u otomasyon için mütevazı bir ücretli yükleme ile eşleştirin.
Ücretsizden ne zaman vazgeçmelisiniz?
Ücretsiz katmanı aştığınızı gösteren üç işaret vardır.
- Günde birden fazla hız sınırlamasına tabi tutuluyorsunuz. Bu, iş yükünün bir bütçeyi hak edecek kadar büyük olduğu anlamına gelir.
- SLA'lara ihtiyacınız var. Ücretsiz katmanlar bunları içermez. Resmi API içerir.
- Günlük kaydı tutmanız, denetlemeniz veya uyumluluğu sağlamanız gerekiyor. Ücretli API net faturalandırma kayıtları döndürür; çoğu toplayıcının ücretsiz katmanı bunu yapmaz.
Bunlardan herhangi biri gerçekleştiğinde, resmi API'ye geçin. Minimum yükleme 2 dolardır ve jeton başına fiyatlandırma, öncü katmanda en düşüktür.
Sıkça Sorulan Sorular
chat.deepseek.com gerçekten ücretsiz mi?Evet. Kredi kartı yok, deneme süresi yok. Hizmet yumuşak bir şekilde kısıtlanmıştır ancak ücretli değildir.
Ağırlıkları indirmek için bir Hugging Face hesabına ihtiyacım var mı?Teknik olarak hayır, depo herkese açık. Pratik olarak evet; giriş yapmış bir hesap, indirme işlemlerinde size daha iyi hız limitleri sunar.
Gerçek V4-Pro'yu hangi ücretsiz yol çalıştırır?chat.deepseek.com tam V4-Pro'yu çalıştırır. OpenRouter ücretsiz katmanları daha çok V4-Flash içerir. V4-Pro çıktısı istiyorsanız ve ödeme yapmak istemiyorsanız, web sohbeti güvenilir yoldur.
Ücretsiz bir katmanı bir ürünün arkasına koyabilir miyim?Sorumlu bir şekilde hayır. Ücretsiz katmanlar hız sınırlamasına tabi tutulur, koşulları değişir ve bazen kaybolur. V4'ü müşterilerinize sunuyorsanız, ücretli API'yi kullanın veya kendi kendine barındırma yapın.
Kendi kendine barındırma gerçekten ücretsiz mi?Lisans ücretsizdir. Donanım ise değil. Zaten GPU kapasiteniz varsa, marjinal maliyet elektriktir. Kiralıyorsanız, matematik genellikle ücretli API'ye karşı kaybeder.
Test için bir Apidog ücretsiz katmanı olacak mı?Apidog'un kendisi API tasarımı ve testi için ücretsizdir; sadece ücretli API'lere eriştiğinizde kredi maliyeti olur. Yani evet, tamamen ücretsiz bir iş akışı için ücretsiz bir Apidog çalışma alanını chat.deepseek.com veya OpenRouter ile birleştirebilirsiniz.
