DeepSeek V4 a été lancé le 23 avril 2026 avec une API dont le prix est suffisamment bas pour que la plupart des équipes évitent complètement la chasse aux offres gratuites. Cependant, un véritable chemin gratuit existe pour les développeurs qui souhaitent appeler V4 par programme avant d'engager une carte. Les passerelles d'agrégateurs exposent des variantes :free, Hugging Face propose un point de terminaison d'inférence partagé, et l'API officielle accorde un crédit d'essai aux nouveaux comptes. Combinez les trois, construisez une chaîne de secours dans Apidog, et vous pourrez prototyper un produit alimenté par V4 sans dépenser un seul dollar.
Ce guide est le chemin gratuit spécifique à l'API. Pour le guide plus large qui inclut le chat web et l'auto-hébergement, consultez comment utiliser DeepSeek V4 gratuitement. Pour la procédure payante, consultez comment utiliser l'API DeepSeek V4. Pour l'aperçu du produit, consultez qu'est-ce que DeepSeek V4.
TL;DR
- Niveau gratuit OpenRouter —
deepseek/deepseek-v4-flash:freeet parfoisdeepseek-v4-pro:free. Compatible OpenAI, quelques centaines de requêtes par jour par clé. - Fournisseurs d'inférence Hugging Face — point de terminaison partagé gratuit à
https://router.huggingface.co/hf-inference; soumis à des limites de débit, pratique pour le prototypage. - Niveau gratuit Chutes — réseau GPU communautaire qui expose fréquemment des points de terminaison DeepSeek gratuits dans la semaine suivant le lancement.
- Crédit d'essai DeepSeek — les nouveaux comptes sur
platform.deepseek.comreçoivent parfois un petit solde de départ. - L'auto-hébergement de V4-Flash sur votre propre GPU est également gratuit au niveau de la licence ; voir comment exécuter DeepSeek V4 localement.
- Construisez une chaîne de secours dans Apidog afin que la forme de la requête reste identique entre les fournisseurs.

Pourquoi le chemin d'API gratuit existe
Les tarifs payants de DeepSeek sont déjà les plus bas de leur catégorie de pointe, alors pourquoi chercher la gratuité ? Trois raisons.
- Prototypage avant paiement. Vous souhaitez appeler V4 à partir de code avant d'engager un mode de paiement, soit pour des raisons d'approvisionnement, soit pour une preuve de concept rapide.
- Travaux étudiants, de recherche et open-source. Les petits projets qui ne peuvent pas supporter un budget souhaitent toujours une qualité de pointe.
- Comparaison des fournisseurs. L'exécution de la même invite sur V4 sur trois points de terminaison gratuits différents révèle des différences de latence, de qualité et de fiabilité qui n'apparaissent que dans le trafic de production.
Si l'une de ces raisons vous correspond, ce guide est pour vous. Si vous construisez un produit destiné à être commercialisé, passez au guide de l'API payante ; le rechargement minimum de 2 $ sur l'API officielle de DeepSeek est une meilleure affaire que de se battre avec les limites de débit.
Chemin 1 : Niveau gratuit OpenRouter
OpenRouter est une passerelle de niveau requête qui agrège des modèles de pointe derrière une API compatible OpenAI unique. La plateforme ouvre de manière fiable des variantes gratuites lors des sorties de DeepSeek ; ce modèle a été maintenu pour V3, V3.1, V3.2, et maintenant V4.
Configuration
- Inscrivez-vous sur openrouter.ai.
- Créez une clé API sous Paramètres → Clés.
- Vérifiez le catalogue de modèles pour les entrées suffixées
:free, généralementdeepseek/deepseek-v4-flash:free. - Appelez le point de terminaison avec n'importe quel SDK compatible OpenAI.
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_API_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Refactor this Go function to use channels."}],
)
print(response.choices[0].message.content)
À quoi ressemblent les limites
Les requêtes du niveau gratuit sur OpenRouter sont mises en file d'attente derrière le trafic payant en cas de charge. Les limites typiques se situent autour de 50 à 200 requêtes par jour par clé avec une concurrence serrée. La variante peut être ralentie ou disparaître sans préavis ; c'est un outil de prototypage, pas un backend de production.
Version Node
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.OPENROUTER_API_KEY,
baseURL: "https://openrouter.ai/api/v1",
});
const response = await client.chat.completions.create({
model: "deepseek/deepseek-v4-flash:free",
messages: [{ role: "user", content: "Explain MoE routing like I'm 12." }],
});
console.log(response.choices[0].message.content);
Chemin 2 : Fournisseurs d'inférence Hugging Face
Hugging Face gère un point de terminaison d'inférence partagé qui expose les checkpoints V4 peu après leur publication. Il est gratuit d'appeler avec un jeton HF connecté, mais les limites de débit sont les plus strictes parmi les chemins gratuits.
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
model="deepseek-ai/DeepSeek-V4-Flash",
token=os.environ["HF_TOKEN"],
)
response = client.chat_completion(
messages=[
{"role": "user", "content": "Write a Python decorator that retries with jitter."}
],
max_tokens=512,
)
print(response.choices[0].message.content)
Le jeton HF est gratuit depuis huggingface.co/settings/tokens. La latence varie avec la charge et le jeton est décompté d'un budget quotidien partagé par compte. Passez à HF Pro pour assouplir les limites sans recourir à l'API DeepSeek payante.
Chemin 3 : Chutes et passerelles communautaires
Chutes est un réseau GPU décentralisé qui héberge souvent des modèles DeepSeek à des prix gratuits ou quasi-gratuits. Il expose un point de terminaison compatible OpenAI à https://llm.chutes.ai/v1.
client = OpenAI(
api_key=CHUTES_API_KEY,
base_url="https://llm.chutes.ai/v1",
)
response = client.chat.completions.create(
model="deepseek-ai/DeepSeek-V4-Flash",
messages=[{"role": "user", "content": "Compare CSA and HCA attention in two sentences."}],
)
La disponibilité change rapidement. Vérifiez toujours l'ID du modèle actuel et le coût dans le tableau de bord du fournisseur avant de créer une dépendance vis-à-vis de celui-ci.
Chemin 4 : Crédit d'essai DeepSeek
DeepSeek a historiquement accordé un petit crédit d'essai aux nouveaux comptes. Le montant et la période varient ; parfois 1 $ apparaît sur votre solde après vérification de l'e-mail. Vérifiez toujours le tableau de bord de facturation sur platform.deepseek.com après l'inscription.
Même un essai de 1 $ suffit amplement aux tarifs V4. Un dollar complet couvre environ 7 millions de jetons d'entrée sur V4-Flash ou 570 000 jetons d'entrée sur V4-Pro. C'est suffisant pour des centaines d'appels de prototypage de qualité production.
Construire une chaîne gratuite agnostique au fournisseur dans Apidog
L'avantage de prendre en charge autant de chemins gratuits est un prototype résilient qui se dégrade gracieusement lorsqu'un fournisseur quelconque est limité. Le flux de travail :
- Téléchargez Apidog et créez un nouveau projet.
- Créez quatre environnements :
openrouter,huggingface,chutes,deepseek-trial. - Dans chacun, stockez la clé API respective en tant que variable secrète et définissez
BASE_URL. - Enregistrez une requête POST vers
{{BASE_URL}}/chat/completionsavec un champmodelparamétré. - Utilisez le changement d'environnement pour réexécuter la même invite sur chaque fournisseur en un clic.
La même approche fonctionne pour les chemins gratuits de l'API GPT-5.5 correspondants ; copiez la collection et échangez les fournisseurs.
Implémenter une chaîne de secours dans le code
Lorsqu'un fournisseur gratuit est limité, la solution la plus propre est un mécanisme de secours automatique. En utilisant le SDK OpenAI :
import os
from openai import OpenAI, RateLimitError, APIError
PROVIDERS = [
{
"base_url": "https://openrouter.ai/api/v1",
"api_key": os.environ["OPENROUTER_API_KEY"],
"model": "deepseek/deepseek-v4-flash:free",
},
{
"base_url": "https://llm.chutes.ai/v1",
"api_key": os.environ["CHUTES_API_KEY"],
"model": "deepseek-ai/DeepSeek-V4-Flash",
},
{
"base_url": "https://api.deepseek.com/v1",
"api_key": os.environ["DEEPSEEK_API_KEY"],
"model": "deepseek-v4-flash",
},
]
def call_v4(messages):
for provider in PROVIDERS:
try:
client = OpenAI(
api_key=provider["api_key"],
base_url=provider["base_url"],
)
return client.chat.completions.create(
model=provider["model"],
messages=messages,
)
except (RateLimitError, APIError) as e:
print(f"{provider['base_url']} failed: {e}")
continue
raise RuntimeError("all providers exhausted")
À quoi sert réellement chaque chemin gratuit
| Chemin | Idéal pour | Moins adapté pour |
|---|---|---|
| OpenRouter gratuit | Prototypage, développement quotidien | Tout ce qui a des SLA stricts |
| Inférence HF | Appels exploratoires, notebooks | Charges de travail à faible latence |
| Chutes | Travail communautaire expérimental | Dépendances à long terme |
| Essai DeepSeek | Tests de fidélité totale | Production soutenue |
| V4-Flash auto-hébergé | Travail soumis à la conformité | Équipes sans capacité GPU |
Le calcul des quotas qui compte
Un rapide contrôle de la réalité sur le débit quotidien avant de vous engager sur un chemin gratuit.
- OpenRouter gratuit : ~100 requêtes/jour/clé, ~50K jetons chacune. Utile pour peut-être 30 à 50 appels de développement réels par jour.
- Inférence HF gratuite : limites de débit partagées, environ 1K requêtes/jour au total sur le compte ; parfois plus lent sous charge.
- Chutes : variable ; à considérer comme un effort maximal.
- Essai DeepSeek (1 $) : environ 700 appels de 10K jetons d'entrée chacun sur V4-Flash. Fini mais généreux.
- V4-Flash auto-hébergé : débit limité par votre matériel. Un boîtier 4 × H100 maintient 50 à 150 tok/s.
Si votre prototype a besoin de plus, les calculs économiques changent. À 0,14 $ / M sur V4-Flash, 10 000 appels avec un contexte de 2K et 500 jetons de sortie coûtent environ 2,80 $. L'API payante est généralement le choix le plus simple après l'étape du prototype.
Quand passer à l'API payante
Trois signaux indiquent que vous avez dépassé le niveau gratuit :
- Les limites de débit sont atteintes plus d'une fois par jour.
- Vous enchaînez plusieurs fournisseurs gratuits juste pour couvrir une seule charge de travail.
- Vos tests nécessitent une latence ou des SLA prévisibles.
Le rechargement minimum sur platform.deepseek.com est de 2 $. Une journée de prototypage intensif sur les niveaux gratuits coûte souvent plus de temps de développement que ce que l'API payante facturerait. Consultez le guide tarifaire de DeepSeek V4 pour la grille tarifaire complète.
FAQ
L'un de ces chemins est-il définitivement gratuit ?Non. Les niveaux gratuits changent sans préavis. Traitez-les comme des outils de prototypage, pas comme des backends de production.
OpenRouter :free exécute-t-il le vrai V4 ?Oui, mais sur une infrastructure partagée avec des limites de débit strictes. La qualité correspond ; le débit, non.
Puis-je utiliser la sortie d'un chemin gratuit dans un produit commercial ?Vérifiez les conditions de chaque fournisseur. OpenRouter autorise l'utilisation commerciale dans les limites de débit. L'inférence HF autorise l'utilisation commerciale mais la limite strictement. Le propre crédit d'essai de DeepSeek suit les conditions principales.
Quel chemin gratuit offre la meilleure latence ?Le propre crédit d'essai de DeepSeek ; vous accédez à l'infrastructure de production. OpenRouter est deuxième. L'inférence HF et Chutes varient.
Puis-je auto-héberger V4 gratuitement ?La licence est MIT, donc oui au niveau de la licence. Le matériel est le coût. Voir comment exécuter DeepSeek V4 localement pour la configuration.
Comment puis-je savoir quel chemin gratuit j'ai utilisé aujourd'hui ?Utilisez Apidog et épinglez usage dans la visionneuse de réponses. La plupart des agrégateurs exposent également un tableau de bord d'utilisation sur leur console d'administration.
