Comment utiliser l'API DeepSeek V4 gratuitement ?

Ashley Innocent

Ashley Innocent

24 April 2026

Comment utiliser l'API DeepSeek V4 gratuitement ?

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

DeepSeek V4 a été lancé le 23 avril 2026 avec une API dont le prix est suffisamment bas pour que la plupart des équipes évitent complètement la chasse aux offres gratuites. Cependant, un véritable chemin gratuit existe pour les développeurs qui souhaitent appeler V4 par programme avant d'engager une carte. Les passerelles d'agrégateurs exposent des variantes :free, Hugging Face propose un point de terminaison d'inférence partagé, et l'API officielle accorde un crédit d'essai aux nouveaux comptes. Combinez les trois, construisez une chaîne de secours dans Apidog, et vous pourrez prototyper un produit alimenté par V4 sans dépenser un seul dollar.

button

Ce guide est le chemin gratuit spécifique à l'API. Pour le guide plus large qui inclut le chat web et l'auto-hébergement, consultez comment utiliser DeepSeek V4 gratuitement. Pour la procédure payante, consultez comment utiliser l'API DeepSeek V4. Pour l'aperçu du produit, consultez qu'est-ce que DeepSeek V4.

TL;DR

Pourquoi le chemin d'API gratuit existe

Les tarifs payants de DeepSeek sont déjà les plus bas de leur catégorie de pointe, alors pourquoi chercher la gratuité ? Trois raisons.

  1. Prototypage avant paiement. Vous souhaitez appeler V4 à partir de code avant d'engager un mode de paiement, soit pour des raisons d'approvisionnement, soit pour une preuve de concept rapide.
  2. Travaux étudiants, de recherche et open-source. Les petits projets qui ne peuvent pas supporter un budget souhaitent toujours une qualité de pointe.
  3. Comparaison des fournisseurs. L'exécution de la même invite sur V4 sur trois points de terminaison gratuits différents révèle des différences de latence, de qualité et de fiabilité qui n'apparaissent que dans le trafic de production.

Si l'une de ces raisons vous correspond, ce guide est pour vous. Si vous construisez un produit destiné à être commercialisé, passez au guide de l'API payante ; le rechargement minimum de 2 $ sur l'API officielle de DeepSeek est une meilleure affaire que de se battre avec les limites de débit.

Chemin 1 : Niveau gratuit OpenRouter

OpenRouter est une passerelle de niveau requête qui agrège des modèles de pointe derrière une API compatible OpenAI unique. La plateforme ouvre de manière fiable des variantes gratuites lors des sorties de DeepSeek ; ce modèle a été maintenu pour V3, V3.1, V3.2, et maintenant V4.

Configuration

  1. Inscrivez-vous sur openrouter.ai.
  2. Créez une clé API sous Paramètres → Clés.
  3. Vérifiez le catalogue de modèles pour les entrées suffixées :free, généralement deepseek/deepseek-v4-flash:free.
  4. Appelez le point de terminaison avec n'importe quel SDK compatible OpenAI.
from openai import OpenAI

client = OpenAI(
    api_key=OPENROUTER_API_KEY,
    base_url="https://openrouter.ai/api/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash:free",
    messages=[{"role": "user", "content": "Refactor this Go function to use channels."}],
)

print(response.choices[0].message.content)

À quoi ressemblent les limites

Les requêtes du niveau gratuit sur OpenRouter sont mises en file d'attente derrière le trafic payant en cas de charge. Les limites typiques se situent autour de 50 à 200 requêtes par jour par clé avec une concurrence serrée. La variante peut être ralentie ou disparaître sans préavis ; c'est un outil de prototypage, pas un backend de production.

Version Node

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.OPENROUTER_API_KEY,
  baseURL: "https://openrouter.ai/api/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-flash:free",
  messages: [{ role: "user", content: "Explain MoE routing like I'm 12." }],
});

console.log(response.choices[0].message.content);

Chemin 2 : Fournisseurs d'inférence Hugging Face

Hugging Face gère un point de terminaison d'inférence partagé qui expose les checkpoints V4 peu après leur publication. Il est gratuit d'appeler avec un jeton HF connecté, mais les limites de débit sont les plus strictes parmi les chemins gratuits.

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    model="deepseek-ai/DeepSeek-V4-Flash",
    token=os.environ["HF_TOKEN"],
)

response = client.chat_completion(
    messages=[
        {"role": "user", "content": "Write a Python decorator that retries with jitter."}
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

Le jeton HF est gratuit depuis huggingface.co/settings/tokens. La latence varie avec la charge et le jeton est décompté d'un budget quotidien partagé par compte. Passez à HF Pro pour assouplir les limites sans recourir à l'API DeepSeek payante.

Chemin 3 : Chutes et passerelles communautaires

Chutes est un réseau GPU décentralisé qui héberge souvent des modèles DeepSeek à des prix gratuits ou quasi-gratuits. Il expose un point de terminaison compatible OpenAI à https://llm.chutes.ai/v1.

client = OpenAI(
    api_key=CHUTES_API_KEY,
    base_url="https://llm.chutes.ai/v1",
)

response = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V4-Flash",
    messages=[{"role": "user", "content": "Compare CSA and HCA attention in two sentences."}],
)

La disponibilité change rapidement. Vérifiez toujours l'ID du modèle actuel et le coût dans le tableau de bord du fournisseur avant de créer une dépendance vis-à-vis de celui-ci.

Chemin 4 : Crédit d'essai DeepSeek

DeepSeek a historiquement accordé un petit crédit d'essai aux nouveaux comptes. Le montant et la période varient ; parfois 1 $ apparaît sur votre solde après vérification de l'e-mail. Vérifiez toujours le tableau de bord de facturation sur platform.deepseek.com après l'inscription.

Même un essai de 1 $ suffit amplement aux tarifs V4. Un dollar complet couvre environ 7 millions de jetons d'entrée sur V4-Flash ou 570 000 jetons d'entrée sur V4-Pro. C'est suffisant pour des centaines d'appels de prototypage de qualité production.

Construire une chaîne gratuite agnostique au fournisseur dans Apidog

L'avantage de prendre en charge autant de chemins gratuits est un prototype résilient qui se dégrade gracieusement lorsqu'un fournisseur quelconque est limité. Le flux de travail :

  1. Téléchargez Apidog et créez un nouveau projet.
  2. Créez quatre environnements : openrouter, huggingface, chutes, deepseek-trial.
  3. Dans chacun, stockez la clé API respective en tant que variable secrète et définissez BASE_URL.
  4. Enregistrez une requête POST vers {{BASE_URL}}/chat/completions avec un champ model paramétré.
  5. Utilisez le changement d'environnement pour réexécuter la même invite sur chaque fournisseur en un clic.

La même approche fonctionne pour les chemins gratuits de l'API GPT-5.5 correspondants ; copiez la collection et échangez les fournisseurs.

Implémenter une chaîne de secours dans le code

Lorsqu'un fournisseur gratuit est limité, la solution la plus propre est un mécanisme de secours automatique. En utilisant le SDK OpenAI :

import os
from openai import OpenAI, RateLimitError, APIError

PROVIDERS = [
    {
        "base_url": "https://openrouter.ai/api/v1",
        "api_key": os.environ["OPENROUTER_API_KEY"],
        "model": "deepseek/deepseek-v4-flash:free",
    },
    {
        "base_url": "https://llm.chutes.ai/v1",
        "api_key": os.environ["CHUTES_API_KEY"],
        "model": "deepseek-ai/DeepSeek-V4-Flash",
    },
    {
        "base_url": "https://api.deepseek.com/v1",
        "api_key": os.environ["DEEPSEEK_API_KEY"],
        "model": "deepseek-v4-flash",
    },
]

def call_v4(messages):
    for provider in PROVIDERS:
        try:
            client = OpenAI(
                api_key=provider["api_key"],
                base_url=provider["base_url"],
            )
            return client.chat.completions.create(
                model=provider["model"],
                messages=messages,
            )
        except (RateLimitError, APIError) as e:
            print(f"{provider['base_url']} failed: {e}")
            continue
    raise RuntimeError("all providers exhausted")

À quoi sert réellement chaque chemin gratuit

Chemin Idéal pour Moins adapté pour
OpenRouter gratuit Prototypage, développement quotidien Tout ce qui a des SLA stricts
Inférence HF Appels exploratoires, notebooks Charges de travail à faible latence
Chutes Travail communautaire expérimental Dépendances à long terme
Essai DeepSeek Tests de fidélité totale Production soutenue
V4-Flash auto-hébergé Travail soumis à la conformité Équipes sans capacité GPU

Le calcul des quotas qui compte

Un rapide contrôle de la réalité sur le débit quotidien avant de vous engager sur un chemin gratuit.

Si votre prototype a besoin de plus, les calculs économiques changent. À 0,14 $ / M sur V4-Flash, 10 000 appels avec un contexte de 2K et 500 jetons de sortie coûtent environ 2,80 $. L'API payante est généralement le choix le plus simple après l'étape du prototype.

Quand passer à l'API payante

Trois signaux indiquent que vous avez dépassé le niveau gratuit :

  1. Les limites de débit sont atteintes plus d'une fois par jour.
  2. Vous enchaînez plusieurs fournisseurs gratuits juste pour couvrir une seule charge de travail.
  3. Vos tests nécessitent une latence ou des SLA prévisibles.

Le rechargement minimum sur platform.deepseek.com est de 2 $. Une journée de prototypage intensif sur les niveaux gratuits coûte souvent plus de temps de développement que ce que l'API payante facturerait. Consultez le guide tarifaire de DeepSeek V4 pour la grille tarifaire complète.

FAQ

L'un de ces chemins est-il définitivement gratuit ?Non. Les niveaux gratuits changent sans préavis. Traitez-les comme des outils de prototypage, pas comme des backends de production.

OpenRouter :free exécute-t-il le vrai V4 ?Oui, mais sur une infrastructure partagée avec des limites de débit strictes. La qualité correspond ; le débit, non.

Puis-je utiliser la sortie d'un chemin gratuit dans un produit commercial ?Vérifiez les conditions de chaque fournisseur. OpenRouter autorise l'utilisation commerciale dans les limites de débit. L'inférence HF autorise l'utilisation commerciale mais la limite strictement. Le propre crédit d'essai de DeepSeek suit les conditions principales.

Quel chemin gratuit offre la meilleure latence ?Le propre crédit d'essai de DeepSeek ; vous accédez à l'infrastructure de production. OpenRouter est deuxième. L'inférence HF et Chutes varient.

Puis-je auto-héberger V4 gratuitement ?La licence est MIT, donc oui au niveau de la licence. Le matériel est le coût. Voir comment exécuter DeepSeek V4 localement pour la configuration.

Comment puis-je savoir quel chemin gratuit j'ai utilisé aujourd'hui ?Utilisez Apidog et épinglez usage dans la visionneuse de réponses. La plupart des agrégateurs exposent également un tableau de bord d'utilisation sur leur console d'administration.

button

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API