Cómo Usar la API de DeepSeek V4 Gratis

Ashley Innocent

Ashley Innocent

24 April 2026

Cómo Usar la API de DeepSeek V4 Gratis

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

DeepSeek V4 se lanzó el 23 de abril de 2026 con la API a un precio lo suficientemente bajo como para que la mayoría de los equipos omitan por completo la búsqueda del nivel gratuito. Pero existe una ruta gratuita real para los desarrolladores que quieren llamar a V4 programáticamente antes de comprometer una tarjeta. Las pasarelas agregadoras exponen variantes :free, Hugging Face envía un punto final de inferencia compartido, y la API oficial otorga a las cuentas nuevas un crédito de prueba. Junta las tres, construye una cadena de respaldo en Apidog, y podrás prototipar un producto impulsado por V4 sin gastar un solo dólar.

botón

Esta guía es la ruta gratuita específica para la API. Para la guía más amplia que incluye el chat web y el autoalojamiento, consulta cómo usar DeepSeek V4 gratis. Para el tutorial de pago, consulta cómo usar la API de DeepSeek V4. Para la descripción general del producto, consulta qué es DeepSeek V4.

En resumen

Por qué existe la ruta gratuita de la API

Las tarifas de pago de DeepSeek ya son las más bajas en el nivel de vanguardia, entonces ¿por qué buscar lo gratuito? Tres razones.

  1. Prototipado previo a la tarjeta. Quieres llamar a V4 desde código antes de comprometer un método de pago, ya sea por razones de adquisición o para una prueba de concepto rápida.
  2. Trabajo estudiantil, de investigación y de código abierto. Los proyectos pequeños que no pueden tener un presupuesto aún desean una calidad de vanguardia real.
  3. Comparación de proveedores. Ejecutar el mismo prompt contra V4 en tres puntos finales gratuitos diferentes expone diferencias de latencia, calidad y fiabilidad que solo se manifiestan en el tráfico de producción.

Si alguno de esos casos te aplica, esta guía es para ti. Si estás construyendo un producto listo para lanzar, salta a la guía de la API de pago; la recarga mínima de $2 en la API oficial de DeepSeek es una mejor opción que lidiar con los límites de velocidad.

Ruta 1: Nivel gratuito de OpenRouter

OpenRouter es una pasarela a nivel de solicitud que agrega modelos de vanguardia detrás de una API compatible con OpenAI. La plataforma abre de forma fiable variantes gratuitas en los lanzamientos de DeepSeek; el patrón se mantuvo para V3, V3.1, V3.2 y ahora V4.

Configuración

  1. Regístrate en openrouter.ai.
  2. Crea una clave API en Ajustes → Claves.
  3. Consulta el catálogo de modelos para entradas con el sufijo :free, normalmente deepseek/deepseek-v4-flash:free.
  4. Llama al punto final con cualquier SDK compatible con OpenAI.
from openai import OpenAI

client = OpenAI(
    api_key=OPENROUTER_API_KEY,
    base_url="https://openrouter.ai/api/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash:free",
    messages=[{"role": "user", "content": "Refactoriza esta función Go para usar canales."}],
)

print(response.choices[0].message.content)

Aspecto de los límites

Las solicitudes del nivel gratuito en OpenRouter se ponen en cola detrás del tráfico de pago bajo carga. Los límites típicos rondan las 50 a 200 solicitudes por día por clave con una concurrencia estricta. La variante puede ralentizarse o desaparecer sin previo aviso; esta es una herramienta de prototipado, no un backend de producción.

Versión Node

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.OPENROUTER_API_KEY,
  baseURL: "https://openrouter.ai/api/v1",
});

const response = await client.chat.completions.create({
  model: "deepseek/deepseek-v4-flash:free",
  messages: [{ role: "user", content: "Explica el enrutamiento de MoE como si tuviera 12 años." }],
});

console.log(response.choices[0].message.content);

Ruta 2: Proveedores de inferencia de Hugging Face

Hugging Face ejecuta un punto final de inferencia compartido que expone los puntos de control de V4 poco después de su lanzamiento. Es gratuito llamar con un token de HF con sesión iniciada, pero los límites de velocidad son los más estrictos de las rutas gratuitas.

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    model="deepseek-ai/DeepSeek-V4-Flash",
    token=os.environ["HF_TOKEN"],
)

response = client.chat_completion(
    messages=[
        {"role": "user", "content": "Escribe un decorador de Python que reintente con jitter."}
    ],
    max_tokens=512,
)

print(response.choices[0].message.content)

El token de HF es gratuito en huggingface.co/settings/tokens. La latencia varía con la carga y el token se contabiliza contra un presupuesto diario compartido por cuenta. Actualiza a HF Pro para flexibilizar los límites sin recurrir a la API de pago de DeepSeek.

Ruta 3: Chutes y pasarelas comunitarias

Chutes es una red de GPU descentralizada que a menudo aloja modelos de DeepSeek con precios gratuitos o casi gratuitos. Expone un punto final compatible con OpenAI en https://llm.chutes.ai/v1.

client = OpenAI(
    api_key=CHUTES_API_KEY,
    base_url="https://llm.chutes.ai/v1",
)

response = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V4-Flash",
    messages=[{"role": "user", "content": "Compara la atención CSA y HCA en dos frases."}],
)

La disponibilidad cambia rápidamente. Siempre verifica el ID del modelo actual y el costo en el panel del proveedor antes de crear una dependencia en él.

Ruta 4: Crédito de prueba de DeepSeek

Históricamente, DeepSeek ha otorgado un pequeño crédito de prueba a las cuentas nuevas. La cantidad y el período varían; a veces, $1 se ingresan en tu saldo después de la verificación del correo electrónico. Siempre verifica el panel de facturación en platform.deepseek.com después de registrarte.

Incluso una prueba de $1 rinde mucho con las tarifas de V4. Un total de $1 cubre aproximadamente 7 millones de tokens de entrada en V4-Flash o 570K tokens de entrada en V4-Pro. Eso es suficiente para cientos de llamadas de prototipo de grado de producción.

Crea una cadena gratuita agnóstica al proveedor en Apidog

La recompensa por soportar tantas rutas gratuitas es un prototipo resiliente que se degrada elegantemente cuando cualquier proveedor limita la velocidad. El flujo de trabajo:

  1. Descarga Apidog y crea un nuevo proyecto.
  2. Crea cuatro entornos: openrouter, huggingface, chutes, deepseek-trial.
  3. En cada uno, almacena la clave API respectiva como una variable secreta y configura BASE_URL.
  4. Guarda una solicitud POST a {{BASE_URL}}/chat/completions con un campo model parametrizado.
  5. Usa el cambio de entorno para volver a ejecutar el mismo prompt en cada proveedor con un solo clic.

El mismo enfoque funciona para las rutas gratuitas de la API de GPT-5.5 correspondientes; copia la colección e intercambia los proveedores.

Implementa una cadena de respaldo en código

Cuando un proveedor gratuito limita la velocidad, la solución más limpia es una reserva automática. Usando el SDK de OpenAI:

import os
from openai import OpenAI, RateLimitError, APIError

PROVIDERS = [
    {
        "base_url": "https://openrouter.ai/api/v1",
        "api_key": os.environ["OPENROUTER_API_KEY"],
        "model": "deepseek/deepseek-v4-flash:free",
    },
    {
        "base_url": "https://llm.chutes.ai/v1",
        "api_key": os.environ["CHUTES_API_KEY"],
        "model": "deepseek-ai/DeepSeek-V4-Flash",
    },
    {
        "base_url": "https://api.deepseek.com/v1",
        "api_key": os.environ["DEEPSEEK_API_KEY"],
        "model": "deepseek-v4-flash",
    },
]

def call_v4(messages):
    for provider in PROVIDERS:
        try:
            client = OpenAI(
                api_key=provider["api_key"],
                base_url=provider["base_url"],
            )
            return client.chat.completions.create(
                model=provider["model"],
                messages=messages,
            )
        except (RateLimitError, APIError) as e:
            print(f"{provider['base_url']} falló: {e}")
            continue
    raise RuntimeError("todos los proveedores agotados")

Para qué sirve realmente cada ruta gratuita

Ruta Mejor para Peor para
OpenRouter gratuito Prototipado, desarrollo diario Cualquier cosa con SLAs estrictos
Inferencia HF Llamadas exploratorias, notebooks Cargas de trabajo de baja latencia
Chutes Trabajo comunitario experimental Dependencias a largo plazo
Prueba de DeepSeek Pruebas de fidelidad total Producción sostenida
V4-Flash autoalojado Trabajo con requisitos de cumplimiento Equipos sin capacidad de GPU

Cálculo de cuotas que importa

Una rápida verificación de la realidad sobre el rendimiento diario antes de comprometerte con cualquier ruta gratuita.

Si tu prototipo necesita más que eso, la economía cambia. A $0.14 / M en V4-Flash, 10,000 llamadas con 2K de contexto y 500 tokens de salida cuestan aproximadamente $2.80. La API de pago suele ser la opción más sencilla una vez superada la etapa de prototipo.

Cuándo pasar a la API de pago

Tres señales indican que has superado el nivel gratuito:

  1. Los límites de velocidad se alcanzan más de una vez al día.
  2. Estás encadenando varios proveedores gratuitos solo para cubrir una carga de trabajo.
  3. Tus pruebas necesitan una latencia predecible o SLAs.

La recarga mínima en platform.deepseek.com es de $2. Un día de prototipado intenso en los niveles gratuitos a menudo cuesta más tiempo de desarrollador de lo que cobraría la API de pago. Consulta la guía de precios de DeepSeek V4 para ver la lista completa de tarifas.

Preguntas frecuentes

¿Alguna de estas rutas es permanentemente gratuita? No. Los niveles gratuitos cambian sin previo aviso. Trátalos como herramientas de prototipo, no como backends de producción.

¿OpenRouter :free ejecuta el V4 real? Sí, pero en infraestructura compartida con límites de velocidad estrictos. La calidad coincide; el rendimiento no.

¿Puedo usar la salida de la ruta gratuita en un producto comercial? Consulta los términos de cada proveedor. OpenRouter permite el uso comercial dentro del límite de velocidad. La inferencia de HF permite el uso comercial pero lo limita estrictamente. El propio crédito de prueba de DeepSeek sigue los términos principales.

¿Qué ruta gratuita tiene la mejor latencia? El propio crédito de prueba de DeepSeek; estás accediendo a la infraestructura de producción. OpenRouter es el segundo. La inferencia de HF y Chutes varían.

¿Puedo autoalojar V4 gratis? La licencia es MIT, así que sí a nivel de licencia. El hardware es el costo. Consulta cómo ejecutar DeepSeek V4 localmente para la configuración.

¿Cómo hago un seguimiento de qué ruta gratuita usé hoy? Usa Apidog y fija usage en el visor de respuestas. La mayoría de los agregadores también exponen un panel de uso en su consola de administración.

botón

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs