Cómo Usar DeepSeek V4-Pro con Cursor: Guía de Configuración Reasoning Proxy (2026)

Ashley Innocent

Ashley Innocent

25 May 2026

Cómo Usar DeepSeek V4-Pro con Cursor: Guía de Configuración Reasoning Proxy (2026)

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

Conecte DeepSeek V4-Pro a Cursor con su configuración predeterminada compatible con OpenAI y la primera llamada a la herramienta devuelve un error 400. La razón es pequeña pero obstinada: V4-Pro es un modelo de pensamiento que devuelve un bloque reasoning_content, Cursor elimina ese campo de sus solicitudes de seguimiento y la API de DeepSeek rechaza los mensajes de llamada a la herramienta que omiten la cadena de razonamiento. Un proxy de código abierto en yxlao/deepseek-cursor-proxy almacena en caché el contenido de razonamiento y lo reinyecta en las solicitudes salientes. Una vez que el proxy está en funcionamiento, V4-Pro se comporta como cualquier otro modelo en el panel de modelos personalizados de Cursor, con los tokens de pensamiento renderizados como markdown colapsable. A continuación se presenta la configuración completa, el cálculo de costos y la lista de solución de problemas.

TL;DR

Por qué necesitas un proxy en primer lugar

V4-Pro devuelve dos cosas en cada respuesta: un campo content regular y un campo reasoning_content que contiene la cadena de pensamiento. Para el chat ordinario, puedes ignorar reasoning_content. El problema comienza con las llamadas a herramientas.

El contrato de API de DeepSeek para modelos de pensamiento requiere que, cuando continúas una conversación que contenía un bloque reasoning_content, incluyas ese bloque en la siguiente solicitud junto con el resultado de tool_calls. La cadena de razonamiento es parte del estado de la conversación. Cursor no conoce este requisito. Envía un cliente de chat estilo OpenAI, y reasoning_content no forma parte del esquema de OpenAI, por lo que elimina el campo. La siguiente llamada a la herramienta devuelve un HTTP 400 y un mensaje sobre un reasoning_content faltante.

Esto no es exactamente un error de Cursor. Es una falta de coincidencia de contrato entre dos proveedores que comparten la mayor parte de su superficie de API. Hasta que Cursor agregue soporte de primera clase para V4-Pro o DeepSeek flexibilice el contrato, la solución es un proxy que recuerde lo que Cursor olvidó.

Lo que hace el proxy, en tres líneas

También expone el puerto local a través de un túnel ngrok, porque la configuración del modelo personalizado de Cursor requiere HTTPS y no aceptará una URL localhost.

La caché se encuentra en ~/.deepseek-cursor-proxy/reasoning_content.sqlite3. El uso de SHA-256 como clave significa que dos conversaciones paralelas no colisionan. El contenido de razonamiento se almacena exactamente como lo devolvió DeepSeek, por lo que la propia caché de prompts de DeepSeek sigue funcionando, lo cual es importante para los nuevos precios permanentes.

Requisitos previos

Necesitas cuatro elementos antes de empezar:

Si nunca has instalado uv, consulta la documentación oficial de instalación de uv. Para ngrok, la guía de inicio rápido de ngrok te guiará a través del paso del authtoken.

Paso 1: Instalar el proxy

La ruta más rápida es uv. Desde cualquier directorio:

uv tool install deepseek-cursor-proxy

Si prefieres pip, clona el repositorio e instálalo como un paquete editable:

git clone https://github.com/yxlao/deepseek-cursor-proxy.git
cd deepseek-cursor-proxy
pip install -e .

Cualquiera de las dos rutas coloca un comando deepseek-cursor-proxy en tu PATH. Verifica con deepseek-cursor-proxy --help.

Paso 2: Configurar ngrok

El proxy necesita una URL HTTPS pública porque el campo de modelo personalizado de Cursor no aceptará http://localhost. ngrok proporciona el túnel.

ngrok config add-authtoken YOUR_NGROK_AUTHTOKEN

Obtén tu authtoken del panel de ngrok después de registrarte. La capa gratuita te da un subdominio aleatorio en cada reinicio. Si eso es un problema, reclama un dominio reservado en el panel de control y pásalo al proxy con --ngrok-url https://your-reserved.ngrok-free.app.

Paso 3: Iniciar el proxy

Los valores predeterminados son adecuados para la mayoría de las configuraciones:

deepseek-cursor-proxy

En la primera ejecución, el proxy crea ~/.deepseek-cursor-proxy/config.yaml, abre un túnel e imprime la URL pública. La salida se ve así:

Starting deepseek-cursor-proxy
Tunnel: https://random-name.ngrok-free.app
Local:  http://127.0.0.1:9000
Cache:  /Users/you/.deepseek-cursor-proxy/reasoning_content.sqlite3

Banderas útiles (flags):

Mantén el proxy ejecutándose en una terminal separada, o envuélvelo en un trabajo de launchctl en macOS. Cursor se comunica con él en cada solicitud.

Paso 4: Configurar Cursor

Abre la configuración de Cursor, navega a Modelos y añade un modelo personalizado. Los campos que necesitas:

Cursor ejecuta una comprobación de “Verificar modelo”. La comprobación envía una única finalización de chat. Un tic verde significa que has terminado. Un error de conexión generalmente apunta a la URL de ngrok: cópiala de nuevo de la salida del proxy y confirma que termina con /v1.

Paso 5: Selecciona el modelo y prueba una llamada a la herramienta

Abre el selector de modelos en el panel de chat y selecciona tu nuevo modelo personalizado. El primer prompt a probar es uno que fuerce el uso de herramientas, porque las llamadas a herramientas son donde residían los errores 400 originales:

“Abre el README en este repositorio, lista cada bloque de código y dime cuáles carecen de sugerencias de lenguaje.”

Cursor emitirá una llamada a la herramienta read_file. Si el proxy está haciendo su trabajo, la cadena de respuesta se verá así:

  1. Cursor envía el mensaje de usuario al proxy.
  2. El proxy lo reenvía a DeepSeek sin reasoning_content (es el primer turno).
  3. DeepSeek devuelve texto más un bloque reasoning_content más una solicitud tool_calls.
  4. El proxy almacena en caché el reasoning_content indexado por el hash del prefijo de la conversación.
  5. Cursor ejecuta la herramienta y luego envía un seguimiento con el resultado de la herramienta. El seguimiento no tiene reasoning_content porque Cursor lo eliminó.
  6. El proxy busca el reasoning_content almacenado en caché por el hash del prefijo y lo reinyecta antes de reenviarlo.
  7. DeepSeek acepta la solicitud, continúa razonando y devuelve la respuesta final.

Ejecuta con --verbose y verás la inyección en los registros.

Cómo se ve el costo en la práctica

V4-Pro dentro de Cursor paga las tarifas estándar de la API de DeepSeek, no los precios de crédito empaquetados de Cursor. Esas tarifas son permanentes a partir de mayo de 2026:

Tipo de token Tarifa por 1M de tokens
Entrada (fallo de caché) $0.435
Entrada (acierto de caché) $0.003625
Salida $0.87

Un día de uso intensivo de Cursor se ve aproximadamente como 50 turnos de chat más 20 cadenas de llamadas a herramientas. Cada turno promedia quizás 8,000 tokens de prompt (contexto de archivo más prompt del sistema más historial) y 1,500 tokens de salida. Eso es:

Total: aproximadamente $1 por día de uso intensivo. En comparación con ejecutar la misma carga de trabajo a través de la cuota de GPT-5.5 incluida en Cursor Pro, esto es un orden de magnitud más barato antes de que comience la limitación de cuota. El cálculo completo del recorte de precios se encuentra en El recorte de precios permanente del 75% de DeepSeek V4-Pro ya está aquí.

Para contexto sobre el resto de la línea de productos de DeepSeek, consulta Qué es DeepSeek V4 y Cómo usar la API de DeepSeek V4.

Cómo se siente V4-Pro dentro de Cursor

Se notan tres diferencias en comparación con tu modelo predeterminado de Cursor.

  1. Los tokens de pensamiento son visibles. Por defecto, el proxy renderiza el razonamiento de DeepSeek como un bloque de markdown colapsable encima de cada respuesta. El panel de chat de Cursor lo muestra como un elemento <details>. Útil para depurar prompts; ruidoso para el trabajo rutinario. Alterna con --no-display-reasoning.
  2. La latencia en la primera llamada a la herramienta es mayor. V4-Pro es un modelo de pensamiento, y la cadena se ejecuta antes de cualquier llamada a la herramienta. Espera de 2 a 4 segundos antes de que se dispare la primera herramienta, luego un rendimiento estándar en los seguimientos.
  3. Las sugerencias de “Aplicar” de Cursor mejoran en refactorizaciones complejas. Esta es la noticia principal. La cadena de razonamiento de V4-Pro detecta dependencias de múltiples archivos que los modelos de finalización planos pasan por alto. Renombramientos, cambios de firma y refactorizaciones impulsadas por configuración que solían necesitar tres rondas con GPT-5.5 a menudo se logran en una sola pasada con V4-Pro.

Existen otros tutoriales de DeepSeek con Cursor para modelos predecesores. Consulta Cómo usar DeepSeek R1 localmente con Cursor y DeepSeek V3 con Cursor: paso a paso para los patrones antiguos. El proxy de esta guía reemplaza los trucos de inyección manual de razonamiento documentados en esas publicaciones.

Probando tu configuración de DeepSeek con Apidog

La integración de Cursor solo demuestra la ruta desde dentro de Cursor. Si estás implementando V4-Pro en otras superficies (un bot de CI, un agente de backend, un plugin IDE personalizado), querrás un arnés de prueba determinista contra el mismo endpoint al que tu proxy está reenviando.

Ahí es donde Apidog se gana su lugar. Apunta un entorno de Apidog a https://api.deepseek.com/v1, introduce tu clave API e importa el esquema de finalización de chat de OpenAI. Puedes:

Descarga Apidog, importa la especificación OpenAPI de DeepSeek y tendrás un banco de pruebas V4-Pro funcionando en cinco minutos. El mismo flujo de trabajo que presentamos en Cómo usar la API de DeepSeek V4.

Errores comunes

Alternativas si el proxy no es adecuado para ti

El proxy es la ruta más limpia hoy, pero existen dos alternativas:

Otras integraciones de modelos de Cursor cubiertas en detalle: Claude Opus 4.6 con Cursor, Kimi K2.5 con Cursor y Gemini 3.0 Pro con Cursor.

Preguntas Frecuentes (FAQ)

Conclusión

La capacidad de codificación de V4-Pro se sitúa a pocos puntos de referencia de GPT-5.5 (comparación de DataCamp) a aproximadamente 1/34 del precio de salida. El único obstáculo para los usuarios de Cursor ha sido una falta de coincidencia en el contrato de la API en torno a reasoning_content. El repositorio deepseek-cursor-proxy lo resuelve en menos de cien líneas de código significativo y una configuración de cinco minutos.

Tres próximos pasos concretos:

El impuesto de los tokens de pensamiento se paga. El precio no.

botón

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs