Verbinden Sie DeepSeek V4-Pro mit Cursor unter Verwendung der standardmäßigen OpenAI-kompatiblen Einstellungen, und der erste Tool-Aufruf gibt einen 400-Fehler zurück. Der Grund ist klein, aber hartnäckig: V4-Pro ist ein denkendes Modell, das einen reasoning_content-Block zurückgibt. Cursor entfernt dieses Feld aus seinen Folgeanfragen, und DeepSeeks API lehnt Tool-Aufrufnachrichten ab, die die Reasoning-Kette weglassen. Ein Open-Source-Proxy unter yxlao/deepseek-cursor-proxy speichert den Reasoning-Inhalt zwischen und fügt ihn bei ausgehenden Anfragen wieder ein. Sobald der Proxy läuft, verhält sich V4-Pro wie jedes andere Modell im Custom-Model-Panel von Cursor, wobei Denk-Tokens als kollabierbares Markdown gerendert werden. Unten finden Sie die vollständige Einrichtung, die Kostenberechnung und die Liste zur Fehlerbehebung.
TL;DR
- Cursor plus DeepSeek V4-Pro gibt standardmäßig 400-Fehler zurück, da V4-Pro ein denkendes Modell ist und Cursor
reasoning_contentbei Tool-Aufrufnachrichten entfernt. deepseek-cursor-proxy(Open Source, Python) sitzt zwischen Cursor und DeepSeek, speichert den Reasoning-Inhalt jeder Konversation zwischen und fügt ihn wieder ein, damit Tool-Aufrufe nicht fehlschlagen.- Einrichtung: Installieren Sie über
uvoderpip, führen Siedeepseek-cursor-proxyaus, fügen Sie die ngrok-URL plus Ihren DeepSeek API-Schlüssel in die benutzerdefinierten Modelleinstellungen von Cursor ein. - V4-Pro in Cursor kostet jetzt ~$0,87 pro Million Ausgabetokens, was etwa 34x günstiger ist als GPT-5.5 bei der Ausgabe. Den vollständigen Preisrahmen finden Sie unter DeepSeek V4-Pro 75% Preissenkung ist jetzt dauerhaft.
Warum Sie überhaupt einen Proxy benötigen
V4-Pro gibt in jeder Antwort zwei Dinge zurück: ein reguläres content-Feld und ein reasoning_content-Feld, das die Gedankenkette enthält. Bei gewöhnlichem Chat können Sie reasoning_content ignorieren. Das Problem beginnt mit Tool-Aufrufen.
Der API-Vertrag von DeepSeek für denkende Modelle verlangt, dass Sie, wenn Sie eine Konversation fortsetzen, die einen reasoning_content-Block enthielt, diesen Block in der nächsten Anfrage zusammen mit dem tool_calls-Ergebnis einschließen. Die Reasoning-Kette ist Teil des Konversationszustands. Cursor weiß nichts von dieser Anforderung. Es liefert einen Chat-Client im OpenAI-Stil aus, und reasoning_content ist nicht Teil des OpenAI-Schemas, daher wird das Feld entfernt. Der nächste Tool-Aufruf kommt mit HTTP 400 und einer Nachricht über ein fehlendes reasoning_content zurück.
Dies ist nicht direkt ein Cursor-Bug. Es ist eine Vertragsinkongruenz zwischen zwei Anbietern, die den Großteil ihrer API-Oberfläche teilen. Bis Cursor eine erstklassige V4-Pro-Unterstützung hinzufügt oder DeepSeek den Vertrag lockert, ist der Workaround ein Proxy, der sich daran erinnert, was Cursor vergessen hat.
Was der Proxy in drei Zeilen tut
- Hört an einem lokalen Port (Standard 9000) auf ausgehende Chat-Anfragen von Cursor.
- Speichert
reasoning_contentvon jeder V4-Pro-Antwort im Cache, indiziert durch SHA-256 des kanonischen Konversationspräfixes. - Bei jeder neuen Anfrage sucht es den zwischengespeicherten Reasoning-Inhalt für das passende Präfix und fügt ihn der Nachricht hinzu, bevor er an DeepSeek weitergeleitet wird.
Es macht den lokalen Port auch über einen ngrok-Tunnel zugänglich, da die benutzerdefinierte Modelleinstellung von Cursor HTTPS erfordert und eine localhost-URL nicht akzeptiert.
Der Cache befindet sich in ~/.deepseek-cursor-proxy/reasoning_content.sqlite3. Die SHA-256-Indizierung bedeutet, dass zwei parallele Konversationen nicht kollidieren. Der Reasoning-Inhalt wird genau so gespeichert, wie DeepSeek ihn zurückgegeben hat, sodass der Prompt-Cache von DeepSeek weiterhin trifft, was für die neue dauerhafte Preisgestaltung wichtig ist.
Voraussetzungen
- Cursor 2.0 oder neuer. Die Benutzeroberfläche für benutzerdefinierte Modelle ist in 3.x dieselbe; beide funktionieren.
- Ein DeepSeek API-Schlüssel. Melden Sie sich unter platform.deepseek.com an, falls Sie keinen haben. Ein kleiner Saldo reicht aus; Preisdetails finden Sie unten.
- Python 3.11 oder neuer. Der Proxy ist reines Python.
uvwird empfohlen, aber pip funktioniert auch. - Ein ngrok-Konto mit einem Authtoken. Der kostenlose Tarif ist für Solo-Entwickler ausreichend. Statische Domains sind optional, erleichtern aber das Leben, wenn Sie den Proxy oft neu starten.
Wenn Sie uv noch nie installiert haben, lesen Sie die offiziellen uv-Installationsdokumente. Für ngrok führt Sie der ngrok-Schnellstart durch den Authtoken-Schritt.
Schritt 1: Proxy installieren
Der schnellste Weg ist uv. Von jedem Verzeichnis aus:
uv tool install deepseek-cursor-proxy
Wenn Sie pip bevorzugen, klonen Sie das Repository und installieren Sie es als editierbares Paket:
git clone https://github.com/yxlao/deepseek-cursor-proxy.git
cd deepseek-cursor-proxy
pip install -e .
Beide Wege legen einen deepseek-cursor-proxy-Befehl in Ihren PATH. Überprüfen Sie dies mit deepseek-cursor-proxy --help.
Schritt 2: ngrok konfigurieren
Der Proxy benötigt eine öffentliche HTTPS-URL, da das benutzerdefinierte Modellfeld von Cursor http://localhost nicht akzeptiert. ngrok stellt den Tunnel bereit.
ngrok config add-authtoken YOUR_NGROK_AUTHTOKEN
Holen Sie sich Ihr Authtoken aus dem ngrok-Dashboard nach der Anmeldung. Der kostenlose Tarif gibt Ihnen bei jedem Neustart eine zufällige Subdomain. Wenn das ein Problem darstellt, fordern Sie eine reservierte Domain im Dashboard an und übergeben Sie sie dem Proxy mit --ngrok-url https://your-reserved.ngrok-free.app.
Schritt 3: Proxy starten
Die Standardeinstellungen sind für die meisten Setups in Ordnung:
deepseek-cursor-proxy
Beim ersten Start erstellt der Proxy ~/.deepseek-cursor-proxy/config.yaml, öffnet einen Tunnel und gibt die öffentliche URL aus. Die Ausgabe sieht folgendermaßen aus:
Starting deepseek-cursor-proxy
Tunnel: https://random-name.ngrok-free.app
Local: http://127.0.0.1:9000
Cache: /Users/you/.deepseek-cursor-proxy/reasoning_content.sqlite3
Nützliche Flags:
--port 9000: Ändert den lokalen Port, falls 9000 belegt ist.--verbose: Zeigt Anfrage- und Antwortkörper an. Verwenden Sie dies beim Debuggen der Cursor-Integration.--no-ngrok: Überspringt den Tunnel. Nützlich beim Testen mit einem Tool, dashttp://localhostakzeptiert.--no-display-reasoning: Entfernt die kollabierbaren Denkblöcke aus der Ansicht von Cursor. Die Argumentation fließt weiterhin durch; nur die Darstellung wird unterdrückt.
Lassen Sie den Proxy in einem separaten Terminal laufen oder binden Sie ihn unter macOS in einen launchctl-Job ein. Cursor kommuniziert bei jeder Anfrage mit ihm.
Schritt 4: Cursor konfigurieren
Öffnen Sie die Cursor-Einstellungen, navigieren Sie zu Modelle und fügen Sie ein benutzerdefiniertes Modell hinzu. Die benötigten Felder:
- Modellname:
deepseek-v4-pro. Der Proxy leitet diese Zeichenfolge direkt an DeepSeek weiter, daher muss sie mit einem echten DeepSeek-Modellbezeichner übereinstimmen. Verwenden Siedeepseek-v4-flashfür die günstigere Variante. - Basis-URL: die ngrok-URL, die der Proxy ausgegeben hat, plus
/v1. Beispiel:https://random-name.ngrok-free.app/v1. - API-Schlüssel: Ihr DeepSeek API-Schlüssel (beginnt mit
sk-). Der Proxy hat keine eigene Authentifizierungsebene; er leitet den Schlüssel unverändert weiter.
Cursor führt eine "Modell überprüfen"-Prüfung durch. Die Prüfung sendet eine einzige Chat-Vervollständigung. Ein grünes Häkchen bedeutet, dass Sie fertig sind. Ein Verbindungsfehler weist normalerweise auf die ngrok-URL hin: Kopieren Sie sie erneut aus der Proxy-Ausgabe und vergewissern Sie sich, dass sie mit /v1 endet.
Schritt 5: Modell auswählen und einen Tool-Aufruf testen
Öffnen Sie die Modellauswahl im Chat-Panel und wählen Sie Ihr neues benutzerdefiniertes Modell aus. Die erste Aufforderung, die Sie ausprobieren sollten, ist eine, die die Verwendung von Tools erzwingt, da die ursprünglichen 400-Fehler bei Tool-Aufrufen auftraten:
„Öffnen Sie die README in diesem Repository, listen Sie jeden Codeblock auf und sagen Sie mir, welche davon Sprachhinweise fehlen.“
Cursor wird einen read_file Tool-Aufruf auslösen. Wenn der Proxy seine Arbeit richtig macht, sieht die Antwortkette folgendermaßen aus:
- Cursor sendet die Benutzernachricht an den Proxy.
- Der Proxy leitet sie an DeepSeek weiter, ohne
reasoning_content(es ist die erste Runde). - DeepSeek gibt Text plus einen
reasoning_content-Block plus einetool_calls-Anfrage zurück. - Der Proxy speichert den
reasoning_content, indiziert durch den Konversationspräfix-Hash, zwischen. - Cursor führt das Tool aus und sendet dann eine Folgeanfrage mit dem Tool-Ergebnis. Die Folgeanfrage enthält kein
reasoning_content, weil Cursor es entfernt hat. - Der Proxy sucht den zwischengespeicherten Reasoning-Inhalt anhand des Präfix-Hashs und fügt ihn vor der Weiterleitung wieder ein.
- DeepSeek akzeptiert die Anfrage, setzt die Argumentation fort und liefert die endgültige Antwort.
Führen Sie es mit --verbose aus, und Sie werden sehen, wie die Injektion in den Protokollen stattfindet.
Wie die Kosten in der Praxis aussehen
V4-Pro in Cursor zahlt DeepSeeks Standard-API-Raten, nicht Cursors gebündelte Kreditpreise. Diese Raten sind ab Mai 2026 dauerhaft:
| Token-Typ | Rate pro 1 Mio. Tokens |
|---|---|
| Eingabe (Cache-Miss) | $0.435 |
| Eingabe (Cache-Hit) | $0.003625 |
| Ausgabe | $0.87 |
Ein arbeitsreicher Cursor-Tag sieht ungefähr so aus: 50 Chat-Runden plus 20 Tool-Aufrufketten. Jede Runde umfasst durchschnittlich vielleicht 8.000 Prompt-Tokens (Dateikontext plus System-Prompt plus Verlauf) und 1.500 Ausgabe-Tokens. Das sind:
- 50 Runden × 8.000 Eingabe × $0.435 / 1.000.000 = $1.74 im schlimmsten Fall
- Mit Cache-Hits bei einem 6.000-Token System- und Kontext-Präfix zu 60%: etwa $0.85
- 50 × 1.500 × $0.87 / 1.000.000 = $0.065 Ausgabe
Gesamt: etwa $1 pro arbeitsreichem Tag. Im Vergleich zur Ausführung derselben Arbeitslast über das gebündelte GPT-5.5-Kontingent von Cursor Pro ist dies eine Größenordnung günstiger, bevor die Kontingentdrosselung einsetzt. Die vollständige Preisberechnung finden Sie unter DeepSeek V4-Pro 75% Preissenkung ist jetzt dauerhaft.
Für den Kontext zum restlichen DeepSeek-Angebot siehe Was ist DeepSeek V4 und Wie man die DeepSeek V4 API verwendet.
Wie sich V4-Pro innerhalb von Cursor anfühlt
Drei Unterschiede zeigen sich im Vergleich zu Ihrem standardmäßigen Cursor-Modell.
- 1. Denk-Tokens sind sichtbar. Standardmäßig rendert der Proxy die Argumentation von DeepSeek als zusammenklappbaren Markdown-Block über jeder Antwort. Cursors Chat-Panel zeigt dies als
<details>-Element an. Nützlich zum Debuggen von Prompts; störend für Routinearbeiten. Umschalten mit--no-display-reasoning. - 2. Die Latenz beim ersten Tool-Aufruf ist höher. V4-Pro ist ein denkendes Modell, und die Kette läuft vor jedem Tool-Aufruf. Erwarten Sie 2 bis 4 Sekunden, bevor das erste Tool ausgelöst wird, danach Standarddurchsatz bei Folgeanfragen.
- 3. Cursors „Anwenden“-Vorschläge werden bei komplexen Refactorings besser. Das ist die Schlagzeile. Die Reasoning-Kette von V4-Pro erfasst Multi-Datei-Abhängigkeiten, die flache Completion-Modelle übersehen. Umbenennungen, Signaturänderungen und konfigurationsgesteuerte Refactorings, die früher drei Runden mit GPT-5.5 benötigten, gelingen mit V4-Pro oft in einem Durchgang.
Es gibt weitere DeepSeek-mit-Cursor-Anleitungen für Vorgängermodelle. Siehe Wie man DeepSeek R1 lokal mit Cursor verwendet und DeepSeek V3 mit Cursor: Schritt für Schritt für die älteren Muster. Der Proxy in diesem Leitfaden ersetzt die manuellen Reasoning-Injektions-Hacks, die in diesen Beiträgen dokumentiert sind.
DeepSeek-Setup mit Apidog testen
Die Cursor-Integration beweist nur den Pfad von innerhalb von Cursor. Wenn Sie V4-Pro an andere Oberflächen liefern (einen CI-Bot, einen Backend-Agenten, ein benutzerdefiniertes IDE-Plugin), möchten Sie ein deterministisches Test-Harness gegen denselben Endpunkt, an den Ihr Proxy weiterleitet.

Hier kommt Apidog ins Spiel. Richten Sie eine Apidog-Umgebung auf https://api.deepseek.com/v1 ein, fügen Sie Ihren API-Schlüssel ein und importieren Sie das OpenAI Chat Completion-Schema. Sie können:
- Zeichnen Sie „goldene“ Antworten von V4-Pro auf und spielen Sie diese bei jeder Prompt-Änderung ab, um Abweichungen zu erkennen.
- Validieren Sie
tool_calls-Formen mit JSON-Schema-Assertions, damit eine fehlerhafte System-Prompt-Bearbeitung Ihren Produktions-Agenten nicht stillschweigend unterbricht. - Vergleichen Sie V4-Pro und GPT-5.5 Seite an Seite auf demselben Eingabe-Batch mithilfe der Testszenarien von Apidog.
Laden Sie Apidog herunter, importieren Sie die DeepSeek OpenAPI-Spezifikation, und Sie haben in fünf Minuten eine funktionierende V4-Pro-Testumgebung. Der gleiche Workflow, den wir in Wie man die DeepSeek V4 API verwendet durchgehen.
Häufige Fallstricke
- 400-Fehler nach dem ersten Tool-Aufruf. Der klassische Fehlermodus, den dieser Proxy beheben sollte. Wenn Sie ihn nach der Einrichtung immer noch sehen, läuft der Proxy nicht oder Cursor zeigt auf die falsche Basis-URL. Überprüfen Sie erneut, ob die URL mit
/v1endet und ob das Proxy-Log eingehende Anfragen anzeigt. - ngrok-Tunnel stellt die Verbindung immer wieder her. Kostenlose Tunnel rotieren bei jedem Neustart. Wenn die Verifizierung von Cursor erfolgreich ist, aber Minuten später fehlschlägt, hat Ihr Tunnel gewechselt. Wechseln Sie zu einer reservierten Domain (Ein-Klick im ngrok-Dashboard) und übergeben Sie diese mit
--ngrok-url. - Reasoning-Inhalt wird dupliziert angezeigt. Dies geschieht, wenn zwei Proxy-Instanzen mit demselben SQLite-Cache-Pfad laufen. Beenden Sie beide, löschen Sie
~/.deepseek-cursor-proxy/reasoning_content.sqlite3und starten Sie eine Instanz. - Die Cache-Trefferquote scheint niedrig. DeepSeeks Prompt-Cache erfordert byte-identische Präfixe. Cursor fügt Zeitstempel und Sitzungs-IDs in einige System-Prompts ein, was Cache-Hits verhindert. Die Lösung liegt nicht im Proxy; akzeptieren Sie entweder die Kosten oder verwenden Sie Cursors "no-system-prompt"-Modus für V4-Pro-Sitzungen.
- Cursor meldet "Modell nicht gefunden". Der Modellname in den Cursor-Einstellungen muss mit einem echten DeepSeek-Modell übereinstimmen. Gültige Werte sind heute
deepseek-v4-pro,deepseek-v4-flash,deepseek-v3-2-prounddeepseek-r1-1. Der Proxy übersetzt keine Namen; er leitet sie weiter.
Alternativen, wenn der Proxy nicht das Richtige für Sie ist
Der Proxy ist heute der sauberste Weg, aber es gibt zwei Alternativen:
- V4-Flash ohne den Proxy. V4-Flash ist kein denkendes Modell und gibt kein
reasoning_contentzurück. Cursor kommuniziert direkt mit ihm ohne Workaround. Sie verzichten auf den Chain-of-Thought-Boost, halten die Integration aber einfach. Die Preise betragen $0.14 / $0.28 pro Million Tokens. - Cline, Continue oder andere KI-IDE-Plugins mit nativer Unterstützung für Denkmodelle. Diese Tools behandeln
reasoning_contentbei Tool-Aufrufnachrichten nativ. Wenn Sie nicht speziell an Cursor gebunden sind, ist der Wechsel des Editors manchmal einfacher als das Betreiben des Proxys. Siehe Beste Open-Source-Coding-Assistenten 2026: kostenlose Cursor-Alternativen für das Feld.
Andere Cursor-Modellintegrationen im Detail behandelt: Claude Opus 4.6 mit Cursor, Kimi K2.5 mit Cursor und Gemini 3.0 Pro mit Cursor.
FAQ
- Warum unterstützt Cursor DeepSeek V4-Pro nicht nativ? Cursors Chat-Client folgt dem OpenAI Chat Completions-Schema.
reasoning_contentist nicht Teil dieses Schemas; es ist eine DeepSeek-spezifische Erweiterung, die mit der R1-Familie entstand und in V4-Pro beibehalten wurde. Cursor müsste eine anbieterspezifische Behandlung hinzufügen, um das Feld durchzuleiten. Das mag passieren; bis dahin ist der Proxy der Workaround. - Funktioniert der Proxy mit DeepSeek R1 oder V3.2? Ja. Jedes DeepSeek-Denkmodell, das
reasoning_contentzurückgibt und es bei Tool-Aufruf-Folgeanfragen erfordert, wird unterstützt. Legen Sie den Modellnamen in den Cursor-Einstellungen auf den echten DeepSeek-Modellbezeichner fest. - Ist der Proxy sicher, wenn er ständig läuft? Ja, mit einer Einschränkung: Der SQLite-Cache enthält rohen Reasoning-Inhalt aus Ihren Sitzungen. Wenn Sie Multi-User-Setups betreiben oder Maschinen teilen, schränken Sie die Berechtigungen des Cache-Verzeichnisses ein oder führen Sie ihn mit
--no-cacheaus (nur im Speicher, was bedeutet, dass Tool-Aufrufe nach einem Proxy-Neustart fehlschlagen). - Kann ich den Proxy ohne ngrok verwenden? Ja, mit
--no-ngrok. Der Proxy macht dann nurhttp://127.0.0.1:9000zugänglich. Cursors benutzerdefinierte Modell-UI lehnthttp://-URLs in Standardversionen ab, aber einige seitwärts geladene Builds und gepatchte Konfigurationen akzeptieren Localhost. Die meisten Benutzer werden ngrok oder ein Äquivalent (Cloudflare Tunnel, Tailscale Funnel) wünschen. - Funktioniert das mit Cursor Composer 2.5? Composer verwendet dieselbe Modell-Routing-Pipeline wie das Chat-Panel, also ja. Der erste Tool-Aufruf innerhalb eines Composer-Agenten wird dieselbe
reasoning_content-Anforderung auslösen, und der Proxy behebt dies auf dieselbe Weise. - Wie hoch ist der Latenz-Overhead des Proxys? Vernachlässigbar. Der Proxy fügt pro Anfrage einen lokalen Netzwerk-Hop, eine SQLite-Suche und ein paar KB JSON-Manipulation hinzu. Der gemessene Overhead beträgt 5 bis 15 ms pro Aufruf. ngrok fügt je nach nächstgelegenem Edge 30 bis 80 ms hinzu. Der Proxy ist nicht der Engpass.
- Wie entscheidet der Proxy, was er cachen soll? Er hasht das Konversationspräfix (alles vor der letzten Benutzer- oder Tool-Nachricht), ordnet den SHA-256 dieses Hashes dem
reasoning_contentaus der letzten DeepSeek-Antwort zu und speichert beides in SQLite. Bei der nächsten Anfrage berechnet er den Hash des neuen Präfixes und sucht den passenden Eintrag. Dies ist konservativ. Teilweise Präfix-Übereinstimmungen lösen keinen Cache-Hit aus, sodass zwei nahezu identische Konversationen sich nicht gegenseitig verunreinigen. - Werden Anthropic, OpenAI oder Cursor dies unterbrechen? Anthropic und OpenAI sind nicht beteiligt. Cursor könnte entweder native Unterstützung für Denkmodelle hinzufügen (wobei der Proxy überflüssig würde) oder das Anfrageformat auf eine Weise ändern, die den Proxy unterbricht. Das Repository wird gepflegt; beobachten Sie dessen Issues für Kompatibilitätsupdates.
Was das für Sie bedeutet
Die Programmierfähigkeit von V4-Pro liegt innerhalb weniger Benchmark-Punkte von GPT-5.5 (DataCamp-Vergleich) bei etwa einem 34tel des Ausgabepreises. Das einzige Hindernis für Cursor-Benutzer war bisher eine API-Vertragsinkongruenz bezüglich reasoning_content. Das deepseek-cursor-proxy-Repository löst dies mit weniger als hundert Zeilen aussagekräftigem Code und einer Fünf-Minuten-Einrichtung.
Drei konkrete nächste Schritte:
- Installieren Sie den Proxy und führen Sie einen Side-by-Side-Test gegen Ihr aktuelles Cursor-Standardmodell an fünf echten Pull-Requests aus Ihrem Repository durch.
- Überprüfen Sie Ihren Cursor-System-Prompt auf variablen Inhalt (Zeitstempel, Sitzungs-IDs), der Cache-Hits zerstört. Verschieben Sie diesen Inhalt in die Benutzernachricht.
- Richten Sie eine Apidog-Regressions-Suite gegen
api.deepseek.comein, damit Sie Vertragsabweichungen erkennen können, ohne jedes Mal über Cursor erneut testen zu müssen.
Die Denk-Token-Steuer ist bezahlt. Das Preisschild nicht.
