DeepSeek V4-Pro mit Cursor nutzen: Anleitung für Reasoning Proxy Setup (2026)

Ashley Innocent

Ashley Innocent

25 May 2026

DeepSeek V4-Pro mit Cursor nutzen: Anleitung für Reasoning Proxy Setup (2026)

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Verbinden Sie DeepSeek V4-Pro mit Cursor unter Verwendung der standardmäßigen OpenAI-kompatiblen Einstellungen, und der erste Tool-Aufruf gibt einen 400-Fehler zurück. Der Grund ist klein, aber hartnäckig: V4-Pro ist ein denkendes Modell, das einen reasoning_content-Block zurückgibt. Cursor entfernt dieses Feld aus seinen Folgeanfragen, und DeepSeeks API lehnt Tool-Aufrufnachrichten ab, die die Reasoning-Kette weglassen. Ein Open-Source-Proxy unter yxlao/deepseek-cursor-proxy speichert den Reasoning-Inhalt zwischen und fügt ihn bei ausgehenden Anfragen wieder ein. Sobald der Proxy läuft, verhält sich V4-Pro wie jedes andere Modell im Custom-Model-Panel von Cursor, wobei Denk-Tokens als kollabierbares Markdown gerendert werden. Unten finden Sie die vollständige Einrichtung, die Kostenberechnung und die Liste zur Fehlerbehebung.

TL;DR

Warum Sie überhaupt einen Proxy benötigen

V4-Pro gibt in jeder Antwort zwei Dinge zurück: ein reguläres content-Feld und ein reasoning_content-Feld, das die Gedankenkette enthält. Bei gewöhnlichem Chat können Sie reasoning_content ignorieren. Das Problem beginnt mit Tool-Aufrufen.

Der API-Vertrag von DeepSeek für denkende Modelle verlangt, dass Sie, wenn Sie eine Konversation fortsetzen, die einen reasoning_content-Block enthielt, diesen Block in der nächsten Anfrage zusammen mit dem tool_calls-Ergebnis einschließen. Die Reasoning-Kette ist Teil des Konversationszustands. Cursor weiß nichts von dieser Anforderung. Es liefert einen Chat-Client im OpenAI-Stil aus, und reasoning_content ist nicht Teil des OpenAI-Schemas, daher wird das Feld entfernt. Der nächste Tool-Aufruf kommt mit HTTP 400 und einer Nachricht über ein fehlendes reasoning_content zurück.

Dies ist nicht direkt ein Cursor-Bug. Es ist eine Vertragsinkongruenz zwischen zwei Anbietern, die den Großteil ihrer API-Oberfläche teilen. Bis Cursor eine erstklassige V4-Pro-Unterstützung hinzufügt oder DeepSeek den Vertrag lockert, ist der Workaround ein Proxy, der sich daran erinnert, was Cursor vergessen hat.

Was der Proxy in drei Zeilen tut

Es macht den lokalen Port auch über einen ngrok-Tunnel zugänglich, da die benutzerdefinierte Modelleinstellung von Cursor HTTPS erfordert und eine localhost-URL nicht akzeptiert.

Der Cache befindet sich in ~/.deepseek-cursor-proxy/reasoning_content.sqlite3. Die SHA-256-Indizierung bedeutet, dass zwei parallele Konversationen nicht kollidieren. Der Reasoning-Inhalt wird genau so gespeichert, wie DeepSeek ihn zurückgegeben hat, sodass der Prompt-Cache von DeepSeek weiterhin trifft, was für die neue dauerhafte Preisgestaltung wichtig ist.

Voraussetzungen

Wenn Sie uv noch nie installiert haben, lesen Sie die offiziellen uv-Installationsdokumente. Für ngrok führt Sie der ngrok-Schnellstart durch den Authtoken-Schritt.

Schritt 1: Proxy installieren

Der schnellste Weg ist uv. Von jedem Verzeichnis aus:

uv tool install deepseek-cursor-proxy

Wenn Sie pip bevorzugen, klonen Sie das Repository und installieren Sie es als editierbares Paket:

git clone https://github.com/yxlao/deepseek-cursor-proxy.git
cd deepseek-cursor-proxy
pip install -e .

Beide Wege legen einen deepseek-cursor-proxy-Befehl in Ihren PATH. Überprüfen Sie dies mit deepseek-cursor-proxy --help.

Schritt 2: ngrok konfigurieren

Der Proxy benötigt eine öffentliche HTTPS-URL, da das benutzerdefinierte Modellfeld von Cursor http://localhost nicht akzeptiert. ngrok stellt den Tunnel bereit.

ngrok config add-authtoken YOUR_NGROK_AUTHTOKEN

Holen Sie sich Ihr Authtoken aus dem ngrok-Dashboard nach der Anmeldung. Der kostenlose Tarif gibt Ihnen bei jedem Neustart eine zufällige Subdomain. Wenn das ein Problem darstellt, fordern Sie eine reservierte Domain im Dashboard an und übergeben Sie sie dem Proxy mit --ngrok-url https://your-reserved.ngrok-free.app.

Schritt 3: Proxy starten

Die Standardeinstellungen sind für die meisten Setups in Ordnung:

deepseek-cursor-proxy

Beim ersten Start erstellt der Proxy ~/.deepseek-cursor-proxy/config.yaml, öffnet einen Tunnel und gibt die öffentliche URL aus. Die Ausgabe sieht folgendermaßen aus:

Starting deepseek-cursor-proxy
Tunnel: https://random-name.ngrok-free.app
Local:  http://127.0.0.1:9000
Cache:  /Users/you/.deepseek-cursor-proxy/reasoning_content.sqlite3

Nützliche Flags:

Lassen Sie den Proxy in einem separaten Terminal laufen oder binden Sie ihn unter macOS in einen launchctl-Job ein. Cursor kommuniziert bei jeder Anfrage mit ihm.

Schritt 4: Cursor konfigurieren

Öffnen Sie die Cursor-Einstellungen, navigieren Sie zu Modelle und fügen Sie ein benutzerdefiniertes Modell hinzu. Die benötigten Felder:

Cursor führt eine "Modell überprüfen"-Prüfung durch. Die Prüfung sendet eine einzige Chat-Vervollständigung. Ein grünes Häkchen bedeutet, dass Sie fertig sind. Ein Verbindungsfehler weist normalerweise auf die ngrok-URL hin: Kopieren Sie sie erneut aus der Proxy-Ausgabe und vergewissern Sie sich, dass sie mit /v1 endet.

Schritt 5: Modell auswählen und einen Tool-Aufruf testen

Öffnen Sie die Modellauswahl im Chat-Panel und wählen Sie Ihr neues benutzerdefiniertes Modell aus. Die erste Aufforderung, die Sie ausprobieren sollten, ist eine, die die Verwendung von Tools erzwingt, da die ursprünglichen 400-Fehler bei Tool-Aufrufen auftraten:

„Öffnen Sie die README in diesem Repository, listen Sie jeden Codeblock auf und sagen Sie mir, welche davon Sprachhinweise fehlen.“

Cursor wird einen read_file Tool-Aufruf auslösen. Wenn der Proxy seine Arbeit richtig macht, sieht die Antwortkette folgendermaßen aus:

  1. Cursor sendet die Benutzernachricht an den Proxy.
  2. Der Proxy leitet sie an DeepSeek weiter, ohne reasoning_content (es ist die erste Runde).
  3. DeepSeek gibt Text plus einen reasoning_content-Block plus eine tool_calls-Anfrage zurück.
  4. Der Proxy speichert den reasoning_content, indiziert durch den Konversationspräfix-Hash, zwischen.
  5. Cursor führt das Tool aus und sendet dann eine Folgeanfrage mit dem Tool-Ergebnis. Die Folgeanfrage enthält kein reasoning_content, weil Cursor es entfernt hat.
  6. Der Proxy sucht den zwischengespeicherten Reasoning-Inhalt anhand des Präfix-Hashs und fügt ihn vor der Weiterleitung wieder ein.
  7. DeepSeek akzeptiert die Anfrage, setzt die Argumentation fort und liefert die endgültige Antwort.

Führen Sie es mit --verbose aus, und Sie werden sehen, wie die Injektion in den Protokollen stattfindet.

Wie die Kosten in der Praxis aussehen

V4-Pro in Cursor zahlt DeepSeeks Standard-API-Raten, nicht Cursors gebündelte Kreditpreise. Diese Raten sind ab Mai 2026 dauerhaft:

Token-Typ Rate pro 1 Mio. Tokens
Eingabe (Cache-Miss) $0.435
Eingabe (Cache-Hit) $0.003625
Ausgabe $0.87

Ein arbeitsreicher Cursor-Tag sieht ungefähr so aus: 50 Chat-Runden plus 20 Tool-Aufrufketten. Jede Runde umfasst durchschnittlich vielleicht 8.000 Prompt-Tokens (Dateikontext plus System-Prompt plus Verlauf) und 1.500 Ausgabe-Tokens. Das sind:

Gesamt: etwa $1 pro arbeitsreichem Tag. Im Vergleich zur Ausführung derselben Arbeitslast über das gebündelte GPT-5.5-Kontingent von Cursor Pro ist dies eine Größenordnung günstiger, bevor die Kontingentdrosselung einsetzt. Die vollständige Preisberechnung finden Sie unter DeepSeek V4-Pro 75% Preissenkung ist jetzt dauerhaft.

Für den Kontext zum restlichen DeepSeek-Angebot siehe Was ist DeepSeek V4 und Wie man die DeepSeek V4 API verwendet.

Wie sich V4-Pro innerhalb von Cursor anfühlt

Drei Unterschiede zeigen sich im Vergleich zu Ihrem standardmäßigen Cursor-Modell.

  1. 1. Denk-Tokens sind sichtbar. Standardmäßig rendert der Proxy die Argumentation von DeepSeek als zusammenklappbaren Markdown-Block über jeder Antwort. Cursors Chat-Panel zeigt dies als <details>-Element an. Nützlich zum Debuggen von Prompts; störend für Routinearbeiten. Umschalten mit --no-display-reasoning.
  2. 2. Die Latenz beim ersten Tool-Aufruf ist höher. V4-Pro ist ein denkendes Modell, und die Kette läuft vor jedem Tool-Aufruf. Erwarten Sie 2 bis 4 Sekunden, bevor das erste Tool ausgelöst wird, danach Standarddurchsatz bei Folgeanfragen.
  3. 3. Cursors „Anwenden“-Vorschläge werden bei komplexen Refactorings besser. Das ist die Schlagzeile. Die Reasoning-Kette von V4-Pro erfasst Multi-Datei-Abhängigkeiten, die flache Completion-Modelle übersehen. Umbenennungen, Signaturänderungen und konfigurationsgesteuerte Refactorings, die früher drei Runden mit GPT-5.5 benötigten, gelingen mit V4-Pro oft in einem Durchgang.

Es gibt weitere DeepSeek-mit-Cursor-Anleitungen für Vorgängermodelle. Siehe Wie man DeepSeek R1 lokal mit Cursor verwendet und DeepSeek V3 mit Cursor: Schritt für Schritt für die älteren Muster. Der Proxy in diesem Leitfaden ersetzt die manuellen Reasoning-Injektions-Hacks, die in diesen Beiträgen dokumentiert sind.

DeepSeek-Setup mit Apidog testen

Die Cursor-Integration beweist nur den Pfad von innerhalb von Cursor. Wenn Sie V4-Pro an andere Oberflächen liefern (einen CI-Bot, einen Backend-Agenten, ein benutzerdefiniertes IDE-Plugin), möchten Sie ein deterministisches Test-Harness gegen denselben Endpunkt, an den Ihr Proxy weiterleitet.

Hier kommt Apidog ins Spiel. Richten Sie eine Apidog-Umgebung auf https://api.deepseek.com/v1 ein, fügen Sie Ihren API-Schlüssel ein und importieren Sie das OpenAI Chat Completion-Schema. Sie können:

Laden Sie Apidog herunter, importieren Sie die DeepSeek OpenAPI-Spezifikation, und Sie haben in fünf Minuten eine funktionierende V4-Pro-Testumgebung. Der gleiche Workflow, den wir in Wie man die DeepSeek V4 API verwendet durchgehen.

Häufige Fallstricke

Alternativen, wenn der Proxy nicht das Richtige für Sie ist

Der Proxy ist heute der sauberste Weg, aber es gibt zwei Alternativen:

Andere Cursor-Modellintegrationen im Detail behandelt: Claude Opus 4.6 mit Cursor, Kimi K2.5 mit Cursor und Gemini 3.0 Pro mit Cursor.

FAQ

Was das für Sie bedeutet

Die Programmierfähigkeit von V4-Pro liegt innerhalb weniger Benchmark-Punkte von GPT-5.5 (DataCamp-Vergleich) bei etwa einem 34tel des Ausgabepreises. Das einzige Hindernis für Cursor-Benutzer war bisher eine API-Vertragsinkongruenz bezüglich reasoning_content. Das deepseek-cursor-proxy-Repository löst dies mit weniger als hundert Zeilen aussagekräftigem Code und einer Fünf-Minuten-Einrichtung.

Drei konkrete nächste Schritte:

Die Denk-Token-Steuer ist bezahlt. Das Preisschild nicht.

button

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen