Cursor hat Composer 2.5 am 18. Mai 2026 veröffentlicht, und die Schlagzeile ist kaum zu übersehen: ein Codierungsmodell, das Opus 4.7 und GPT-5.5 bei echten Software-Benchmarks erreicht, während es weniger als einen Dollar pro Aufgabe kostet. Wenn Sie beruflich Code schreiben, ändert dieses Preis-Leistungs-Verhältnis die Art und Weise, wie Sie Ihren Tag planen.
Dieser Leitfaden behandelt drei Dinge, nach denen Entwickler immer wieder suchen: was Composer 2.5 tatsächlich ist, wie man es in Cursor aufruft und wie man es bei der Produktionsarbeit gut einsetzt. Sie erhalten die Benchmark-Zahlen, die Preisberechnung und einen praktischen Workflow, der das Modell mit Apidog koppelt, damit der von ihm geschriebene API-Code beim ersten Durchlauf korrekt ist.
Was ist Cursor Composer 2.5?
Composer 2.5 ist Cursors eigenes agentisches Codierungsmodell, das darauf ausgelegt ist, Dateien zu planen, zu bearbeiten, Terminalbefehle auszuführen und seine eigene Arbeit im Cursor-Editor zu überprüfen. Es ist der Nachfolger von Composer 2 und wandelt das Modell von einem "schnellen Autocomplete-Partner" in einen "Agenten, der lange Aufgaben erledigt, ohne den Faden zu verlieren".

Einige Fakten definieren es:
- Es basiert auf dem Open-Source Moonshot Kimi K2.5-Checkpoint, einer Basis mit ungefähr einer Billion Parametern.
- Cursor investierte etwa 85 % des Trainings-Compute-Budgets in Post-Training und Reinforcement Learning, nicht nur in das Basismodell.
- Es wurde mit 25-mal mehr synthetischen Aufgaben trainiert als Composer 2, einschließlich Übungen, bei denen Cursor eine Funktion löscht und das Modell sie wiederherstellen muss, bis Tests bestehen.
Das praktische Ergebnis ist ein Modell, das den Kontext über lange Sitzungen hinweg beibehält. Composer 2 war schnell, driftete aber manchmal bei mehrstufigen Arbeiten ab. Composer 2.5 hält die Anstrengung bei einer langen Aufgabe aufrecht, folgt komplexen Anweisungen zuverlässiger und kalibriert, wie viel Arbeit eine Anfrage tatsächlich benötigt, anstatt zu viel oder zu wenig zu tun.
Wenn Sie tiefergehende Informationen zur Modellfamilie wünschen, erklärt der Composer 2-Leitfaden die Architektur, auf der 2.5 aufbaut.
Was sich unter der Haube geändert hat
Drei Trainingsideen treiben den Sprung voran:
- Gezieltes RL mit textuellem Feedback. Anstatt einer einzigen Belohnung am Ende einer Aufgabe schreibt Cursor einen kurzen Hinweis, der die gewünschte Korrektur beschreibt, fügt diesen Hinweis in den lokalen Kontext ein und destilliert das Verhalten zurück in das Modell. So lernte es, das Aufrufen nicht verfügbarer Tools einzustellen.
- Synthetische Daten im großen Maßstab. Die 25-fache Zunahme an synthetischen Aufgaben bietet dem Modell wesentlich mehr Übung bei realistischen Repository-Arbeiten, die durch Tests und nicht durch "Gefühl" verifiziert werden.
- Ein geshardeter Muon-Optimierer mit Dual-Mesh HSDP. Dies ist Trainingsinfrastruktur, keine Funktion, die Sie direkt nutzen, aber es erklärt, warum Cursor ein 1T-Parameter-Modell mit einem 0,2-Sekunden-Optimiererschritt trainieren konnte. Schnellere Trainingsschleifen bedeuten mehr Iterationen bei der Qualität.
Sie müssen sich nichts davon merken, um das Modell zu verwenden. Es ist wichtig, weil es erklärt, warum Composer 2.5 bei den langen, unübersichtlichen Aufgaben, die frühere Agenten überforderten, stabiler wirkt.
Composer 2.5 Benchmarks: Wie gut ist es wirklich?
Cursor meldet Ergebnisse auf drei Suites und vergleicht sie mit Opus 4.7 und GPT-5.5. Hier ist das Bild:
| Benchmark | Composer 2.5 | Opus 4.7 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Mehrsprachig | 79.8% | 80.5% | 77.8% |
| Terminal-Bench 2.0 | 69.3% | 69.4% | 82.7% |
| CursorBench v3.1 | 63.2% | 64.8% (max) / 61.6% (Standard) | 59.2% (Standard) |
Lesen Sie es aufmerksam, und die Geschichte ist konsistent. Bei SWE-bench Mehrsprachig, einem Standardtest zur Behebung echter GitHub-Probleme über verschiedene Sprachen hinweg, liegt Composer 2.5 bei 79,8 %, innerhalb eines Punktes von Opus 4.7 und vor GPT-5.5. Das ist ein großer Sprung von Composer 2's 73,7 %. Bei CursorBench, Cursors eigener Aufgabensuite, übertrifft es die Standardeinstellung von Opus 4.7 knapp.
Der einzige Bereich, in dem es zurückliegt, ist Terminal-Bench 2.0, wo GPT-5.5 mit 82,7 % führt. Wenn Ihre Arbeit viele lange Terminal-Sequenzen beinhaltet, sollten Sie das beachten.
Die Zahl, die alles neu einordnet, sind die Kosten pro Aufgabe. Cursor meldet etwa 63 % bei CursorBench zu durchschnittlichen Kosten von unter 1 $ pro Aufgabe, während Opus 4.7 und GPT-5.5 mehrere Dollar pro Aufgabe für ähnliche oder schlechtere Ergebnisse verlangen; einige Vergleiche beziffern die Kosten der Konkurrenz auf bis zu elf Dollar. Unabhängige Berichterstattung von The Decoder kam zum gleichen Ergebnis: annähernd Spitzenqualität zu einem Bruchteil des Preises.
Composer 2.5 ist also nicht das absolut beste Modell in jeder Tabelle. Es ist das Modell, das Ihnen 95 % der Spitzenqualität für etwa ein Zehntel der Kosten bietet, was der Kompromiss ist, den die meisten Teams wünschen.
Was kostet Composer 2.5?
Cursor bietet zwei Varianten zu zwei Preispunkten an:
| Variante | Eingabe | Ausgabe | Wann sollte man es verwenden? |
|---|---|---|---|
| Standard | 0,50 $ / M Tokens | 2,50 $ / M Tokens | Standard für die meisten Agentenaufgaben; beste Kosteneffizienz |
| Schnell | 3,00 $ / M Tokens | 15,00 $ / M Tokens | Latenzsensible Arbeiten; gleiche Intelligenz, kürzere Wartezeit |
Die schnelle Variante bietet Ihnen dieselbe Modellqualität bei geringerer Latenz und ist standardmäßig im Produkt aktiviert. Sie ist immer noch günstiger als die schnellen Stufen anderer Spitzenmodelle.

Die Abrechnung hängt von Ihrem Plan ab:
- Individuelle Pläne (Pro und ähnliche) beinhalten einen eigenständigen Composer-Nutzungspool mit großzügiger inkludierter Nutzung, sodass die meisten Solo-Entwickler den Token-Preis im Alltag nicht erreichen werden.
- Team- und Enterprise-Pläne werden direkt zum API-Preis abgerechnet.
- Einführungsaktion: Cursor verdoppelte die Composer 2.5-Nutzung in der ersten Woche nach der Veröffentlichung, sodass Early Adopters zusätzliche Zeit zum Testen erhalten.
Eine ausführlichere Aufschlüsselung der Cursor-Modellabrechnung finden Sie im Cursor Composer Preisleitfaden. Wenn Sie es ohne Kosten nutzen möchten, deckt die kostenlose Composer-Anleitung den Weg der inkludierten Nutzung ab.
So greifen Sie auf Cursor Composer 2.5 zu
Der Zugriff auf das Modell dauert etwa eine Minute.
- Cursor aktualisieren. Composer 2.5 benötigt eine aktuelle Version. Öffnen Sie Cursor, suchen Sie nach Updates (Cursor-Menü unter macOS, Hilfe-Menü an anderer Stelle) und starten Sie bei einer Installation neu.
- Melden Sie sich bei einem Plan an, der es enthält. Pro- und Business-Pläne beinhalten die Composer-Nutzung. Ein kostenloses Konto kann es immer noch über die enthaltenen Kontingente ausprobieren, aber eine intensive Nutzung erfordert einen kostenpflichtigen Plan.
- Öffnen Sie die Modellauswahl. Starten Sie eine Chat- oder Agenten-Sitzung und öffnen Sie dann das Modell-Dropdown-Menü. Wählen Sie
composer-2.5. Normalerweise sehen Sie standardmäßig die schnelle Variante ausgewählt. - Agentenmodus bestätigen. Composer wurde für die Agentenarbeit entwickelt, daher verwenden Sie den Agentenmodus anstelle des einfachen Chats, um Dateiänderungen, Terminalzugriff und Tool-Nutzung zu erhalten.
Das ist die gesamte Einrichtung. Das Modell hat Zugriff auf jedes Agenten-Tool, das Cursor bereitstellt: Dateien lesen und bearbeiten, Terminalbefehle ausführen und Tools aufrufen. Die offiziellen Composer 2.5 Modelldokumente listen die aktuellen Standardwerte auf, falls Cursor sie ändert.
Wenn Sie Cursor bereits verwendet haben, aber noch nicht den Agenten, ist die Cursor 2.0 Übersicht eine gute Einführung in die Funktionsweise der Agentenoberfläche.
So nutzen Sie Composer 2.5 effektiv
Der Zugriff ist einfach. Eine starke Ausgabe zu erzielen, erfordert ein wenig Technik.
Lassen Sie es lange Aufgaben ausführen. Die wichtigste Verbesserung von Composer 2.5 ist die anhaltende Leistung. Geben Sie ihm eine echte Aufgabe mit einem klaren Endzustand ("Fügen Sie Paginierung zum Bestellendpunkt hinzu und aktualisieren Sie die Tests"), anstatt jede Zeile einzeln zu überwachen. Es ist darauf trainiert, weiterzumachen, bis die Tests bestehen.
Schreiben Sie die Erfolgsbedingung in den Prompt. Das Modell wurde anhand von Testüberprüfungen trainiert. Wenn Sie ihm sagen, wie Sie das Ergebnis beurteilen werden ("alle vorhandenen Tests bleiben grün und der neue Endpunkt gibt bei ungültiger Eingabe 422 zurück"), korrigiert es sich selbst in Richtung dieses Ziels.
Wählen Sie die richtige Variante. Verwenden Sie die Standardvariante für kostensensitive Batch-Arbeiten und die schnelle Variante, wenn Sie live iterieren und auf jede Antwort warten. Die Qualität ist gleich; Sie tauschen nur Latenz gegen Kosten.
Halten Sie seinen Kontext ehrlich. Agentische Modelle sind stark, aber sie raten immer noch, wenn sie die tatsächliche Form einer API nicht kennen. Das ist der Fehlerfall, den es zu vermeiden gilt, und hier kommt Ihre API-Tooling ins Spiel.
Composer 2.5 plus Ihr API-Workflow
Die meisten echten Programmieraufgaben betreffen eine API. Bitten Sie Composer 2.5, "einen Client für unseren Zahlungsdienst zu schreiben", und es wird sauber aussehenden Code produzieren; das Risiko besteht darin, dass die Endpunkte, Felder und die Authentifizierung dem entsprechen, was das Modell annimmt, anstatt dem, was Ihr Dienst tatsächlich bereitstellt. Falscher, aber selbstbewusster Code ist langsamer als gar kein Code.
Zwei Praktiken beheben dies:
Erstens: Füttern Sie das Modell mit Ihrer echten API-Spezifikation, anstatt es raten zu lassen. Der Apidog MCP-Server verbindet Ihre Apidog API-Spezifikation direkt mit Cursor, sodass Composer 2.5 Anforderungscode, Typen und Tests gegen Ihr tatsächliches Schema generiert. Wenn Sie auch andere Agenten verwenden, deckt die Zusammenfassung der besten MCP-Server für Cursor ergänzende Optionen ab.
Zweitens, überprüfen Sie die generierten Aufrufe, bevor sie den Branch eines Teamkollegen erreichen. Fügen Sie die von Composer 2.5 geschriebenen Endpunkte in Apidog ein, senden Sie echte Anfragen, überprüfen Sie Statuscodes und Antwortformen und verwandeln Sie die funktionierenden Aufrufe in automatisierte Tests und Mock-Server. Das Modell schreibt den ersten Entwurf; Apidog bestätigt, dass er funktioniert. Diese Schleife – Generieren anhand einer echten Spezifikation, dann Testen gegen einen echten Server – verhindert, dass die Agentengeschwindigkeit zu Debugging-Schulden wird.
Composer 2.5 vs. die Konkurrenz
Kurze Orientierungshilfe, wenn Sie ein "Daily Driver" auswählen:
- vs. Opus 4.7: Nahezu identisch bei SWE-bench Mehrsprachig und CursorBench, deutlich günstiger pro Aufgabe. Opus führt immer noch an der absoluten Spitze der maximalen CursorBench-Einstellung.
- vs. GPT-5.5: Composer 2.5 gewinnt bei SWE-bench Mehrsprachig und CursorBench; GPT-5.5 führt deutlich bei Terminal-Bench 2.0.
- vs. Claude Code: Andere Art von Tool. Composer 2.5 lebt im Cursor-Editor; Claude Code ist ein Terminal-Agent. Der Vergleich von Claude Code vs. Cursor erklärt, welches für welchen Workflow besser geeignet ist.
- vs. GitHub Copilot: Copilot ist am stärksten als Inline-Vervollständigung; Composer 2.5 ist für Multi-File-Agentenaufgaben konzipiert. Der Cursor vs. GitHub Copilot Leitfaden geht tiefer.
Cursor kündigte außerdem an, ein viel größeres Modell mit xAI unter Einsatz etwa der zehnfachen Rechenleistung zu trainieren, sodass 2.5 ein Zwischenstand auf einer steileren Kurve ist, nicht die Obergrenze.
Häufig gestellte Fragen
Ist Composer 2.5 kostenlos? Es gibt keine vollständig kostenlose Stufe, aber individuelle Pläne beinhalten einen Composer-Nutzungspool, der die normale tägliche Arbeit abdeckt, und Cursor verdoppelte die Nutzung in der Einführungswoche. Der Leitfaden Composer kostenlos erklärt, wie weit das enthaltene Kontingent reicht.
Ist Composer 2.5 besser als Composer 2? Ja, messbar. SWE-bench Mehrsprachig stieg von 73,7 % auf 79,8 %, und das Modell behält den Kontext bei langen Aufgaben viel besser bei. Der Composer 2 Leitfaden ist die Basis, auf der es verbessert wurde.
Auf welchem Modell basiert Composer 2.5? Es basiert auf Moonshots Open-Source Kimi K2.5-Checkpoint und wird dann von Cursor intensiv mit Reinforcement Learning und synthetischen Aufgaben nachgeschult.
Welche Variante soll ich wählen, Standard oder Schnell? Gleiche Intelligenz, unterschiedliche Latenz und Preis. Verwenden Sie Standard für kosteneffiziente Batch-Arbeiten, Schnell, wenn Sie live iterieren.
Funktioniert Composer 2.5 mit API-Spezifikationen und MCP? Ja. Es unterstützt die vollständige Agenten-Tool-Suite von Cursor, einschließlich MCP. Verbinden Sie Ihre API-Spezifikation über den Apidog MCP-Server, damit es gegen Ihr echtes Schema codiert.
Unterm Strich
Composer 2.5 ist das bisher deutlichste Zeichen dafür, dass sich "Spitzenqualität im Coding" und "teuer" voneinander entkoppeln. Sie erhalten Ergebnisse auf Opus 4.7-Niveau bei realen Softwareaufgaben für weit unter einem Dollar pro Aufgabe, und das in einem Editor, der für die Agentenarbeit konzipiert ist. Aktualisieren Sie Cursor, wählen Sie composer-2.5 im Modell-Dropdown und geben Sie ihm echte mehrstufige Aufgaben anstelle von Einzeilern.
Kombiniert man es mit einer engen Verifizierungsschleife, vervielfacht sich die Geschwindigkeit tatsächlich. Generieren Sie API-Code anhand Ihrer echten Spezifikation, dann laden Sie Apidog herunter, um Live-Anfragen zu senden, die Antworten zu bestätigen und die funktionierenden Aufrufe in automatisierte Tests und Mocks zu überführen. Schneller Code, den Sie verifiziert haben, ist besser als schneller Code, den Sie debuggen müssen.
