Moonshot AI hat gerade Kimi K2.7 Code ausgeliefert, ein Open-Weight-Modell, das speziell für die Softwareentwicklung und den Betrieb von Code-Agenten entwickelt wurde. Es behält den Trillionen-Parameter-Maßstab der Kimi K2-Linie bei, fügt Vision hinzu und reduziert die Kosten für Denk-Tokens, die frühere Agentenläufe teuer machten. Wenn Sie Kimi K2.6 oder dessen API verwendet haben, ist dies der auf Codierung abgestimmte Nachfolger; es wird auch mit einem Terminal-Agenten namens Kimi Code ausgeliefert, der direkt mit Claude Code und Codex konkurriert.
Hier erfahren Sie, was das Modell eigentlich ist, was sich geändert hat, wie es bewertet wird und wo Sie es heute ausführen können.
TL;DR
- Kimi K2.7 Code ist ein Mixture-of-Experts-Modell: 1 Billion Gesamtparameter, 32 Milliarden aktiv pro Token.
- Es fügt ein 256K Token Kontextfenster, Vision (Bild- und Videoeingabe über einen MoonViT-Encoder) und etwa 30% weniger Denk-Tokens als K2.6 für die gleiche Arbeit hinzu.
- Die Gewichte sind öffentlich unter einer modifizierten MIT-Lizenz verfügbar; Sie können sie mit vLLM, SGLang oder KTransformers selbst hosten.
- Auf den von Moonshot berichteten Benchmarks liegt es bei Codierungs- und Agentenaufgaben knapp hinter GPT-5.5 und Claude Opus; das Argument sind offene Gewichte plus Kosten, nicht das Anführen der Tabelle.
- Es wird mit Kimi Code, einem Terminal- und IDE-Code-Agenten, und einer OpenAI-kompatiblen API geliefert, die Sie in wenigen Minuten mit Apidog testen können.
Kimi K2.7 Code in einem Absatz
Kimi K2.7 Code ist die auf Codierung spezialisierte Version der K2-Familie von Moonshot AI. Es verwendet das gleiche dünnbesetzte Mixture-of-Experts-Design wie neuere Kimi-Modelle, sodass nur ein Bruchteil seiner Gewichte bei einem bestimmten Token aktiv ist. Das Suffix „Code“ ist der Punkt: Moonshot hat diesen Checkpoint für die Softwareentwicklung, mehrstufige Tool-Aufrufe und lange Agentensitzungen optimiert, anstatt für allgemeine Chats. Die wichtigsten Upgrades gegenüber K2.6 sind native multimodale Eingaben, ein schlankeres Denkbudget und eine engere Integration mit Moonshots eigenem Agenten-Framework. Sie können es über die Kimi Web-App, die Kimi Code CLI, eine gehostete API oder durch Herunterladen der Gewichte von Hugging Face verwenden.
Was sich gegenüber Kimi K2.6 geändert hat
Wenn Sie bereits unseren Kimi K2.6 Erklärer gelesen haben, sind drei Unterschiede am wichtigsten.

Es ist zuerst für Code und Agenten optimiert. K2.6 war ein starker Generalist. K2.7 Code konzentriert sich auf Codierungs-Workflows: Refactoring, Debugging, Codebasis-Erkundung und das Verketten von Tool-Aufrufen, ohne den Überblick über die Aufgabe zu verlieren.
Denken ist günstiger. Moonshot berichtet über eine Reduzierung des Verbrauchs von Denk-Tokens um etwa 30% gegenüber K2.6 für vergleichbare Ergebnisse. Denk-Tokens sind abrechenbare Tokens, daher wirkt sich eine 30%ige Reduzierung direkt auf die Kosten und Latenz Ihres Agentenlaufs aus. Bei einer langen Codierungssitzung mit Hunderten von Tool-Aufrufen summiert sich das schnell.
Es sieht. K2.7 Code wird mit einem 400M-Parameter MoonViT Vision Encoder geliefert, sodass es Screenshots, Diagramme und Videobilder lesen kann. Das ist wichtig für Agenten, die vor dem Handeln eine fehlerhafte Benutzeroberfläche, einen Stack-Trace-Screenshot oder einen Design-Mockup betrachten müssen.
Interner Aufbau
Der Aufbau des Modells erklärt sowohl seine Leistungsfähigkeit als auch seine niedrigen Bereitstellungskosten.
| Spezifikation | Kimi K2.7 Code |
|---|---|
| Gesamtparameter | 1 Billion |
| Aktive Parameter pro Token | 32 Milliarden |
| Experten | 384 insgesamt, 8 pro Token ausgewählt |
| Schichten | 61 (1 dicht) |
| Attention | Multi-head Latent Attention (MLA) |
| Kontextfenster | 256K Tokens |
| Vision Encoder | MoonViT, 400M Parameter |
| Lizenz | Modifizierte MIT |
Das Mixture-of-Experts-Setup ist der Grund, warum ein „1 Billion Parameter“-Modell praktisch zu betreiben ist. Ein Router wählt 8 von 384 Experten für jedes Token aus, sodass Sie Rechenleistung für 32 Milliarden aktive Parameter bezahlen, nicht für die gesamte Billion. Sie erhalten die Wissenskapazität eines riesigen Modells mit Kosten pro Token, die näher an einem mittelgroßen Modell liegen.
Multi-head Latent Attention hält den Key-Value-Cache klein, was ein 256K Kontextfenster erschwinglich macht. Langer Kontext ist der Teil, den Entwickler spüren: Sie können einen ganzen Dienst, seine Tests und seine Konfiguration in einen einzigen Prompt einfügen und eine Änderung anfordern, die all dies berücksichtigt.
Die Benchmarks, ehrlich interpretiert
Moonshot veröffentlichte Ergebnisse im Vergleich zu GPT-5.5 und Claude Opus in Codierungs- und Agenten-Suiten. Das Muster ist konsistent: K2.7 Code ist wettbewerbsfähig und nah dran, erreicht aber bei den meisten Aufgaben nicht die Spitze der geschlossenen Modelle.

Codierung
| Benchmark | Kimi K2.7 Code | GPT-5.5 | Claude Opus |
|---|---|---|---|
| Kimi Code Bench v2 | 62.0 | 69.0 | 67.4 |
| Program Bench | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 35.1 | 35.5 | 42.8 |
Agenten- und Tool-Nutzung
| Benchmark | Kimi K2.7 Code | GPT-5.5 | Claude Opus |
|---|---|---|---|
| Kimi Claw 24/7 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 81.1 | 92.9 | 76.4 |
Zwei Einschränkungen halten dies fair. Erstens sind mehrere dieser Suiten von Moonshot selbst, behandeln Sie sie also als Darstellung des Anbieters, nicht als neutrale Bestenliste. Zweitens ist die Geschichte nicht „Kimi gewinnt“. Es ist „ein Open-Weight-Modell, das Sie herunterladen und selbst hosten können, liegt nur wenige Punkte hinter Modellen, die Sie nur mieten können.“ Bei MCP Mark Verified übertrifft es sogar Claude Opus. Für viele reale Arbeiten ist ein Modell, das zu 90% so gut, aber offen und günstiger ist, die bessere Wahl. Wenn die reine Codierungsleistung Ihre einzige Metrik ist, behandelt unser DeepSeek V4 vs. Claude Opus Vergleich die Lücke zwischen geschlossenen und offenen Modellen ausführlicher.
Warum der Effizienzgewinn wichtig ist
Agenten-Codierung verbraucht Tokens in einer Schleife: Dateien lesen, nachdenken, ein Tool aufrufen, das Ergebnis lesen, erneut nachdenken. Der größte Teil dieser Ausgaben ist Denken, nicht Ausgabe. Die Reduzierung der Denk-Tokens um ~30% bewirkt zwei Dinge gleichzeitig. Es senkt die Kosten pro Aufgabe und verkürzt die reine Arbeitszeit für jeden Schritt, da das Modell weniger schreibt, bevor es handelt. Wenn Sie beobachtet haben, wie ein Code-Agent beim „Nachdenken“ ins Stocken gerät, wissen Sie, warum das mehr wert ist als ein Benchmark-Punkt. Weitere Möglichkeiten zur Kostensenkung finden Sie in unserem Leitfaden zur Reduzierung von Agenten-Token-Kosten über die CLI.
Kimi Code: Der Agent, der mit dem Modell ausgeliefert wird
K2.7 Code ist nicht nur ein Checkpoint. Moonshot hat Kimi Code entwickelt, einen Terminal-nativen Code-Agenten, der auf die Stärken des Modells zugeschnitten ist: bewahrtes Denken, verschachteltes Schlussfolgern und mehrstufige Tool-Aufrufe. Er schreibt und bearbeitet Dateien, führt Shell-Befehle aus, durchsucht Ihre Codebasis, ruft Webinhalte ab und startet Sub-Agenten für parallele Arbeit. Sie installieren ihn mit einem Befehl:
curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash
Führen Sie dann kimi in einem beliebigen Projektverzeichnis aus. Es gibt auch eine VS Code-Erweiterung sowie JetBrains- und Zed-Unterstützung über das ACP-Protokoll. Wir behandeln die vollständige Einrichtung, Slash-Befehle und den Workflow für die erste Ausführung in einer speziellen Anleitung; wenn Sie die ältere Kimi CLI verwendet haben, ist der neue Agent ein von Grund auf neu entwickelter Aufbau, kein Reskin.
Wo Kimi K2.7 Code lebt
Sie haben vier Möglichkeiten, das Modell zu erreichen.
- Kimi Web-App und Kimi App. Chat-Zugriff für schnelle Fragen und Prototyping, keine Einrichtung erforderlich.
- Kimi Code CLI. Der oben genannte Terminal-Agent, für praktisches Codieren in Ihrem Repository.
- API. Ein OpenAI-kompatibler Endpunkt auf der Moonshot-Plattform. Verwenden Sie die Modell-ID
kimi-k2.7-codeund richten Sie Ihren bestehenden OpenAI-Client aufhttps://api.moonshot.ai/v1. Da es OpenAI-kompatibel ist, lässt es sich mit einem Austausch der Basis-URL in Tools wie Claude Code, Cursor und Cline integrieren. (Das Flatrate-Abonnement für Kimi Code verwendet eine separate ID,kimi-for-coding.) - Offene Gewichte. Von Hugging Face herunterladen und selbst hosten. Moonshot empfiehlt vLLM, SGLang oder KTransformers für die Bereitstellung. Dies ist der Weg, wenn Ihre Daten auf Ihrer eigenen Hardware bleiben müssen.
So testen Sie die Kimi K2.7 Code API in Apidog
Bevor Sie das Modell in einen Agenten integrieren, ist es hilfreich, die Roh-Anfragen und -Antworten zu sehen. Apidog bietet Ihnen einen visuellen Arbeitsbereich, um dies ohne das Schreiben eines Clients zu tun.
- Öffnen Sie Apidog und erstellen Sie eine neue HTTP-Anfrage.
- Stellen Sie die Methode auf
POSTund die URL aufhttps://api.moonshot.ai/v1/chat/completionsein. - Fügen Sie einen
Authorization: Bearer <your-key>Header hinzu. Holen Sie sich einen Schlüssel von der Kimi-Plattformkonsole. - Senden Sie im Body eine OpenAI-ähnliche Payload mit
"model": "kimi-k2.7-code"und einemmessages-Array. - Senden Sie die Anfrage und lesen Sie die Antwort. Apidog formatiert das JSON, zeigt die Token-Nutzung an und ermöglicht es Ihnen, den Aufruf als wiederverwendbaren Test zu speichern.
Von dort aus können Sie ein kleines Testszenario aufbauen: den Antwortstatus überprüfen, sicherstellen, dass usage.completion_tokens ein Budget nicht überschreitet, und es bei jedem Modellupdate ausführen, um Regressionen zu erkennen. Da der Endpunkt OpenAI-kompatibel ist, funktioniert dieselbe Einrichtung für jedes Modell auf der Kimi-Plattform. Wenn Sie das Tool-Calling des Modells über MCP testen, führt unser MCP-Server-Test-Playbook die wichtigen Assertions durch. Laden Sie Apidog herunter, um mitzumachen.
Wer sollte Kimi K2.7 Code wählen?
Wählen Sie es, wenn Sie Folgendes entwickeln:
- Code-Agenten, bei denen Token-Kosten und Latenz über die Rentabilität des Produkts entscheiden.
- Tools, die einen langen Kontext benötigen: Bearbeitungen ganzer Repositories, große Refactorings, Schlussfolgern über mehrere Dateien.
- Alles, was aus Datenschutz- oder Compliance-Gründen auf Ihrer eigenen Infrastruktur laufen muss, da die Gewichte offen sind.
- Multimodale Codierungs-Workflows, die Screenshots, Diagramme oder Videos lesen.
Bleiben Sie bei einem geschlossenen Frontier-Modell, wenn Sie Folgendes benötigen:
- Die absolut höchste Einzelschuss-Codierungsbewertung, bei der ein paar Benchmark-Punkte den Preis rechtfertigen.
- Einen verwalteten SLA- und Supportvertrag anstelle von Self-Hosting.
Für einen umfassenderen Überblick über den Open-Weight-Bereich vergleicht unser MiniMax M3 vs. DeepSeek V4 vs. Qwen 3.7 Vergleich Kimis Konkurrenten nebeneinander.
FAQ
- Ist Kimi K2.7 Code Open Source? Die Gewichte sind öffentlich unter einer modifizierten MIT-Lizenz verfügbar, sodass Sie sie herunterladen, ausführen und feinabstimmen können. Lesen Sie die Lizenzbedingungen auf der Modellkarte vor der kommerziellen Nutzung.
- Wie groß ist das Kontextfenster? 256K Tokens. Das reicht für einen kompletten Dienst plus dessen Tests in einem einzigen Prompt.
- Kann ich es lokal ausführen? Ja. Moonshot empfiehlt vLLM, SGLang oder KTransformers. Die vollständigen Gewichte sind groß (Trillionen-Parameter-Skala), planen Sie also ausreichend GPU-Speicher oder einen quantisierten Build ein.
- Wie lautet die Modell-ID für die API? Verwenden Sie
kimi-k2.7-codeauf der Moonshot API (https://api.moonshot.ai/v1); das Flatrate-Abonnement für Kimi Code verwendetkimi-for-coding. Der Endpunkt ist OpenAI-kompatibel, sodass die meisten bestehenden Clients mit einer Änderung der Basis-URL funktionieren. - Wie unterscheidet es sich vom regulären Kimi K2.6? Es ist speziell für Codierung und Agenten optimiert, fügt Vision hinzu und verwendet etwa 30% weniger Denk-Tokens für vergleichbare Ergebnisse.
- Unterstützt es Tool-Calling und MCP? Ja. Es ist für verschachteltes Schlussfolgern und mehrstufige Tool-Aufrufe ausgelegt, und Kimi Code unterstützt das Model Context Protocol.
- Ist es kostenlos? Sie können in der Kimi-App kostenlos chatten, und die Gewichte können kostenlos heruntergeladen werden. Die Nutzung der API und des Kimi Code-Agenten erfolgt über Abonnementpläne mit Quotenbeschränkungen.
Zusammenfassung
Kimi K2.7 Code ist Moonshots Wette, dass offene Gewichte plus niedrige Kosten das Jagen nach der Spitze der Benchmark-Tabelle übertreffen. Es ist ein 1T-Parameter MoE-Modell mit 32B aktiven Parametern, einem 256K Kontextfenster, Vision und einem um ~30% leichteren Schlussfolgerungsbudget als K2.6. Es wird GPT-5.5 oder Claude Opus in den meisten Code-Suiten nicht schlagen, kommt aber nahe heran, während es herunterladbar und kostengünstiger im Betrieb bleibt, und es wird mit einem leistungsfähigen Terminal-Agenten ausgeliefert. Wenn Sie Codierungs-Tools entwickeln, bei denen Kosten und Kontrolle ebenso wichtig sind wie die reine Qualität, ist es einen echten Test wert. Beginnen Sie, indem Sie eine Anfrage über Apidog senden, um zu sehen, wie sich die API verhält, und entscheiden Sie dann, ob Sie sie selbst hosten möchten.
