Was ist Kimi K2.7 Code?

Kimi K2.7 Code ist Moonshot AIs auf Coding abgestimmtes MoE-Modell mit 1 Billion Parametern: 32 Milliarden aktiv, 256K Kontext, Vision, ~30 % weniger Denk-Tokens als K2.6, offene Modellgewichte. Hier erfahren Sie, was es ist und wo Sie es ausführen können.

Ashley Innocent

Ashley Innocent

15 June 2026

Was ist Kimi K2.7 Code?

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Moonshot AI hat gerade Kimi K2.7 Code ausgeliefert, ein Open-Weight-Modell, das speziell für die Softwareentwicklung und den Betrieb von Code-Agenten entwickelt wurde. Es behält den Trillionen-Parameter-Maßstab der Kimi K2-Linie bei, fügt Vision hinzu und reduziert die Kosten für Denk-Tokens, die frühere Agentenläufe teuer machten. Wenn Sie Kimi K2.6 oder dessen API verwendet haben, ist dies der auf Codierung abgestimmte Nachfolger; es wird auch mit einem Terminal-Agenten namens Kimi Code ausgeliefert, der direkt mit Claude Code und Codex konkurriert.

Hier erfahren Sie, was das Modell eigentlich ist, was sich geändert hat, wie es bewertet wird und wo Sie es heute ausführen können.

TL;DR

Kimi K2.7 Code in einem Absatz

Kimi K2.7 Code ist die auf Codierung spezialisierte Version der K2-Familie von Moonshot AI. Es verwendet das gleiche dünnbesetzte Mixture-of-Experts-Design wie neuere Kimi-Modelle, sodass nur ein Bruchteil seiner Gewichte bei einem bestimmten Token aktiv ist. Das Suffix „Code“ ist der Punkt: Moonshot hat diesen Checkpoint für die Softwareentwicklung, mehrstufige Tool-Aufrufe und lange Agentensitzungen optimiert, anstatt für allgemeine Chats. Die wichtigsten Upgrades gegenüber K2.6 sind native multimodale Eingaben, ein schlankeres Denkbudget und eine engere Integration mit Moonshots eigenem Agenten-Framework. Sie können es über die Kimi Web-App, die Kimi Code CLI, eine gehostete API oder durch Herunterladen der Gewichte von Hugging Face verwenden.

Was sich gegenüber Kimi K2.6 geändert hat

Wenn Sie bereits unseren Kimi K2.6 Erklärer gelesen haben, sind drei Unterschiede am wichtigsten.

Es ist zuerst für Code und Agenten optimiert. K2.6 war ein starker Generalist. K2.7 Code konzentriert sich auf Codierungs-Workflows: Refactoring, Debugging, Codebasis-Erkundung und das Verketten von Tool-Aufrufen, ohne den Überblick über die Aufgabe zu verlieren.

Denken ist günstiger. Moonshot berichtet über eine Reduzierung des Verbrauchs von Denk-Tokens um etwa 30% gegenüber K2.6 für vergleichbare Ergebnisse. Denk-Tokens sind abrechenbare Tokens, daher wirkt sich eine 30%ige Reduzierung direkt auf die Kosten und Latenz Ihres Agentenlaufs aus. Bei einer langen Codierungssitzung mit Hunderten von Tool-Aufrufen summiert sich das schnell.

Es sieht. K2.7 Code wird mit einem 400M-Parameter MoonViT Vision Encoder geliefert, sodass es Screenshots, Diagramme und Videobilder lesen kann. Das ist wichtig für Agenten, die vor dem Handeln eine fehlerhafte Benutzeroberfläche, einen Stack-Trace-Screenshot oder einen Design-Mockup betrachten müssen.

Interner Aufbau

Der Aufbau des Modells erklärt sowohl seine Leistungsfähigkeit als auch seine niedrigen Bereitstellungskosten.

Spezifikation Kimi K2.7 Code
Gesamtparameter 1 Billion
Aktive Parameter pro Token 32 Milliarden
Experten 384 insgesamt, 8 pro Token ausgewählt
Schichten 61 (1 dicht)
Attention Multi-head Latent Attention (MLA)
Kontextfenster 256K Tokens
Vision Encoder MoonViT, 400M Parameter
Lizenz Modifizierte MIT

Das Mixture-of-Experts-Setup ist der Grund, warum ein „1 Billion Parameter“-Modell praktisch zu betreiben ist. Ein Router wählt 8 von 384 Experten für jedes Token aus, sodass Sie Rechenleistung für 32 Milliarden aktive Parameter bezahlen, nicht für die gesamte Billion. Sie erhalten die Wissenskapazität eines riesigen Modells mit Kosten pro Token, die näher an einem mittelgroßen Modell liegen.

Multi-head Latent Attention hält den Key-Value-Cache klein, was ein 256K Kontextfenster erschwinglich macht. Langer Kontext ist der Teil, den Entwickler spüren: Sie können einen ganzen Dienst, seine Tests und seine Konfiguration in einen einzigen Prompt einfügen und eine Änderung anfordern, die all dies berücksichtigt.

Die Benchmarks, ehrlich interpretiert

Moonshot veröffentlichte Ergebnisse im Vergleich zu GPT-5.5 und Claude Opus in Codierungs- und Agenten-Suiten. Das Muster ist konsistent: K2.7 Code ist wettbewerbsfähig und nah dran, erreicht aber bei den meisten Aufgaben nicht die Spitze der geschlossenen Modelle.

Codierung

Benchmark Kimi K2.7 Code GPT-5.5 Claude Opus
Kimi Code Bench v2 62.0 69.0 67.4
Program Bench 53.6 69.1 63.8
MLS Bench Lite 35.1 35.5 42.8

Agenten- und Tool-Nutzung

Benchmark Kimi K2.7 Code GPT-5.5 Claude Opus
Kimi Claw 24/7 46.9 52.8 50.4
MCP Atlas 76.0 79.4 81.3
MCP Mark Verified 81.1 92.9 76.4

Zwei Einschränkungen halten dies fair. Erstens sind mehrere dieser Suiten von Moonshot selbst, behandeln Sie sie also als Darstellung des Anbieters, nicht als neutrale Bestenliste. Zweitens ist die Geschichte nicht „Kimi gewinnt“. Es ist „ein Open-Weight-Modell, das Sie herunterladen und selbst hosten können, liegt nur wenige Punkte hinter Modellen, die Sie nur mieten können.“ Bei MCP Mark Verified übertrifft es sogar Claude Opus. Für viele reale Arbeiten ist ein Modell, das zu 90% so gut, aber offen und günstiger ist, die bessere Wahl. Wenn die reine Codierungsleistung Ihre einzige Metrik ist, behandelt unser DeepSeek V4 vs. Claude Opus Vergleich die Lücke zwischen geschlossenen und offenen Modellen ausführlicher.

Warum der Effizienzgewinn wichtig ist

Agenten-Codierung verbraucht Tokens in einer Schleife: Dateien lesen, nachdenken, ein Tool aufrufen, das Ergebnis lesen, erneut nachdenken. Der größte Teil dieser Ausgaben ist Denken, nicht Ausgabe. Die Reduzierung der Denk-Tokens um ~30% bewirkt zwei Dinge gleichzeitig. Es senkt die Kosten pro Aufgabe und verkürzt die reine Arbeitszeit für jeden Schritt, da das Modell weniger schreibt, bevor es handelt. Wenn Sie beobachtet haben, wie ein Code-Agent beim „Nachdenken“ ins Stocken gerät, wissen Sie, warum das mehr wert ist als ein Benchmark-Punkt. Weitere Möglichkeiten zur Kostensenkung finden Sie in unserem Leitfaden zur Reduzierung von Agenten-Token-Kosten über die CLI.

Kimi Code: Der Agent, der mit dem Modell ausgeliefert wird

K2.7 Code ist nicht nur ein Checkpoint. Moonshot hat Kimi Code entwickelt, einen Terminal-nativen Code-Agenten, der auf die Stärken des Modells zugeschnitten ist: bewahrtes Denken, verschachteltes Schlussfolgern und mehrstufige Tool-Aufrufe. Er schreibt und bearbeitet Dateien, führt Shell-Befehle aus, durchsucht Ihre Codebasis, ruft Webinhalte ab und startet Sub-Agenten für parallele Arbeit. Sie installieren ihn mit einem Befehl:

curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash

Führen Sie dann kimi in einem beliebigen Projektverzeichnis aus. Es gibt auch eine VS Code-Erweiterung sowie JetBrains- und Zed-Unterstützung über das ACP-Protokoll. Wir behandeln die vollständige Einrichtung, Slash-Befehle und den Workflow für die erste Ausführung in einer speziellen Anleitung; wenn Sie die ältere Kimi CLI verwendet haben, ist der neue Agent ein von Grund auf neu entwickelter Aufbau, kein Reskin.

Wo Kimi K2.7 Code lebt

Sie haben vier Möglichkeiten, das Modell zu erreichen.

So testen Sie die Kimi K2.7 Code API in Apidog

Bevor Sie das Modell in einen Agenten integrieren, ist es hilfreich, die Roh-Anfragen und -Antworten zu sehen. Apidog bietet Ihnen einen visuellen Arbeitsbereich, um dies ohne das Schreiben eines Clients zu tun.

  1. Öffnen Sie Apidog und erstellen Sie eine neue HTTP-Anfrage.
  2. Stellen Sie die Methode auf POST und die URL auf https://api.moonshot.ai/v1/chat/completions ein.
  3. Fügen Sie einen Authorization: Bearer <your-key> Header hinzu. Holen Sie sich einen Schlüssel von der Kimi-Plattformkonsole.
  4. Senden Sie im Body eine OpenAI-ähnliche Payload mit "model": "kimi-k2.7-code" und einem messages-Array.
  5. Senden Sie die Anfrage und lesen Sie die Antwort. Apidog formatiert das JSON, zeigt die Token-Nutzung an und ermöglicht es Ihnen, den Aufruf als wiederverwendbaren Test zu speichern.

Von dort aus können Sie ein kleines Testszenario aufbauen: den Antwortstatus überprüfen, sicherstellen, dass usage.completion_tokens ein Budget nicht überschreitet, und es bei jedem Modellupdate ausführen, um Regressionen zu erkennen. Da der Endpunkt OpenAI-kompatibel ist, funktioniert dieselbe Einrichtung für jedes Modell auf der Kimi-Plattform. Wenn Sie das Tool-Calling des Modells über MCP testen, führt unser MCP-Server-Test-Playbook die wichtigen Assertions durch. Laden Sie Apidog herunter, um mitzumachen.

Wer sollte Kimi K2.7 Code wählen?

Wählen Sie es, wenn Sie Folgendes entwickeln:

Bleiben Sie bei einem geschlossenen Frontier-Modell, wenn Sie Folgendes benötigen:

Für einen umfassenderen Überblick über den Open-Weight-Bereich vergleicht unser MiniMax M3 vs. DeepSeek V4 vs. Qwen 3.7 Vergleich Kimis Konkurrenten nebeneinander.

FAQ

Zusammenfassung

Kimi K2.7 Code ist Moonshots Wette, dass offene Gewichte plus niedrige Kosten das Jagen nach der Spitze der Benchmark-Tabelle übertreffen. Es ist ein 1T-Parameter MoE-Modell mit 32B aktiven Parametern, einem 256K Kontextfenster, Vision und einem um ~30% leichteren Schlussfolgerungsbudget als K2.6. Es wird GPT-5.5 oder Claude Opus in den meisten Code-Suiten nicht schlagen, kommt aber nahe heran, während es herunterladbar und kostengünstiger im Betrieb bleibt, und es wird mit einem leistungsfähigen Terminal-Agenten ausgeliefert. Wenn Sie Codierungs-Tools entwickeln, bei denen Kosten und Kontrolle ebenso wichtig sind wie die reine Qualität, ist es einen echten Test wert. Beginnen Sie, indem Sie eine Anfrage über Apidog senden, um zu sehen, wie sich die API verhält, und entscheiden Sie dann, ob Sie sie selbst hosten möchten.

Schaltfläche

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen