So nutzen Sie die Kimi K2.7 Code API

Die Kimi K2.7 Code API bietet Ihnen Moonshots auf Codierung abgestimmtes Billionen-Parameter-Modell hinter einem OpenAI-kompatiblen Endpunkt. Wenn Sie die OpenAI API aufrufen können, können Sie auch diese aufrufen; tauschen Sie die Basis-URL aus, legen Sie die Modell-ID fest, und Sie sind fertig. Es gibt auch einen Anthropic-kompatiblen Endpunkt, sodass er direkt in Claude Code integriert werden kann.

Dieser Leitfaden behandelt beide Zugriffswege, die genaue Basis-URL und Modell-IDs, funktionierenden Code in curl, Python und Node, die Preisgestaltung und wie Sie das Ganze in Apidog testen, bevor Sie es bereitstellen.

Schaltfläche

TL;DR

Basis-URL: https://api.moonshot.ai/v1 (OpenAI-kompatibel). Für Claude Code verwenden Sie https://api.moonshot.ai/anthropic.
Modell-ID: kimi-k2.7-code für die Pay-per-Token Moonshot API; kimi-for-coding für das Kimi Code Abonnement.
Preisgestaltung: $0.95 pro Million Input-Token, $4.00 pro Million Output-Token, $0.19 pro Million bei Cache-Treffern.
Holen Sie sich einen Schlüssel über die Kimi Plattform-Konsole und rufen Sie ihn dann wie jeden OpenAI-Endpunkt auf.
Das Modell führt immer Begründungen durch (Denken ist erzwungen), erwarten Sie also Begründungs-Token in jeder Antwort.

Zwei Wege, auf das Modell zuzugreifen

Wählen Sie den Weg, der zu Ihrer Nutzung passt.

Pay-per-Token Entwickler-API. Standardmäßige nutzungsbasierte Abrechnung über die Moonshot API. Modell-ID kimi-k2.7-code, Basis-URL https://api.moonshot.ai/v1. Dies ist, was Sie für Produktions-Traffic, Skripte und alles Programmatische benötigen.

Kimi Code Abonnement. Ein Pauschaltarif, der an die Kimi Code CLI und Konsole gebunden ist. Schlüssel aus der Kimi Code Konsole verwenden die Modell-ID kimi-for-coding und werden gegen ein Kontingent abgerechnet, das sich alle 7 Tage erneuert, anstatt pro Token. Besser für intensive interaktive Codierung, wo die Pro-Token-Kosten sich summieren würden.

Der Rest dieses Leitfadens verwendet die Pay-per-Token API, da dies diejenige ist, die Sie von Ihrem eigenen Code aus aufrufen.

Schritt 1: API-Schlüssel abrufen

Melden Sie sich an der Kimi Plattform-Konsole an.
Erstellen Sie einen Schlüssel und kopieren Sie ihn. Sie werden ihn später nicht mehr sehen, daher speichern Sie ihn in einem Secret Manager oder einer Umgebungsvariablen.
Exportieren Sie ihn lokal:

export MOONSHOT_API_KEY="sk-your-key-here"

Behandeln Sie den Schlüssel wie ein Passwort. Committen Sie ihn nicht und fügen Sie ihn nicht in clientseitigen Code ein.

Schritt 2: Ihre erste Anfrage senden

Der Endpunkt spiegelt OpenAIs Chat-Vervollständigungen wider, daher funktioniert ein einfacher Curl-Aufruf:

curl https://api.moonshot.ai/v1/chat/completions \
  -H "Authorization: Bearer $MOONSHOT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2.7-code",
    "messages": [
      {"role": "system", "content": "You are a careful senior engineer."},
      {"role": "user", "content": "Write a Python function that validates an email and returns a clear error message."}
    ]
  }'

Sie erhalten eine standardmäßige OpenAI-förmige Antwort zurück: ein choices-Array mit der Nachricht, plus ein usage-Objekt, das die Anzahl der Input-, Output- und Begründungs-Token anzeigt.

Schritt 3: Aufruf aus Python

Da es OpenAI-kompatibel ist, funktioniert das offizielle openai SDK mit einer Änderung der Basis-URL:

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["MOONSHOT_API_KEY"],
    base_url="https://api.moonshot.ai/v1",
)

resp = client.chat.completions.create(
    model="kimi-k2.7-code",
    messages=[
        {"role": "user", "content": "Refactor this loop for readability and explain why."},
    ],
)

print(resp.choices[0].message.content)
print(resp.usage)

Kein neuer Client, keine benutzerdefinierte HTTP-Schicht. Derselbe Code, der mit GPT kommuniziert, kommuniziert nun mit Kimi.

Schritt 4: Aufruf aus Node

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

const resp = await client.chat.completions.create({
  model: "kimi-k2.7-code",
  messages: [
    { role: "user", content: "Write a Jest test for an empty-input edge case." },
  ],
});

console.log(resp.choices[0].message.content);

Wissenswertes zum Verhalten des Modells

Einige Besonderheiten prägen, wie Sie es aufrufen.

Denken ist immer aktiviert. K2.7 Code erzwingt Begründungen und behält diese über mehrere Runden bei. Jede Antwort enthält Begründungs-Token, für die Sie als Output bezahlen. Der Vorteil ist, dass es etwa 30 % effizienter begründet als K2.6, sodass die Rechnung für dieselbe Arbeit leichter ausfällt als bei der vorherigen Generation.

Tool-Aufrufe funktionieren auf OpenAI-Art. Übergeben Sie ein tools-Array mit Funktionsschemata, und das Modell gibt Tool-Call-Objekte zurück, die Sie ausführen und zurückführen. Es ist auf die mehrstufige Tool-Nutzung abgestimmt, sodass es lange Ketten bewältigt, ohne den Überblick zu verlieren.

Es ist multimodal. Sie können Bildinhalte im messages-Array für Aufgaben senden, wie das Lesen eines Screenshots einer fehlerhaften Benutzeroberfläche oder eines Diagramms.

Preise und Ratenbegrenzungen

Die Pay-per-Token-Raten:

Token-Typ	Preis pro Million
Input	$0.95
Output (inkl. Begründung)	$4.00
Cache-Treffer	$0.19

Zwei Dinge halten die Kosten niedrig. Cache-Treffer werden zu einem Bruchteil des Input-Preises abgerechnet, sodass wiederholte System-Prompts und geteilte Kontexte günstig werden. Und das reduzierte Begründungsbudget bedeutet weniger Output-Token pro Aufgabe als bei K2.6. Für weitere Taktiken siehe unseren Leitfaden zum Senken der Agenten-Token-Kosten. Wenn Sie die Zahlen der älteren Generation zum Vergleich wünschen, behandeln unser Kimi K2.6 API-Leitfaden und DeepSeek V4 API-Leitfaden diese.

Verwendung in Claude Code, Cline oder Cursor

Sie müssen keinen Client schreiben, um K2.7 Code in Ihrem Editor einzusetzen.

Claude Code. Zeigen Sie es auf den Anthropic-kompatiblen Endpunkt:

export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_API_KEY"
export ANTHROPIC_MODEL="kimi-k2.7-code"

Cline und RooCode. Wählen Sie Moonshot als Anbieter, wählen Sie den api.moonshot.ai-Endpunkt, fügen Sie Ihren Schlüssel ein und wählen Sie kimi-k2.7-code als Modell. Deaktivieren Sie das Browser-Tool für den reibungslosesten Ablauf.

Cursor. Fügen Sie das Modell über einen OpenAI-kompatiblen benutzerdefinierten Endpunkt mit derselben Basis-URL und demselben Schlüssel hinzu. Die Einrichtung spiegelt unseren Kimi-in-Cursor-Leitfaden wider; nur die Modell-ID ändert sich.

Die API in Apidog testen und debuggen

Bevor Sie die API in einen Agenten integrieren, überprüfen Sie genau, was sie zurückgibt. Apidog bietet Ihnen einen visuellen Arbeitsbereich, um Anfragen zu senden, Antworten zu prüfen und Tests zu fixieren.

Erstellen Sie eine POST-Anfrage an https://api.moonshot.ai/v1/chat/completions.
Fügen Sie den Header Authorization: Bearer {{MOONSHOT_API_KEY}} hinzu und speichern Sie den Schlüssel als Apidog-Umgebungsvariable, damit er niemals im Klartext vorliegt.
Senden Sie einen OpenAI-ähnlichen Body mit "model": "kimi-k2.7-code" und Ihren messages.
Führen Sie es aus. Apidog formatiert das JSON, zeigt die usage-Token-Zählungen an und speichert den Aufruf.
Machen Sie aus dem Aufruf einen Test: Bestätigen Sie, dass der Status 200 ist, dass choices[0].message.content nicht leer ist und dass usage.completion_tokens unter einem von Ihnen festgelegten Budget bleibt.

Jetzt haben Sie einen Regressionstest, den Sie bei jedem Modell-Update erneut ausführen können. Wenn Sie die Tool-Aufrufe des Modells über MCP testen, zeigt unser MCP Server-Test-Playbook die Zusicherungen, die fehlerhafte Tool-Verträge erkennen. Laden Sie Apidog herunter, um es einzurichten.

FAQ

Was ist die API-Basis-URL? https://api.moonshot.ai/v1 für OpenAI-kompatible Aufrufe, https://api.moonshot.ai/anthropic für Claude Code.

Welche Modell-ID verwende ich? kimi-k2.7-code für die Pay-per-Token API. Das Kimi Code Abonnement verwendet kimi-for-coding.

Ist es OpenAI-kompatibel? Ja. Das Anfrage- und Antwortformat entspricht den OpenAI Chat-Vervollständigungen, sodass bestehende SDKs mit einer Änderung der Basis-URL funktionieren. Es gibt auch einen Anthropic-kompatiblen Endpunkt.

Wie viel kostet es? $0.95 pro Million Input-Token, $4.00 pro Million Output-Token und $0.19 pro Million bei Cache-Treffern.

Zahle ich immer für Begründungs-Token? Ja. Das Denken ist erzwungen, daher enthält jede Antwort Begründungs-Token, die zum Output-Preis abgerechnet werden. Es verbraucht immer noch etwa 30 % weniger als K2.6.

Kann ich Bilder senden? Ja. Das Modell ist multimodal, daher werden Bildinhalte im Nachrichten-Array unterstützt.

Zusammenfassung

Die Kimi K2.7 Code API ist nur einen Basis-URL-Austausch von jedem OpenAI-kompatiblen Client entfernt: Verwenden Sie https://api.moonshot.ai/v1, die Modell-ID kimi-k2.7-code und zahlen Sie $0.95/$4.00 pro Million Token. Für interaktive Codierung kann das Pauschalabonnement Kimi Code mit kimi-for-coding günstiger sein. Es lässt sich mit einer Konfigurationsänderung in Claude Code, Cline, RooCode und Cursor integrieren, und Sie können das Ganze in Apidog validieren, bevor Sie es in Produktion nehmen. Holen Sie sich einen Schlüssel, senden Sie den obigen Curl-Aufruf und überprüfen Sie die Token-Nutzung, um zu sehen, wie die Preisgestaltung für Ihre Arbeitslast ausfällt.

Schaltfläche