Comment utiliser l'API Kimi K2.7 Code

L'API Kimi K2.7 Code vous offre le modèle de Moonshot, entraîné spécifiquement pour le codage avec des milliers de milliards de paramètres, via un point d'accès compatible OpenAI. Si vous pouvez appeler l'API OpenAI, vous pouvez appeler celle-ci ; changez l'URL de base, définissez l'ID du modèle, et le tour est joué. Il existe également un point d'accès compatible Anthropic pour une intégration directe dans Claude Code.

Ce guide couvre les deux façons d'y accéder, l'URL de base exacte et les ID de modèle, le code fonctionnel en curl, Python et Node, la tarification, et comment tester le tout dans Apidog avant de le déployer.

bouton

En bref

URL de base : https://api.moonshot.ai/v1 (compatible OpenAI). Pour Claude Code, utilisez https://api.moonshot.ai/anthropic.
ID du modèle : kimi-k2.7-code sur l'API Moonshot payante à l'utilisation ; kimi-for-coding sur l'abonnement Kimi Code.
Tarification : 0,95 $ par million de tokens d'entrée, 4,00 $ par million de tokens de sortie, 0,19 $ par million en cas de cache hit.
Obtenez une clé sur la console de la plateforme Kimi, puis appelez-la comme n'importe quel point d'accès OpenAI.
Le modèle raisonne toujours (la réflexion est forcée), attendez-vous donc à des tokens de raisonnement dans chaque réponse.

Deux façons d'accéder au modèle

Choisissez la méthode qui correspond à votre utilisation.

API développeur payante à l'utilisation. Facturation standard basée sur l'utilisation via l'API Moonshot. ID du modèle kimi-k2.7-code, URL de base https://api.moonshot.ai/v1. C'est ce qu'il vous faut pour le trafic de production, les scripts et tout ce qui est programmatique.

Abonnement Kimi Code. Un plan tarifaire fixe lié à la CLI Kimi Code et à la console. Les clés de la console Kimi Code utilisent l'ID de modèle kimi-for-coding et sont facturées sur un quota qui se rafraîchit tous les 7 jours au lieu d'être facturées par token. Mieux pour le codage interactif intensif, où les coûts par token s'accumuleraient.

Le reste de ce guide utilise l'API payante à l'utilisation, car c'est celle que vous appelez depuis votre propre code.

Étape 1 : Obtenez une clé API

Connectez-vous à la console de la plateforme Kimi.
Créez une clé et copiez-la. Vous ne la reverrez plus, alors stockez-la dans un gestionnaire de secrets ou une variable d'environnement.
Exportez-la localement :

export MOONSHOT_API_KEY="sk-votre-clé-ici"

Traitez la clé comme un mot de passe. Ne la committez pas et ne la collez pas dans du code côté client.

Étape 2 : Effectuez votre première requête

Le point d'accès reproduit les complétions de chat d'OpenAI, donc un simple appel curl fonctionne :

curl https://api.moonshot.ai/v1/chat/completions \
  -H "Authorization: Bearer $MOONSHOT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2.7-code",
    "messages": [
      {"role": "system", "content": "You are a careful senior engineer."},
      {"role": "user", "content": "Write a Python function that validates an email and returns a clear error message."}
    ]
  }'

Vous obtiendrez une réponse au format OpenAI standard : un tableau choices avec le message, plus un objet usage affichant le nombre de tokens d'entrée, de sortie et de raisonnement.

Étape 3 : Appelez-le depuis Python

Parce qu'il est compatible OpenAI, le SDK officiel openai fonctionne avec un changement d'URL de base :

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["MOONSHOT_API_KEY"],
    base_url="https://api.moonshot.ai/v1",
)

resp = client.chat.completions.create(
    model="kimi-k2.7-code",
    messages=[
        {"role": "user", "content": "Refactor this loop for readability and explain why."},
    ],
)

print(resp.choices[0].message.content)
print(resp.usage)

Pas de nouveau client, pas de couche HTTP personnalisée. Le même code qui parle à GPT parle maintenant à Kimi.

Étape 4 : Appelez-le depuis Node

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

const resp = await client.chat.completions.create({
  model: "kimi-k2.7-code",
  messages: [
    { role: "user", content: "Write a Jest test for an empty-input edge case." },
  ],
});

console.log(resp.choices[0].message.content);

Ce qu'il faut savoir sur le comportement du modèle

Quelques particularités influencent la façon dont vous l'appelez.

La réflexion est toujours activée. K2.7 Code force le raisonnement et le maintient à travers les tours. Chaque réponse contient des tokens de raisonnement, que vous payez comme sortie. L'avantage est qu'il raisonne environ 30 % plus efficacement que K2.6, donc la facture est plus légère que la génération précédente pour le même travail.

L'appel d'outils fonctionne comme OpenAI. Passez un tableau tools avec des schémas de fonctions et le modèle renvoie des objets d'appel d'outils que vous exécutez et réinjectez. Il est optimisé pour l'utilisation d'outils en plusieurs étapes, il gère donc les longues chaînes sans perdre le fil.

Il est multimodal. Vous pouvez envoyer du contenu d'image dans le tableau messages pour des tâches comme la lecture d'une capture d'écran d'une interface utilisateur défectueuse ou un diagramme.

Tarification et limites de débit

Les tarifs payants à l'utilisation :

Type de token	Prix par million
Entrée	0,95 $
Sortie (incl. raisonnement)	4,00 $
Cache hit	0,19 $

Deux choses permettent de réduire les coûts. Les cache hits sont facturés à une fraction du prix d'entrée, donc les invites système répétées et le contexte partagé deviennent moins chers. Et le budget de raisonnement réduit signifie moins de tokens de sortie par tâche que K2.6. Pour plus de tactiques, consultez notre guide sur la réduction des coûts de tokens d'agent. Si vous souhaitez les chiffres de la génération précédente à titre de comparaison, nos guides sur l'API Kimi K2.6 et l'API DeepSeek V4 les couvrent.

Utilisez-le dans Claude Code, Cline ou Cursor

Vous n'avez pas besoin d'écrire un client pour utiliser K2.7 Code dans votre éditeur.

Claude Code. Dirigez-le vers le point d'accès compatible Anthropic :

export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_API_KEY"
export ANTHROPIC_MODEL="kimi-k2.7-code"

Cline et RooCode. Sélectionnez Moonshot comme fournisseur, choisissez le point d'accès api.moonshot.ai, collez votre clé et sélectionnez kimi-k2.7-code comme modèle. Désactivez l'outil de navigation pour un fonctionnement plus fluide.

Cursor. Ajoutez le modèle via un point d'accès personnalisé compatible OpenAI avec la même URL de base et la même clé. La configuration est similaire à notre guide d'intégration de Kimi dans Cursor ; seul l'ID du modèle change.

Testez et déboguez l'API dans Apidog

Avant de connecter l'API à un agent, confirmez exactement ce qu'elle retourne. Apidog vous offre un espace de travail visuel pour envoyer des requêtes, inspecter les réponses et valider les tests.

Créez une requête POST vers https://api.moonshot.ai/v1/chat/completions.
Ajoutez l'en-tête Authorization: Bearer {{MOONSHOT_API_KEY}}, en stockant la clé comme variable d'environnement Apidog afin qu'elle ne soit jamais en texte clair.
Envoyez un corps de requête de style OpenAI avec "model": "kimi-k2.7-code" et vos messages.
Exécutez-la. Apidog formate le JSON, affiche le nombre de tokens usage et enregistre l'appel.
Transformez l'appel en test : vérifiez que le statut est 200, que choices[0].message.content n'est pas vide et que usage.completion_tokens reste dans le budget que vous avez défini.

Vous disposez maintenant d'un test de régression que vous pouvez réexécuter à chaque mise à jour du modèle. Si vous exercez les appels d'outils du modèle via MCP, notre manuel de test de serveur MCP montre les assertions qui détectent les contrats d'outils rompus. Téléchargez Apidog pour le configurer.

FAQ

Quelle est l'URL de base de l'API ? https://api.moonshot.ai/v1 pour les appels compatibles OpenAI, https://api.moonshot.ai/anthropic pour Claude Code.

Quel ID de modèle dois-je utiliser ? kimi-k2.7-code sur l'API payante à l'utilisation. L'abonnement Kimi Code utilise kimi-for-coding.

Est-il compatible OpenAI ? Oui. Le format de la requête et de la réponse correspond aux complétions de chat OpenAI, donc les SDK existants fonctionnent avec un changement d'URL de base. Il existe également un point d'accès compatible Anthropic.

Combien cela coûte-t-il ? 0,95 $ par million de tokens d'entrée, 4,00 $ par million de tokens de sortie et 0,19 $ par million en cas de cache hit.

Est-ce que je paie toujours pour les tokens de raisonnement ? Oui. La réflexion est forcée, donc chaque réponse inclut des tokens de raisonnement facturés au tarif de sortie. Il utilise tout de même environ 30 % de moins que K2.6.

Puis-je envoyer des images ? Oui. Le modèle est multimodal, le contenu d'image dans le tableau de messages est donc pris en charge.

Résumé

L'API Kimi K2.7 Code n'est qu'un changement d'URL de base pour tout client compatible OpenAI : utilisez https://api.moonshot.ai/v1, l'ID de modèle kimi-k2.7-code, et payez 0,95 $/4,00 $ par million de tokens. Pour le codage interactif, l'abonnement Kimi Code à tarif fixe avec kimi-for-coding peut coûter moins cher. Il s'intègre à Claude Code, Cline, RooCode et Cursor avec un changement de configuration, et vous pouvez valider le tout dans Apidog avant de lui faire confiance en production. Obtenez une clé, envoyez l'appel curl ci-dessus et vérifiez l'utilisation des tokens pour voir comment la tarification s'adapte à votre charge de travail.

bouton