Cómo usar la API de Código Kimi K2.7

La API de Kimi K2.7 Code te ofrece el modelo de mil millones de parámetros de Moonshot, ajustado para codificación, detrás de un endpoint compatible con OpenAI. Si puedes llamar a la API de OpenAI, puedes llamar a esta; cambia la URL base, establece el ID del modelo y listo. También hay un endpoint compatible con Anthropic para que se integre directamente en Claude Code.

Esta guía cubre ambas formas de acceder a él, la URL base exacta y los IDs del modelo, código funcional en curl, Python y Node, la tarificación y cómo probarlo todo en Apidog antes de implementarlo.

button

TL;DR

URL base: https://api.moonshot.ai/v1 (compatible con OpenAI). Para Claude Code, usa https://api.moonshot.ai/anthropic.
ID del modelo: kimi-k2.7-code en la API de Moonshot de pago por token; kimi-for-coding en la suscripción de Kimi Code.
Precios: $0.95 por millón de tokens de entrada, $4.00 por millón de salida, $0.19 por millón en aciertos de caché.
Obtén una clave en la consola de la plataforma Kimi, luego llámala como cualquier endpoint de OpenAI.
El modelo siempre razona (el pensamiento está forzado), así que espera tokens de razonamiento en cada respuesta.

Dos formas de acceder al modelo

Elige la ruta que coincida con cómo lo usarás.

API para desarrolladores de pago por token. Facturación estándar basada en el uso a través de la API de Moonshot. ID del modelo kimi-k2.7-code, URL base https://api.moonshot.ai/v1. Esto es lo que necesitas para el tráfico de producción, scripts y cualquier cosa programática.

Suscripción a Kimi Code. Un plan de tarifa plana vinculado a la CLI de Kimi Code y la consola. Las claves de la consola de Kimi Code usan el ID del modelo `kimi-for-coding` y se facturan contra una cuota que se actualiza cada 7 días en lugar de por token. Mejor para la codificación interactiva intensiva, donde los costos por token se acumularían.

El resto de esta guía utiliza la API de pago por token, ya que es la que llamas desde tu propio código.

Paso 1: Obtén una clave API

Inicia sesión en la consola de la plataforma Kimi.
Crea una clave y cópiala. No la volverás a ver, así que guárdala en un gestor de secretos o en una variable de entorno.
Exponla localmente:

export MOONSHOT_API_KEY="sk-your-key-here"

Trata la clave como una contraseña. No la confirmes y no la pegues en el código del lado del cliente.

Paso 2: Haz tu primera solicitud

El endpoint refleja las finalizaciones de chat de OpenAI, por lo que una simple llamada curl funciona:

curl https://api.moonshot.ai/v1/chat/completions \
  -H "Authorization: Bearer $MOONSHOT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2.7-code",
    "messages": [
      {"role": "system", "content": "You are a careful senior engineer."},
      {"role": "user", "content": "Write a Python function that validates an email and returns a clear error message."}
    ]
  }'

Obtendrás una respuesta estándar con formato OpenAI: un array choices con el mensaje, además de un objeto usage que muestra el recuento de tokens de entrada, salida y razonamiento.

Paso 3: Llámarlo desde Python

Debido a que es compatible con OpenAI, el SDK oficial de openai funciona con un cambio de URL base:

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["MOONSHOT_API_KEY"],
    base_url="https://api.moonshot.ai/v1",
)

resp = client.chat.completions.create(
    model="kimi-k2.7-code",
    messages=[
        {"role": "user", "content": "Refactor this loop for readability and explain why."},
    ],
)

print(resp.choices[0].message.content)
print(resp.usage)

Sin cliente nuevo, sin capa HTTP personalizada. El mismo código que se comunica con GPT ahora se comunica con Kimi.

Paso 4: Llámarlo desde Node

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

const resp = await client.chat.completions.create({
  model: "kimi-k2.7-code",
  messages: [
    { role: "user", content: "Write a Jest test for an empty-input edge case." },
  ],
});

console.log(resp.choices[0].message.content);

Qué saber sobre el comportamiento del modelo

Algunas peculiaridades dan forma a cómo lo llamas.

El razonamiento está siempre activado. K2.7 Code fuerza el razonamiento y lo mantiene a lo largo de los turnos. Cada respuesta lleva tokens de razonamiento, por los que pagas como salida. La ventaja es que razona aproximadamente un 30% más eficientemente que K2.6, por lo que la factura es más ligera que la generación anterior por el mismo trabajo.

La llamada a herramientas funciona al estilo OpenAI. Pasa un array tools con esquemas de función y el modelo devuelve objetos de llamada a herramientas que ejecutas y retroalimentas. Está ajustado para el uso de herramientas en múltiples pasos, por lo que maneja cadenas largas sin perder el hilo.

Es multimodal. Puedes enviar contenido de imágenes en el array messages para tareas como leer una captura de pantalla de una UI fallida o un diagrama.

Precios y límites de tasa

Las tarifas de pago por token:

Tipo de token	Precio por millón
Entrada	$0.95
Salida (incl. razonamiento)	$4.00
Acierto de caché	$0.19

Dos cosas mantienen los costos bajos. Los aciertos de caché se facturan a una fracción del precio de entrada, por lo que las indicaciones repetidas del sistema y el contexto compartido resultan económicos. Y el presupuesto de razonamiento reducido significa menos tokens de salida por tarea que K2.6. Para más tácticas, consulta nuestra guía sobre cómo reducir los costos de tokens del agente. Si deseas los números de la generación anterior para comparar, nuestra guía de la API Kimi K2.6 y la guía de la API DeepSeek V4 los cubren.

Úsalo dentro de Claude Code, Cline o Cursor

No tienes que escribir un cliente para usar K2.7 Code en tu editor.

Claude Code. Apúntalo al endpoint compatible con Anthropic:

export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_API_KEY"
export ANTHROPIC_MODEL="kimi-k2.7-code"

Cline y RooCode. Selecciona Moonshot como proveedor, elige el endpoint api.moonshot.ai, pega tu clave y selecciona kimi-k2.7-code como modelo. Deshabilita la herramienta del navegador para un funcionamiento más fluido.

Cursor. Añade el modelo a través de un endpoint personalizado compatible con OpenAI con la misma URL base y clave. La configuración es similar a nuestra guía de Kimi en Cursor; solo cambia el ID del modelo.

Prueba y depura la API en Apidog

Antes de integrar la API en un agente, confirma exactamente lo que devuelve. Apidog te ofrece un espacio de trabajo visual para enviar solicitudes, inspeccionar respuestas y fijar pruebas.

Crea una solicitud POST a https://api.moonshot.ai/v1/chat/completions.
Añade la cabecera Authorization: Bearer {{MOONSHOT_API_KEY}}, almacenando la clave como una variable de entorno de Apidog para que nunca esté en texto plano.
Envía un cuerpo estilo OpenAI con "model": "kimi-k2.7-code" y tus messages.
Ejecútalo. Apidog formatea el JSON, muestra los recuentos de tokens usage y guarda la llamada.
Convierte la llamada en una prueba: afirma que el estado es 200, que choices[0].message.content no está vacío y que usage.completion_tokens se mantiene dentro de un presupuesto que tú estableces.

Ahora tienes una prueba de regresión que puedes volver a ejecutar en cada actualización del modelo. Si estás probando las llamadas a herramientas del modelo a través de MCP, nuestro manual de pruebas de servidor MCP muestra las aserciones que detectan contratos de herramientas rotos. Descarga Apidog para configurarlo.

Preguntas Frecuentes

¿Cuál es la URL base de la API? https://api.moonshot.ai/v1 para llamadas compatibles con OpenAI, https://api.moonshot.ai/anthropic para Claude Code.

¿Qué ID de modelo uso? kimi-k2.7-code en la API de pago por token. La suscripción a Kimi Code usa kimi-for-coding.

¿Es compatible con OpenAI? Sí. El formato de solicitud y respuesta coincide con las finalizaciones de chat de OpenAI, por lo que los SDK existentes funcionan con un cambio de URL base. También hay un endpoint compatible con Anthropic.

¿Cuánto cuesta? $0.95 por millón de tokens de entrada, $4.00 por millón de salida y $0.19 por millón en aciertos de caché.

¿Siempre pago por los tokens de razonamiento? Sí. El razonamiento está forzado, por lo que cada respuesta incluye tokens de razonamiento facturados a la tarifa de salida. Aún así, usa aproximadamente un 30% menos que K2.6.

¿Puedo enviar imágenes? Sí. El modelo es multimodal, por lo que se admite el contenido de imágenes en el array de mensajes.

Resumen

La API de Kimi K2.7 Code está a un cambio de URL base de cualquier cliente compatible con OpenAI: accede a https://api.moonshot.ai/v1, usa el ID de modelo kimi-k2.7-code y paga $0.95/$4.00 por millón de tokens. Para la codificación interactiva, la suscripción de tarifa plana a Kimi Code con kimi-for-coding puede costar menos. Se conecta a Claude Code, Cline, RooCode y Cursor con un cambio de configuración, y puedes validar todo en Apidog antes de confiar en él para producción. Obtén una clave, envía la llamada curl anterior y verifica el uso de tokens para ver cómo se ajustan los precios a tu carga de trabajo.

button