Cómo ejecutar Kimi K2.5 con ClawdBot (MoltBot)

MoltBot, anteriormente conocido como ClawdBot, se destaca como un agente autoalojado que se integra directamente con plataformas de mensajería como Telegram, WhatsApp, Discord y Slack. Ejecuta tareas reales en tu máquina mientras mantiene la privacidad y una baja latencia.

Conectar Kimi K2.5 a MoltBot crea un asistente versátil y rentable. Los usuarios obtienen un sólido rendimiento para tareas generales, trabajo creativo y comportamientos de agente a una fracción del costo de modelos como Claude 3.5 Sonnet o GPT-4o. Para configuraciones centradas en la privacidad, la implementación local utilizando pesos GGUF cuantificados elimina la transmisión de datos externos.

💡

Pequeños detalles de configuración a menudo determinan el éxito. Antes de editar archivos, verifica la conectividad. Descarga Apidog gratis—proporciona una interfaz intuitiva para probar puntos finales de la API de Moonshot o servidores locales, inspeccionar cargas útiles JSON, monitorear la latencia y generar fragmentos de código de integración. Este paso previene muchos errores posteriores al vincular MoltBot.

botón

Esta guía explica detalladamente tanto los métodos API como los locales. Incluye ejemplos de configuración, pasos de verificación y soluciones para problemas frecuentes.

¿Por qué emparejar MoltBot con Kimi K2.5?

MoltBot sirve como capa de ejecución, mientras que el LLM proporciona inteligencia. Kimi K2.5 ofrece ventajas distintas en este papel.

El modelo ofrece alta capacidad a través de su diseño MoE, activando expertos relevantes de manera eficiente. Maneja entradas multimodales de forma nativa, permitiendo a MoltBot procesar capturas de pantalla, diseños de UI o videos cortos para tareas como la generación de código a partir de elementos visuales.

La longitud del contexto alcanza los 256K tokens en la mayoría de las implementaciones, lo que permite la retención de extensas bases de código de proyectos, documentación o historiales de conversación, esenciales para asistentes persistentes.

Los costos de la API se mantienen bajos en comparación con las alternativas occidentales. Los usuarios intensivos ahorran sustancialmente con el tiempo. Para un gasto continuo nulo y un control máximo, la inferencia local funciona en hardware de consumo con cuantificación.

Kimi K2.5 demuestra sólidas capacidades de agente, incluyendo enjambres autodirigidos de hasta 100 subagentes para la ejecución paralela de herramientas. Cuando se enrutan a través del sistema de habilidades de MoltBot, estas características automatizan flujos de trabajo complejos directamente desde mensajes de chat.

La flexibilidad de MoltBot soporta cualquier punto final compatible con OpenAI. Cambiar de proveedor solo requiere actualizaciones de configuración, por lo que los usuarios experimentan fácilmente.

Requisitos previos

Prepara estos elementos antes de la configuración.

Instala MoltBot por completo. Ejecuta el script de instalación si aún no lo has hecho:

curl -fsSL https://molt.bot/install.sh | bash

El proyecto cambió de nombre de ClawdBot a MoltBot el 27 de enero de 2026, tras una solicitud de marca registrada de Anthropic. Las instalaciones más antiguas pueden conservar el directorio ~/.clawdbot, pero las versiones recientes utilizan comandos moltbot y ~/.moltbot o rutas similares. Consulta la documentación en molt.bot o el repositorio de GitHub (github.com/moltbot/moltbot) para tu configuración exacta.

Obtén acceso a Kimi K2.5:

Ruta API: Crea una cuenta en platform.moonshot.ai, genera una clave API y anota cualquier límite de presupuesto del proyecto.
Ruta local: Descarga pesos cuantificados (por ejemplo, de Hugging Face moonshotai/Kimi-K2.5 o repositorios comunitarios como unsloth/Kimi-K2.5-GGUF). Instala llama.cpp e inicia un servidor.

Instala Apidog para realizar pruebas. Maneja eficazmente los encabezados de autenticación, los cuerpos JSON y la transmisión de respuestas.

Asegúrate de que Node.js esté ejecutándose para MoltBot. La familiaridad básica con la terminal ayuda a editar archivos JSON.

Método 1: Conexión a través de la API de Moonshot (Recomendado para la mayoría de los usuarios)

Este enfoque requiere un hardware mínimo y proporciona un contexto completo de 256K, además de soporte multimodal.

Paso 1: Valida la conexión API usando Apidog

Inicia Apidog y crea una nueva solicitud POST.

Configura la URL a:

https://api.moonshot.ai/v1/chat/completions

Añade el encabezado:

Authorization: Bearer sk-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

(Reemplaza con tu clave real.)

Usa este cuerpo para una prueba básica:

{
  "model": "kimi-k2.5",
  "messages": [
    {
      "role": "user",
      "content": "Confirm you are Kimi K2.5 and describe your capabilities briefly."
    }
  ],
  "temperature": 0.7,
  "max_tokens": 256
}

Envía la solicitud. Una respuesta 200 exitosa con una salida coherente confirma que la clave funciona. Anota aquí cualquier error de límite de tarifa o de presupuesto.

Paso 2: Localiza y edita el archivo de configuración

MoltBot almacena la configuración en un archivo JSON, típicamente:

~/.moltbot/moltbot.json
O legado: ~/.clawdbot/moltbot.json / ~/.clawdbot/agents/default/config.json

Ábrelo con un editor.

Añade o modifica la sección de proveedores:

{
  "agent": {
    "model": {
      "primary": "moonshot/kimi-k2.5"
    }
  },
  "models": {
    "providers": {
      "moonshot": {
        "baseUrl": "https://api.moonshot.ai/v1",
        "apiKey": "sk-your-moonshot-api-key-here",
        "api": "openai-completions",
        "models": [
          {
            "id": "kimi-k2.5",
            "name": "Kimi K2.5 (API)",
            "contextWindow": 262144,
            "maxTokens": 8192
          }
        ]
      }
    }
  }
}

Nota de seguridad: Evita codificar claves directamente en producción. Establece una variable de entorno (por ejemplo, export MOONSHOT_API_KEY=sk-...) y referénciala si MoltBot soporta expansión.

Paso 3: Aplica los cambios y reinicia

Guarda el archivo y luego reinicia:

moltbot restart

O detén e inicia el gateway/servicio según sea necesario.

Método 2: Conexión a través de la implementación local de Kimi K2.5

La ejecución local prioriza la privacidad y elimina los costos recurrentes, aunque exige una VRAM/RAM sustancial.

Paso 1: Inicia el servidor de inferencia local

Usa llama.cpp para compatibilidad.

Compila llama.cpp con soporte de GPU si está disponible:

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp
make LLAMA_CUDA=1  # o banderas apropiadas

Descarga una variante GGUF cuantificada (por ejemplo, UD-TQ1_0 para equilibrio):

Usa huggingface-cli o descarga directa.

Inicia el servidor compatible con OpenAI:

./llama-server \
  -m /path/to/Kimi-K2.5-UD-TQ1_0.gguf \
  --port 8080 \
  --ctx-size 32768 \          # Ajusta hasta el límite de hardware; 256K necesita recursos extremos
  --n-gpu-layers 99 \
  --host 0.0.0.0

Verifica navegando a http://localhost:8080/v1/models.

Paso 2: Actualiza la configuración de MoltBot para el punto final local

Edita el archivo JSON:

{
  "agent": {
    "model": {
      "primary": "local-kimi/kimi-k2.5"
    }
  },
  "models": {
    "providers": {
      "local-kimi": {
        "baseUrl": "http://127.0.0.1:8080/v1",
        "apiKey": "sk-no-key-required",
        "api": "openai-completions",
        "models": [
          {
            "id": "kimi-k2.5-local",
            "name": "Kimi K2.5 Local",
            "contextWindow": 32768,   // Debe coincidir con --ctx-size
            "maxTokens": 4096
          }
        ]
      }
    }
  }
}

Nota de Docker: Si MoltBot se ejecuta en un contenedor, reemplaza 127.0.0.1 con host.docker.internal.

Paso 3: Reinicia y monitorea el uso de recursos

Reinicia MoltBot y observa los monitores del sistema. La inferencia local consume una memoria significativa; descarga capas o reduce el contexto si es necesario.

Pruebas y verificación

Confirma que la integración funciona.

Envía un mensaje a tu instancia de MoltBot (a través de la aplicación conectada):

"Who are you powered by right now?"

Kimi K2.5 normalmente responde identificándose como Moonshot AI.

Revisa los registros:

moltbot logs

Busca solicitudes dirigidas a api.moonshot.ai o localhost:8080.

Prueba multimodal si usas la API: Sube una imagen a través del chat y pide una descripción o generación de código a partir de ella.

Resolución de problemas comunes

La verificación del proveedor falla → Vuelve a probar la `baseUrl` + clave exacta en Apidog. Los proxies de red o los firewalls a menudo interfieren.

Errores de desbordamiento de contexto → Alinea `contextWindow` en JSON con `server --ctx-size`. MoltBot trunca o resume cuando se alcanzan los límites; los valores no coincidentes causan fallos.

Respuestas lentas localmente → Reduce las `gpu-layers`, usa menor cuantificación o habilita la atención flash en llama.cpp.

Formato/alucinaciones inesperados → Experimenta con la temperatura (0.6–1.0) o añade prompts de sistema personalizados en la configuración del agente de MoltBot para el ajuste específico de Kimi.

Agotamiento del presupuesto de la API → Monitorea el uso en platform.moonshot.ai y establece límites diarios.

Conclusión

La integración de Kimi K2.5 con MoltBot ofrece un agente de IA personal de alto rendimiento, económico y, opcionalmente, totalmente privado. El método API ofrece comodidad y máximas capacidades, mientras que la configuración local garantiza una soberanía de datos completa.

Experimenta con ambos enfoques. Usa Apidog en todo momento para aislar problemas rápidamente. A medida que Moonshot continúa actualizando los modelos Kimi y MoltBot evoluciona, esta combinación posiciona a los usuarios a la vanguardia de la IA de agente accesible.

Comienza a configurar ahora: tu asistente mejorado te espera.

botón