L'annonce de Kimi K2.6 de Moonshot AI le qualifie de nouvel état de l'art en matière de codage open source, d'exécution à long terme et d'essaims d'agents, avec SWE-Bench Verified à 80,2 %, Terminal-Bench 2.0 à 66,7 %, et une capacité d'essaim d'agents étendue 3 fois à 300 sous-agents et plus de 4 000 étapes coordonnées. Le meilleur pour les développeurs : il est entièrement open source, et il existe de véritables moyens gratuits de l'utiliser en chat, via API, et même localement sur votre propre matériel.
Cet article couvre toutes les méthodes d'accès gratuites fonctionnelles en avril 2026 : le chat web kimi.com, l'application Kimi, Cloudflare Workers AI, OpenRouter (avec des réserves), les quantifications auto-hébergées, et les programmes de crédits gratuits. Vous verrez ce que chaque option vous offre, ce qu'elle limite et quand la choisir.
En bref : 6 façons gratuites d'accéder à Kimi K2.6
| Méthode | Type | Idéal pour | Limite quotidienne |
|---|---|---|---|
| Chat web kimi.com | Interface de chat | Questions rapides, Essaim d'agents, vision | Quota de messages quotidiens |
| Application mobile Kimi | Interface de chat | Utilisation en déplacement | Correspond au web |
| Cloudflare Workers AI | API (niveau gratuit) | Développeurs utilisant Workers | 10K neurones/jour |
| Variantes gratuites OpenRouter | API | Test d'intégration rapide | Ancien Kimi K2 uniquement |
| Poids ouverts auto-hébergés | Inférence locale | Équipes avec matériel GPU | Aucune |
| Programmes de crédits gratuits | Essais API | Nouveaux utilisateurs | Basé sur le compte |
Choisissez en fonction de ce que vous construisez. Les interfaces de chat sont instantanées. Les niveaux d'API sont programmables. L'auto-hébergement n'a aucun coût par jeton mais un coût matériel réel.

Option 1 : Chat web kimi (le plus facile)
Le moyen gratuit le plus rapide est le produit Kimi officiel pour le grand public sur kimi. Moonshot héberge le modèle K2.6 complet, avec Agent Swarm actif et sans carte de crédit requise.
Configuration
- Accédez à kimi.com.
- Cliquez sur S'inscrire (e-mail, Google ou téléphone).
- Sélectionnez K2.6 dans la liste déroulante des modèles en haut du chat.
Voilà toute la configuration. Vous pouvez maintenant utiliser le modèle pour le chat, le mode agent, le codage (via l'intégration Kimi Code), l'entrée visuelle (images), la compréhension vidéo et les exécutions complètes d'Agent Swarm.
Ce que vous obtenez
- Kimi K2.6 complet et Kimi K2.6 Thinking
- Essaim d'agents dans le navigateur (le panneau latéral affiche la progression des sous-agents)
- Intégration du terminal Kimi Code si vous installez le CLI compagnon
- Téléchargement d'images et de vidéos (MathVision 93,2 %, MMMU-Pro 79,4 %)
- Historique des chats entre les sessions
- Quota de messages quotidiens qui se réinitialise toutes les 24 heures
Le niveau gratuit couvre la plupart des besoins personnels et de recherche. Pour une utilisation continue par les développeurs, vous voudrez un chemin d'API ; voir Option 3.
Limites
- Nombre de messages quotidiens (Moonshot ajuste cela en fonction de la charge ; estimez 30 à 50 messages pour K2.6)
- Le mode agent compte comme plusieurs messages par tâche
- Pas d'accès programmatique depuis cette interface
- Les fonctionnalités d'entreprise (SSO, journaux d'audit, comptes d'équipe) nécessitent un abonnement payant
Option 2 : Application mobile Kimi
Même modèle, format téléphone. Téléchargez Kimi depuis l'App Store ou Google Play. Connectez-vous avec le même compte que celui que vous utilisez sur le web ; l'historique des chats se synchronise sur tous les appareils.
L'application ajoute la saisie vocale, la capture de photos pour la compréhension d'images et les notifications push lorsque les longues tâches d'agent sont terminées. Un complément utile au client web pour quiconque passe du bureau au téléphone.
Même quota gratuit que sur le web. Même manque d'accès programmatique.
Option 3 : Cloudflare Workers AI (niveau d'API gratuit)
Cloudflare Workers AI héberge Kimi K2.6 sous le nom @cf/moonshotai/kimi-k2.6. Le plan gratuit de Workers AI accorde 10 000 neurones par jour, ce qui représente environ 2 à 5 millions de jetons d'inférence K2.6 selon la longueur de l'invite. C'est suffisant pour la plupart des projets personnels et des prototypes.
Configuration
- Inscrivez-vous sur dash.cloudflare.com (gratuit).
- Allez dans AI > Workers AI et acceptez les conditions.
- Sous Mon profil > Jetons d'API, créez un jeton avec une portée de lecture/écriture pour Workers AI.
- Copiez votre ID de compte (en haut de la page Workers AI).
Appeler K2.6 via l'API REST de Cloudflare
curl https://api.cloudflare.com/client/v4/accounts/$ACCOUNT_ID/ai/run/@cf/moonshotai/kimi-k2.6 \
-H "Authorization: Bearer $CF_API_TOKEN" \
-H "Content-Type: application/json" \
-d '{
"messages": [
{"role": "user", "content": "Écrire un haïku sur les API."}
]
}'
Dans un Cloudflare Worker (la meilleure option)
export default {
async fetch(request, env) {
const response = await env.AI.run("@cf/moonshotai/kimi-k2.6", {
messages: [
{ role: "user", content: "Expliquer la récursion simplement." }
],
});
return Response.json(response);
}
};
Déployez avec wrangler deploy. Vous disposez maintenant d'un point d'accès K2.6 gratuit à votre propre URL Workers.
Limites
- 10 000 neurones/jour en gratuit (réinitialisation à minuit UTC)
- Limite par requête sur la fenêtre de contexte (plus petite que les 262 144 jetons complets ; vérifiez les limites actuelles de Workers AI)
- La disponibilité du streaming dépend de la version actuelle du point d'accès
- Limité en débit par région
Cloudflare Workers AI est la meilleure option d'API gratuite pour les développeurs. Vous obtenez une véritable URL de production, des déploiements rapides et aucune carte requise. Pour les tests d'intégration à la limite du niveau gratuit, associez-le à la commutation d'environnement d'Apidog afin de pouvoir basculer entre Cloudflare et le point d'accès payant de Moonshot en un seul clic.
Option 4 : OpenRouter (routage gratuit, majoritairement payant)
OpenRouter propose Kimi K2.6 sur un niveau payant. Deux astuces le rendent utile pour les flux de travail gratuits :
Astuce 1 : anciennes variantes gratuites de Kimi
OpenRouter héberge moonshotai/kimi-k2:free (l'ancien Kimi K2, avant la version 2.6). C'est gratuit avec des limites de débit. La qualité est inférieure à celle de K2.6, mais c'est utile pour câbler le code d'intégration avant de payer :
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "moonshotai/kimi-k2:free",
"messages": [{"role": "user", "content": "Bonjour"}]
}'
Développez avec la variante gratuite, puis changez la chaîne du modèle en moonshotai/kimi-k2.6 lorsque vous êtes prêt à payer. Pour comprendre comment Qwen gère le même schéma, consultez notre guide OpenRouter de Qwen 3.6.
Astuce 2 : promotions de crédits gratuits
OpenRouter propose régulièrement des promotions pour les nouveaux comptes avec quelques dollars de crédit, suffisants pour des millions de jetons K2.6. Vérifiez le tableau de bord OpenRouter ou leur Discord pour les offres actuelles.
La valeur d'OpenRouter réside dans sa flexibilité. Une seule clé API couvre Kimi K2.6, Claude, GPT, Gemini, DeepSeek et Qwen, avec une tarification transparente par modèle.
Option 5 : auto-héberger les poids ouverts (coût par jeton nul)
C'est l'option la plus « gratuite », avec la configuration la plus complexe. Moonshot publie les poids complets de K2.6 sous une licence MIT modifiée sur huggingface.co/moonshotai/Kimi-K2.6. Vous pouvez les télécharger, les exécuter et les affiner sans payer Moonshot.
Le problème matériel
Le K2.6 complet possède 1 billion de paramètres. En FP8, cela représente environ 1 To de mémoire GPU, ce qui signifie un cluster multi-GPU H100 ou H200. Ce n'est pas une voie « gratuite » réaliste pour la plupart des équipes.
La quantification le rend réalisable
- ubergarm/Kimi-K2.6-GGUF — quantifications compatibles llama.cpp. Une quantification 4 bits tient sur un seul nœud 8xH100 de style DGX. Les quantifications inférieures (Q3, Q2) fonctionnent sur des configurations plus petites avec une perte de qualité.
- unsloth/Kimi-K2.6 — quantifications optimisées pour le réglage conçues pour l'affinage LoRA.
- Location de cloud — RunPod, Vast.ai ou Modal pour la location horaire de GPU. Pas strictement gratuit, mais un week-end de test coûte moins de 10 $.
Exécution locale avec llama.cpp
# Installer llama.cpp
git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp && make
# Télécharger une version quantifiée
huggingface-cli download ubergarm/Kimi-K2.6-GGUF kimi-k2.6-q4_K_M.gguf --local-dir ./models
# Exécuter en mode serveur
./llama-server -m ./models/kimi-k2.6-q4_K_M.gguf --host 0.0.0.0 --port 8080
Le serveur expose une API compatible OpenAI à http://localhost:8080/v1. Pointez l'SDK OpenAI ou Apidog vers celui-ci et vous disposez d'une inférence K2.6 entièrement locale et entièrement gratuite.
Calcul de la mémoire pour l'auto-hébergement
Référence rapide pour ce qui convient où :
- Poids complets FP16 : ~2 To. Nécessite un rack complet.
- Quantifié FP8 : ~1 To. 2 nœuds 8xH100 de 80 Go.
- 4 bits (Q4_K_M) : ~500 Go. Un seul nœud 8xH100.
- 3 bits (Q3_K_M) : ~375 Go. 4x H100 avec un déchargement CPU.
- 2 bits (Q2_K) : ~250 Go. Fonctionne sur du matériel prosumer avec perte de qualité.
Pour les amateurs, une instance louée 2x H100 sur Vast.ai coûte environ 4 $/heure et exécute la quantification Q4. Pas gratuit, mais suffisamment proche pour un week-end.
Quand l'auto-hébergement est la bonne solution
- Exigences sur site (conformité, souveraineté des données, comme les flux de travail HIPAA couverts dans notre guide API HIPAA)
- Inférence à haut volume où les coûts d'API par jeton s'accumulent
- Affinage sur des données propriétaires
- Vous avez déjà du matériel GPU
Quand ce n'est pas le cas
- Vous faites du prototypage (la configuration matérielle prend plus de temps que le prototype)
- Vous avez besoin d'un débit élevé ou d'une faible latence
- Vous n'avez pas de capacité DevOps
Option 6 : Programmes de crédits gratuits
La plupart des fournisseurs commerciaux offrent des crédits gratuits pour les nouveaux comptes. Empilez-les :
- Plateforme Moonshot : les nouveaux comptes reçoivent généralement un petit solde gratuit. Inscrivez-vous sur platform.moonshot.ai ou platform.kimi.ai.
- OpenRouter : crédits promotionnels pour les nouveaux comptes.
- Together AI : crédits d'essai gratuits pour le point d'accès Kimi K2.6.
- Fireworks AI : crédits gratuits pour les nouveaux utilisateurs.
- Cloudflare Workers AI : 10K neurones/jour gratuits à vie, sans carte de crédit.
Les crédits cumulés couvrent des millions de jetons pour les projets secondaires, les prototypes et l'évaluation de modèles.
Quelle option gratuite devriez-vous choisir ?
Usage personnel ou recherche
Chat web kimi.com. Zéro configuration, Essaim d'agents complet, quota quotidien généreux.
Codage amateur
Cloudflare Workers AI. API programmable, 10K neurones/jour gratuits, URL de production réelle.
Prototypage d'un produit commercial
Combinaison. Itérez les invites sur kimi.com, puis utilisez le crédit gratuit Moonshot et construisez une véritable intégration API avec Apidog. Lorsque les crédits sont épuisés, vous disposez d'une intégration éprouvée pour établir votre budget.
Travail en entreprise ou sensible aux données
Auto-hébergez les poids quantifiés. Seule voie gratuite en production. Voir les outils de test API isolés pour les modèles d'entreprise adjacents.
Échelle d'agent ou d'agent de codage
Commencez avec le niveau gratuit de Cloudflare, passez à l'API payante de Moonshot lorsque vous atteignez la limite quotidienne.
Limites du niveau gratuit que vous rencontrerez
Chaque chemin a une limite. Savoir où vous fera économiser de la frustration :
- kimi.com : nombre de messages quotidiens, les tâches d'Agent Swarm comptent comme plusieurs messages.
- Cloudflare Workers AI : 10K neurones/jour. Une utilisation intensive de K2.6 peut épuiser le quota en quelques centaines d'appels.
- Variantes gratuites OpenRouter : limitées en débit, généralement 20 requêtes/min sur les modèles gratuits.
- Crédits gratuits Moonshot : s'épuisent après quelques millions de jetons.
- Auto-hébergé : pas de limite de jetons, mais coût matériel + électricité.
Mélangez et combinez. De nombreuses équipes utilisent kimi.com pour l'exploration, Cloudflare pour le développement/test, et Moonshot payant pour la production.
Tester les points d'accès gratuits avec Apidog
Lorsque vous combinez des niveaux gratuits sur kimi.com, Cloudflare, OpenRouter et une version locale de llama.cpp, vous vous retrouvez avec quatre ou cinq configurations de points d'accès. Apidog les centralise.

Dans un seul projet Apidog :
- Enregistrez le point d'accès Cloudflare Workers AI avec votre ID de compte
- Enregistrez le point d'accès API Moonshot avec votre jeton Bearer
- Enregistrez un point d'accès local pour votre version auto-hébergée
- Enregistrez un point d'accès OpenRouter avec commutation de modèle
- Exécutez la même invite de test sur les quatre et comparez les sorties
Apidog gère les flux SSE sur tous ces backends, enregistre l'historique des requêtes pour que vous puissiez rejouer les appels échoués plus tard, et prend en charge le partage d'équipe pour les flux de travail axés sur les développeurs. Le niveau gratuit couvre l'utilisation individuelle avec une collaboration d'équipe jusqu'à quatre membres. Téléchargez Apidog et vous pourrez avoir les quatre backends K2.6 gratuits configurés en moins de 20 minutes.
Pour des plongées plus approfondies dans les modèles de test d'outils connexes, consultez nos guides sur le test d'API sans Postman, Apidog dans VS Code et les outils de test d'API pour les ingénieurs QA.
Un flux de travail d'évaluation de niveau gratuit en 20 minutes
Si vous décidez si Kimi K2.6 convient à un projet, exécutez ceci en 20 minutes avant de dépenser de l'argent réel :
- 5 minutes — inscrivez-vous sur kimi.com et soumettez-lui votre invite la plus difficile du monde réel. Est-ce qu'il réussit la tâche ?
- 5 minutes — créez un compte Cloudflare Workers AI et appelez
@cf/moonshotai/kimi-k2.6depuis curl. Le temps de réponse correspond-il à votre budget de latence ? - 5 minutes — ouvrez Apidog, enregistrez les deux points d'accès et exécutez une requête de streaming identique sur chacun. Comparez le nombre de jetons et la cadence de streaming.
- 5 minutes — vérifiez kimi.com/membership/pricing et le tableau de bord de l'API Moonshot pour estimer le coût du volume de production.
Au bout de 20 minutes, vous avez suffisamment d'informations pour choisir un chemin de production. Si le chat est suffisant, restez gratuit. Si vous avez besoin d'une API, choisissez entre le niveau gratuit de Cloudflare, Moonshot payant ou l'auto-hébergement.
Évitez les arnaques aux « clés API Kimi K2.6 gratuites »
Vous verrez des sites web et des groupes Discord offrant des « clés API Kimi K2.6 gratuites ». Évitez-les. Ils sont généralement :
- Des clés volées qui cesseront de fonctionner.
- Des services proxy enregistrant vos invites.
- Des tentatives de hameçonnage pour obtenir vos informations de paiement.
Restez sur les chemins officiels. Les options gratuites légitimes listées ci-dessus couvrent une utilisation réelle. Si vous avez besoin de plus, l'API Moonshot payante est abordable ; le guide de l'API Kimi K2.6 vous explique la configuration.
FAQ
Kimi K2.6 est-il vraiment gratuit ?Le chat grand public sur kimi.com est gratuit avec un quota quotidien. Les poids sont gratuits sous licence MIT modifiée. L'accès API est gratuit jusqu'à une certaine limite (Cloudflare, crédits nouveaux comptes) ou payant.
Ai-je besoin d'une carte de crédit pour utiliser Kimi K2.6 gratuitement ?Pas pour le chat web kimi.com ou le niveau gratuit de Cloudflare Workers AI. Parfois pour OpenRouter. La vérification de la carte pour les crédits de la plateforme Moonshot varie.
Puis-je utiliser Kimi K2.6 gratuitement pour des projets commerciaux ?Oui. La licence autorise l'utilisation commerciale. À très grande échelle (>100M d'utilisateurs actifs mensuels ou >20M $ de revenus mensuels), vous devez visiblement créditer « Kimi K2.6 ». En dessous, aucune attribution n'est nécessaire.
Le niveau gratuit prend-il en charge Agent Swarm ?Le chat web kimi.com oui, avec une capacité complète de 300 agents. La plupart des niveaux gratuits d'API oui pour le modèle de base. Les plafonds de sous-agents peuvent varier selon le fournisseur.
Combien coûte Kimi K2.6 après les crédits gratuits ?Voir kimi.com/membership/pricing pour les détails des niveaux officiels. OpenRouter et d'autres passerelles listent leurs propres tarifs par jeton.
Puis-je utiliser Kimi K2.6 gratuitement en ligne de commande ?Oui. Installez Kimi Code ou pointez n'importe quel CLI compatible OpenAI vers Cloudflare Workers AI. L'auto-hébergement avec llama.cpp vous donne un CLI local qui ne communique jamais avec le cloud.
Mes données sont-elles privées sur le niveau gratuit ?Sur kimi.com, les conversations peuvent être utilisées pour l'amélioration du modèle (vérifiez les paramètres de confidentialité). Sur Cloudflare Workers AI, Cloudflare enregistre les données pour la facturation. En auto-hébergement, les données ne quittent jamais votre machine. Si la confidentialité est critique, auto-hébergez.
Les niveaux gratuits incluent-ils les fonctionnalités de vision et de vidéo ?Le chat kimi.com inclut la saisie d'images et de vidéos. Cloudflare Workers AI prend en charge le texte et les images ; la prise en charge vidéo dépend de la version du point d'accès. Les quantifications auto-hébergées préservent la vision ; la prise en charge vidéo varie selon la version.
Comment Kimi K2.6 se compare-t-il aux autres modèles d'IA à accès gratuit ?C'est le modèle d'agent à poids ouvert le plus puissant en 2026. Par rapport à Qwen 3.6, il est en avance sur les benchmarks de codage et d'agents. Par rapport à Qwen3.5-Omni, il échange la variété multimodale contre une focalisation plus nette sur l'agent. Par rapport à DeepSeek V3.x, il a l'avantage en orchestration d'agents.
Résumé
Kimi K2.6 est l'un des rares modèles de pointe où « gratuit » n'est pas un tour de passe-passe d'essai. L'annonce de Moonshot le présente comme un open source à la pointe de la technologie, et la licence le confirme. Kimi vous offre le modèle complet pour une utilisation occasionnelle. Cloudflare Workers AI vous offre un niveau d'API gratuit et programmable. L'auto-hébergement vous offre un coût par jeton nul si vous disposez du matériel.
Choisissez le chemin qui correspond à ce que vous construisez, testez-le avec Apidog pour détecter rapidement les bizarreries, et passez à l'API Moonshot payante uniquement lorsque les niveaux gratuits ne suffisent plus. Pour la plupart des utilisations personnelles et en petite équipe, ils ne le font jamais.
