Prix Xiaomi MiMo V2.5 en 2026 : Quel budget prévoir ?

Ashley Innocent

Ashley Innocent

27 May 2026

Prix Xiaomi MiMo V2.5 en 2026 : Quel budget prévoir ?

Apidog pour les entreprises

Déploiement sur site

SSO & RBAC

Conforme SOC 2

Explorer Apidog Enterprise

Le prix de l'API Xiaomi MiMo V2.5 est passé à un tarif forfaitaire de 1 $ par million de jetons d'entrée et 3 $ par million de jetons de sortie le 27 mai 2026, et l'équipe a rendu ce nouveau tarif permanent. L'ancien palier de contexte long, où les requêtes dépassant 256K jetons entraînaient un multiplicateur élevé sur le tarif de base, a disparu. Un seul prix désormais, quelle que soit la longueur du contexte. Pour la plupart des charges de travail, la nouvelle principale tient en une seule phrase : MiMo V2.5 est l'un des trois modèles avec un contexte d'1M les moins chers en production, et il le reste.

En bref

Ce qui a changé le 27 mai 2026

L'avis officiel de mise à jour des prix de Xiaomi présente trois changements. Les trois sont entrés en vigueur le 27 mai à 00h00, heure de Pékin, soit le 26 mai à 16h00 UTC.

1. Tarification forfaitaire pour toutes les fenêtres de contexte. L'ancien barème de MiMo V2.5 utilisait des tarifs échelonnés : un prix de base pour les requêtes jusqu'à 32K jetons d'entrée, un multiplicateur pour la bande de 32K à 256K, et un tarif encore plus élevé au-delà de 256K. Le nouveau barème a un seul chiffre par type de jeton. Les applications à long contexte ne paient plus de taxe sur le long contexte.

2. Permanent, non promotionnel. L'avis utilise deux fois l'expression "Réduction de prix permanente" et une fois "rénover en permanence l'ensemble du système de tarification du modèle". Pas de date d'expiration. Pas de clause de retour en arrière. Considérez-le comme le nouveau prix catalogue.

3. Réinitialisation des récompenses du plan de jetons. Si vous êtes sur un plan de jetons (le système de quota prépayé de Xiaomi), votre solde de crédits a été augmenté de 5 à 8 fois et chaque crédit que vous aviez déjà consommé dans votre période de validité a été remboursé. La période de validité elle-même n'a pas été prolongée, les plans existants ont donc bénéficié d'une aubaine budgétaire mais pas de temps supplémentaire.

L'affirmation phare "jusqu'à 99 % de réduction" s'applique spécifiquement à la bande de contexte long. Le prix antérieur pour plus de 256K jetons d'entrée était suffisamment élevé pour qu'un passage à 1 $/M produise une réduction de plus de 90 %. Pour les charges de travail qui se situaient dans le palier de base, la réduction est plus petite mais toujours significative.

La nouvelle grille tarifaire permanente

Prix par million de jetons, en USD, effectif immédiatement et permanent :

Modèle Entrée Sortie Mis en cache Contexte
MiMo V2.5 Pro 1,00 $ 3,00 $ 0,20 $ 1M jetons
MiMo V2 Flash ~0,10 $ ~0,40 $ 0,02 $ 256K jetons

Quelques détails que le tableau ne rend pas évidents :

Pour les anciens tarifs de V2-Pro à titre de référence, consultez notre guide de tarification MiMo V2-Pro & Omni.

Ce qu'apporte MiMo V2.5 au-delà d'une tarification moins chère

L'annonce du 27 mai est un événement tarifaire, mais V2.5 est également une mise à niveau significative par rapport à V2-Pro lancé en avril. Trois changements méritent d'être notés :

Aucun de ces points n'est une référence majeure, mais ce sont les changements qui se manifestent dans les déploiements de production réels. Associez la tarification moins chère à la fenêtre de contexte fiable plus longue et vous obtenez une option qui n'existait pas pour les travaux sérieux sur des documents longs avant le 27 mai.

Comment MiMo V2.5 se positionne par rapport à la concurrence

La comparaison intéressante n'est pas avec l'ancien V2.5. C'est avec les autres options d'API de pointe disponibles en mai 2026 :

Modèle Entrée ($/MTok) Sortie ($/MTok) Contexte
Xiaomi MiMo V2.5 Pro 1,00 $ 3,00 $ 1M
DeepSeek V4-Pro 0,435 $ 0,87 $ 128K
GPT-5.5 5,00 $ 30,00 $ 200K
Claude Opus 4.7 3,00 $ 15,00 $ 200K
Gemini 3.5 Flash ~1,50 $ ~9,00 $ 1M

Trois points à retenir :

Pour le côté DeepSeek de cette comparaison, consultez La réduction de prix de 75% de DeepSeek V4-Pro est désormais permanente. Les deux articles sont des lectures complémentaires. Ils couvrent tous deux les réductions permanentes de prix des laboratoires chinois sur leurs modèles de pointe cette semaine.

Trois charges de travail, trois nouvelles factures

Trois cas concrets utilisant les nouveaux tarifs permanents :

1. RAG (Retrieval Augmented Generation) de documents longs sur des PDF d'entreprise. 50 000 requêtes/jour, contexte de 800K jetons par requête, réponses de 1K jetons. Ancien palier de contexte long de MiMo V2.5 (taux effectif estimé à 50 $/M) : environ 60 000 $/mois. Nouveau tarif forfaitaire : environ 1 225 $/mois. Économies : 58 775 $/mois.

2. Agent de révision de code. 5 000 requêtes de tirage/jour, contexte de dépôt de 30K jetons, sortie de commentaires de 2K jetons. Ancienne facture mensuelle GPT-5.5 : environ 5 250 $. Nouveau MiMo V2.5 : environ 510 $. Économies : 4 740 $/mois.

3. Chatbot de support client. 200 000 interactions/jour, invite système de 4K jetons, réponses de 300 jetons. Ancienne facture mensuelle Claude Opus 4.7 : environ 11 250 $. Nouveau MiMo V2.5 : environ 805 $. Économies : 10 445 $/mois.

La charge de travail n°1 est celle où MiMo V2.5 se distingue des autres. Les tâches à long contexte étaient d'un coût prohibitif sur toutes les API de pointe avant cette réduction. Elles ne le sont plus. Les mêmes documents qui étaient auparavant envoyés à des résumateurs et des pipelines de découpage peuvent désormais être transmis au modèle dans leur intégralité, sans gymnastique de budget de jetons.

Une brève note sur les succès du cache

Le taux d'entrée mis en cache de 0,20 $/M est 5 fois moins cher que le taux de 1,00 $ pour les échecs de cache. C'est une réduction de cache plus faible que le ratio 120:1 de DeepSeek (manque d'entrée/succès d'entrée), mais elle reste significative pour tout agent qui réutilise une invite système stable.

Un exemple concret. Supposons que votre assistant utilise une invite système de 6 000 jetons et gère 80 000 interactions de chat par jour, avec un message utilisateur moyen de 250 jetons d'entrée et une réponse moyenne de 600 jetons de sortie :

Ce n'est pas la performance de cache de 88 % offerte par DeepSeek, mais sur une charge de travail qui coûte 500 $/jour en entrée, une réduction de moitié représente une somme d'argent réelle. Fixez l'invite système, triez le contexte récupéré de manière stable et n'injectez pas d'horodatages par requête dans le préfixe. Les mêmes règles qui permettent de réussir les accès au cache partout ailleurs s'appliquent également ici.

Quand MiMo V2.5 est le bon choix, et quand il ne l'est pas

La nouvelle tarification fait de MiMo V2.5 le choix par défaut pour deux catégories de charges de travail et un mauvais choix pour une.

Bon choix :

Mauvais choix :

Mises en garde :

Pour le contexte du lancement de V2-Pro qui prépare V2.5, voir Xiaomi vient de lancer son propre modèle d'IA, et il est gratuit sur OpenRouter. Pour l'accès au niveau gratuit, le programme de 100 T jetons gratuits Xiaomi MiMo Orbit couvre l'éligibilité et l'inscription.

Tester MiMo V2.5 avec Apidog

La compatibilité OpenAI de la plateforme est bonne, mais pas parfaite. Vérifiez votre intégration avant de basculer le trafic de production.

Apidog vous permet de diriger une requête de Chat Completions vers https://platform.xiaomimimo.com/v1 avec votre clé API MiMo, puis :

Téléchargez Apidog, importez le schéma OpenAI Chat Completion, changez l'URL de base, et vous aurez un harnais de test V2.5 fonctionnel en moins de dix minutes. Le même flux de travail que nous avons recommandé dans Comment utiliser l'API DeepSeek V4.

Comment se profile la guerre des prix des LLM en 2026

MiMo V2.5 est la deuxième réduction permanente de prix sur un modèle de pointe d'un laboratoire chinois en une seule semaine. DeepSeek a rendu V4-Pro permanent à 1/4 de son prix catalogue le 22 mai. Kimi K2 a réduit ses prix plus tôt au premier trimestre. OpenAI O3 a chuté de 80 % en février. Le schéma est clair :

Pour le reste de ce tableau :

Où cela laisse votre construction

La réduction de MiMo V2.5 n'est pas un coup de marketing. C'est une refonte structurelle de la tarification du palier de contexte d'1 million de jetons, et la réduction est permanente. Si vous avez reporté le RAG de documents longs, les agents de code à l'échelle du dépôt, ou toute charge de travail nécessitant un contexte de plus de 200K jetons pour des raisons de coût, le budget que vous avez estimé le trimestre dernier surestime probablement d'un ordre de grandeur le besoin de ce trimestre.

Trois prochaines étapes concrètes :

Le seuil de prix a de nouveau bougé. Développez en conséquence.

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API