En bref
La tarification MiMo-V2-Pro commence à 1 $/1M de jetons d'entrée et 3 $/1M de jetons de sortie (contexte ≤256K). La tarification MiMo-V2-Omni couvre les entrées multimodales (texte, image, audio et vidéo) dans un modèle unifié. Les deux sont accessibles via une API compatible OpenAI à l'adresse platform.xiaomimimo.com. Utilisez Apidog pour tester l'API visuellement, ou Python pour les intégrations en production, et toujours accompagner votre intégration d'un test unitaire.
Introduction
Xiaomi a lancé trois nouveaux modèles d'IA le 18 mars 2026 et la communauté des développeurs l'a rapidement remarqué. MiMo-V2-Pro et MiMo-V2-Omni sont les deux versions phares : l'une conçue pour le raisonnement agentique profond, l'autre pour une véritable compréhension multimodale. Si vous essayez de comprendre la tarification MiMo-V2-Pro, la tarification Omni, ou simplement comment utiliser l'API dans votre pile technologique, ce guide vous explique tout. Nous allons détailler les niveaux de tarification complets, présenter les capacités de l'API et vous montrer deux chemins d'intégration : un flux de travail basé sur une interface graphique avec Apidog et une approche Python avec un test unitaire pour valider votre configuration.
Détail de la tarification MiMo-V2-Pro et MiMo-V2-Omni
Comprendre la tarification MiMo-V2-Pro et la tarification Omni est la première étape avant de commencer à appeler l'API. Les deux modèles utilisent une tarification échelonnée basée sur les jetons, et la structure de coûts est suffisamment compétitive pour qu'ils méritent une considération sérieuse pour les charges de travail en production.
Tarification MiMo-V2-Pro : Échelonnée par longueur de contexte
La tarification MiMo-V2-Pro est divisée en deux niveaux en fonction de la quantité de contexte que vous utilisez par requête :
| Longueur du contexte | Entrée (par 1M de jetons) | Sortie (par 1M de jetons) |
|---|---|---|
| ≤ 256K jetons | $1.00 | $3.00 |
| 256K – 1M jetons | $2.00 | $6.00 |
La structure échelonnée reflète la fenêtre de contexte de 1 million de jetons du modèle, l'une des plus grandes disponibles. Pour la plupart des charges de travail qui restent sous 256K jetons, la tarification MiMo-V2-Pro est extrêmement compétitive : la sortie à 3 $/1M ne représente qu'un huitième du prix de Claude Opus. Pour les tâches à long terme comme le traitement de bases de code complètes ou les séquences de planification étendues, le niveau 256K-1M s'applique.
Tarification MiMo-V2-Omni
La tarification Omni suit une structure similaire à celle de MiMo-V2-Pro, avec des considérations supplémentaires pour les entrées multimodales. MiMo-V2-Omni traite nativement le texte, l'image, l'audio et la vidéo dans une architecture unifiée, non pas comme des modules séparés ajoutés. Les jetons d'image et d'audio sont comptés parallèlement aux jetons de texte, de sorte que la tarification Omni évolue avec la richesse de vos entrées.
Pour les tâches purement textuelles, la tarification Omni est comparable à MiMo-V2-Pro. Pour les charges de travail multimodales, attendez-vous à des nombres de jetons plus élevés par requête en raison de la tokénisation des images et de l'audio.
Comparaison des tarifs de la famille MiMo-V2
Pour mettre en contexte la tarification MiMo-V2-Pro et la tarification Omni :
| Modèle | Entrée (par 1M de jetons) | Sortie (par 1M de jetons) | Fenêtre de contexte | Modalités |
|---|---|---|---|---|
| MiMo-V2-Pro | $1.00 / $2.00* | $3.00 / $6.00* | 1M de jetons | Texte |
| MiMo-V2-Omni | ~$1.00* | ~$3.00* | 256K jetons | Texte, Image, Audio, Vidéo |
| MiMo-V2-Flash | $0.10 | $0.30 | 256K jetons | Texte |
Échelonné ou approximatif : vérifiez les tarifs actuels sur platform.xiaomimimo.com
MiMo-V2-Flash est l'option la moins chère pour les tâches purement textuelles. MiMo-V2-Pro est le bon choix lorsque vous avez besoin d'un raisonnement approfondi et d'un long contexte. MiMo-V2-Omni est le choix pour les pipelines multimodaux où la tarification Omni couvre tous les types d'entrée en un seul appel API.
Capacités de l'API MiMo-V2-Pro et Omni
Avant d'apprendre comment utiliser l'API, il est utile de savoir ce que chaque modèle fait réellement.
MiMo-V2-Pro est le modèle de raisonnement phare de Xiaomi, conçu pour « l'ère des agents ». Spécifications clés :
- 1 billion de paramètres au total, 42 milliards actifs (3 fois plus grand que MiMo-V2-Flash)
- La fenêtre de contexte de 1 million de jetons gère des bases de code complètes et de longues séquences de planification
- Prédiction multi-jetons (MTP) pour une inférence plus rapide
- Conçu pour le raisonnement autonome en plusieurs étapes, l'exécution d'outils et les tâches d'ingénierie logicielle
- Classé n°1 parmi 160 modèles dans sa catégorie de prix sur l'indice d'intelligence d'analyse artificielle (score : 49 contre une médiane de 13)
- Solides performances sur SWE-Bench et les benchmarks de codage
MiMo-V2-Omni est le modèle de fondation multimodal de Xiaomi :
- Traite nativement le texte, l'image, l'audio et la vidéo dans une architecture unifiée
- Encodeurs d'image et d'audio dédiés intégrés au niveau de l'architecture
- Convient à la compréhension de documents, à la transcription audio, à l'analyse vidéo et au raisonnement transmodal
Les deux modèles sont disponibles via la plateforme API officielle à l'adresse platform.xiaomimimo.com, avec des points de terminaison compatibles OpenAI, ce qui signifie que vous pouvez les intégrer dans toute intégration SDK OpenAI existante avec des changements minimaux.
Comment utiliser l'API avec Apidog
Apidog est le moyen le plus rapide d'explorer comment utiliser l'API sans écrire de code au préalable. Il vous offre une interface graphique complète pour envoyer des requêtes, inspecter les réponses et exécuter des assertions de test unitaire, le tout au même endroit. Téléchargez Apidog gratuitement avant de commencer.
Configuration des requêtes API MiMo-V2-Pro et Omni dans Apidog
Utiliser l'API dans Apidog prend moins de deux minutes :
- Ouvrez Apidog et créez un nouveau projet, nommez-le par exemple
Tests API MiMo-V2. - Créez une nouvelle requête HTTP :
- Méthode :
POST - URL :
https://api.xiaomimimo.com/v1/chat/completions
3. Ajoutez des en-têtes dans l'onglet En-têtes :
| Clé | Valeur |
|---|---|
Authorization | Bearer YOUR_MIMO_API_KEY |
Content-Type | application/json |
4. Définissez le corps de la requête (Corps → JSON) pour MiMo-V2-Pro :
{
"model": "mimo-v2-pro",
"messages": [
{
"role": "user",
"content": "Écrivez une fonction Python qui vérifie si un nombre est premier, et expliquez comment vous la testeriez unitairement."
}
],
"temperature": 0.6,
"max_tokens": 512
}
Pour MiMo-V2-Omni, changez le modèle et ajoutez une entrée image :
{
"model": "mimo-v2-omni",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Décrivez ce que vous voyez sur cette image." },
{ "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
]
}
],
"max_tokens": 300
}5. Cliquez sur Envoyer. Apidog affiche la réponse complète avec l'utilisation des jetons, vous permettant de suivre les coûts de la tarification MiMo-V2-Pro et de la tarification Omni par requête en temps réel.
Écriture de tests unitaires pour l'API MiMo-V2-Pro et Omni dans Apidog
Apidog dispose d'un moteur de script de test intégré. Après avoir envoyé une requête, ouvrez l'onglet Tests et ajoutez ces assertions de test unitaire :
// Test unitaire 1 : Le statut HTTP est 200
pm.test("Status code is 200", function () {
pm.response.to.have.status(200);
});
// Test unitaire 2 : Modèle correct retourné (validation de la tarification MiMo-V2-Pro)
pm.test("Model ID is correct", function () {
const json = pm.response.json();
pm.expect(json.model).to.include("mimo-v2");
});
// Test unitaire 3 : La réponse contient un message de l'assistant
pm.test("Assistant message is present", function () {
const json = pm.response.json();
pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});
// Test unitaire 4 : Utilisation des jetons signalée (pour le suivi de la tarification Omni et Pro)
pm.test("Token usage is present", function () {
const json = pm.response.json();
pm.expect(json.usage.total_tokens).to.be.above(0);
});
Ces quatre vérifications de tests unitaires couvrent l'essentiel : le statut, l'identité du modèle, le contenu de la réponse et l'utilisation des jetons. Apidog les exécute automatiquement à chaque envoi, afin que vous détectiez les régressions immédiatement à mesure que vous itérez sur les prompts. Vous pouvez également enregistrer la collection et l'exécuter en CI à l'aide du runner CLI d'Apidog.
Comment utiliser l'API avec Python
Pour une utilisation en production, voici comment utiliser l'API en Python avec une suite complète de tests unitaires utilisant pytest.
Installation
pip install openai pytest
L'API MiMo est compatible OpenAI, donc le SDK openai fonctionne directement.
Appel API de base (MiMo-V2-Pro)
# mimo_client.py
from openai import OpenAI
# Dirige le client OpenAI vers l'API MiMo
client = OpenAI(
api_key="YOUR_MIMO_API_KEY",
base_url="https://api.xiaomimimo.com/v1"
)
def ask_mimo_pro(prompt: str) -> dict:
"""Appelle l'API MiMo-V2-Pro et renvoie une réponse structurée."""
response = client.chat.completions.create(
model="mimo-v2-pro",
messages=[{"role": "user", "content": prompt}],
temperature=0.6,
max_tokens": 512
)
return {
"content": response.choices[0].message.content,
"model": response.model,
"prompt_tokens": response.usage.prompt_tokens,
"completion_tokens": response.usage.completion_tokens,
"total_tokens": response.usage.total_tokens,
}
if __name__ == "__main__":
result = ask_mimo_pro("Qu'est-ce qu'un test unitaire et pourquoi est-il important ?")
print(result["content"])
# Estime le coût en utilisant la tarification MiMo-V2-Pro (niveau ≤256K)
input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
print(f"Coût estimé : ${input_cost + output_cost:.6f}")
Test unitaire pour l'API MiMo-V2-Pro
# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro
@pytest.fixture
def mock_mimo_response():
"""Simule la réponse de l'API MiMo-V2-Pro pour les tests unitaires."""
mock = MagicMock()
mock.choices[0].message.content = (
"Un test unitaire vérifie qu'une seule fonction se comporte correctement de manière isolée."
)
mock.model = "mimo-v2-pro"
mock.usage.prompt_tokens = 20
mock.usage.completion_tokens = 30
mock.usage.total_tokens = 50
return mock
@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
"""Test unitaire : L'API renvoie un contenu de chaîne non vide."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Qu'est-ce qu'un test unitaire ?")
assert isinstance(result["content"], str)
assert len(result["content"]) > 0
@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
"""Test unitaire : confirme que l'ID du modèle mimo-v2-pro est utilisé."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Bonjour")
assert result["model"] == "mimo-v2-pro"
@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
"""Test unitaire : utilisation des jetons présente pour le suivi de la tarification MiMo-V2-Pro."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Bonjour")
assert result["total_tokens"] > 0
assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]
Exécutez les tests unitaires :
pytest test_mimo_client.py -v
Sortie attendue :
test_mimo_client.py::test_returns_content PASSED
test_mimo_client.py::test_correct_model PASSED
test_mimo_client.py::test_token_usage_for_pricing PASSED
3 passed in 0.28s
Simuler l'API dans votre suite de tests unitaires signifie zéro consommation de jetons lors des exécutions CI, ce qui est important lorsque la tarification MiMo-V2-Pro augmente avec chaque requête dans les pipelines automatisés.
Meilleures pratiques pour l'API MiMo-V2-Pro et Omni
Tirer le meilleur parti de comment utiliser l'API en production signifie être délibéré. Voici les pratiques clés :
- 1. Suivez l'utilisation des jetons pour contrôler les coûts de la tarification MiMo-V2-Pro et Omni Enregistrez les
prompt_tokensetcompletion_tokenspar appel. À 1 $/1M d'entrée et 3 $/1M de sortie, les prompts système verbeux s'accumulent rapidement. Gardez-les concis. - 2. Utilisez Apidog avant d'écrire du code Avant de construire une intégration complète, utilisez Apidog pour prototyper des prompts et valider les formes de réponse. C'est le moyen le plus rapide d'apprendre comment utiliser l'API sans consommer de jetons sur du code défectueux. Apidog vous permet également de partager des collections de requêtes avec votre équipe.
- 3. Écrivez des tests unitaires dès le premier jour Ajoutez un test unitaire pour chaque fonction qui appelle l'API. Simulez la réponse avec
unittest.mockpour que votre suite de tests s'exécute instantanément et gratuitement. Utilisez les scripts de test d'Apidog pour la couverture des tests unitaires basés sur l'interface graphique, etpytestpour la couverture au niveau du code. - 4. Choisissez le bon modèle pour la tâche Utilisez MiMo-V2-Pro pour les tâches exigeantes en raisonnement et purement textuelles, en particulier celles impliquant du code, de la planification ou une logique en plusieurs étapes. Utilisez MiMo-V2-Omni lorsque votre pipeline implique des images, de l'audio ou de la vidéo. Ne payez pas la tarification Omni pour des tâches qui ne nécessitent que du texte.
- 5. Restez sous 256K de contexte lorsque cela est possible La tarification MiMo-V2-Pro double au niveau 256K–1M. Pour les pipelines RAG, ne récupérez que les fragments les plus pertinents plutôt que de passer l'ensemble complet des documents.
- 6. Utilisez le SDK OpenAI pour une intégration facile Étant donné que les deux modèles exposent des points de terminaison compatibles OpenAI, vous pouvez les intégrer dans toute base de code existante basée sur OpenAI en modifiant
base_urletmodel. Aucun nouveau SDK n'est requis, ce qui rend l'utilisation de l'API simple pour les équipes déjà sur la pile OpenAI.
Conclusion
La tarification MiMo-V2-Pro à 1 $/1M d'entrée et 3 $/1M de sortie en fait l'un des modèles de raisonnement phares les plus rentables disponibles aujourd'hui. La tarification Omni étend cette valeur aux charges de travail multimodales (texte, image, audio et vidéo) en un seul appel API unifié.
Que vous exploriez comment utiliser l'API pour la première fois avec l'interface graphique d'Apidog, ou que vous construisiez une intégration Python de production soutenue par une suite de tests unitaires, MiMo-V2-Pro et MiMo-V2-Omni s'intègrent parfaitement aux workflows de développement modernes. Commencez par Apidog pour valider visuellement vos requêtes, puis passez au code en toute confiance.
Essayez Apidog gratuitement aucune carte de crédit requise.
FAQ
Qu'est-ce que la tarification MiMo-V2-Pro ? La tarification MiMo-V2-Pro est de 1 $/1M de jetons d'entrée et 3 $/1M de jetons de sortie pour un contexte allant jusqu'à 256K. Pour un contexte entre 256K et 1M de jetons, c'est 2 $/1M d'entrée et 6 $/1M de sortie.
Qu'est-ce que la tarification MiMo-V2-Omni ? La tarification Omni est comparable à MiMo-V2-Pro pour les entrées textuelles. Les entrées multimodales (image, audio, vidéo) sont tokenisées et facturées parallèlement aux jetons de texte. Consultez platform.xiaomimimo.com pour les derniers tarifs Omni Pricing.
Comment utiliser l'API MiMo-V2-Pro ? Utilisez le SDK Python OpenAI avec base_url="https://api.xiaomimimo.com/v1" et model="mimo-v2-pro". L'API est entièrement compatible OpenAI. Utilisez Apidog pour la tester visuellement avant d'écrire du code.
Comment écrire un test unitaire pour l'API MiMo ? Simulez le client API avec unittest.mock en Python et faites des assertions sur la structure de la réponse. Dans Apidog, utilisez l'onglet Tests pour ajouter des assertions de test unitaire basées sur JavaScript après chaque requête.
Quelle est la différence entre MiMo-V2-Pro et MiMo-V2-Omni ? MiMo-V2-Pro est un modèle de raisonnement uniquement textuel avec 1T paramètres et une fenêtre de contexte de 1M de jetons. MiMo-V2-Omni est un modèle multimodal qui gère nativement le texte, l'image, l'audio et la vidéo dans une architecture unifiée.
Comment la tarification MiMo-V2-Pro se compare-t-elle à celle de MiMo-V2-Flash ? MiMo-V2-Flash est beaucoup moins cher à 0,10 $/1M d'entrée et 0,30 $/1M de sortie, mais MiMo-V2-Pro offre un raisonnement significativement plus puissant et une fenêtre de contexte de 1M de jetons. Choisissez en fonction de la complexité de la tâche.
Où puis-je accéder à l'API MiMo ? L'API MiMo est disponible sur platform.xiaomimimo.com. MiMo-V2-Pro et MiMo-V2-Omni sont également accessibles via des fournisseurs tiers comme OpenRouter et Vercel AI Gateway.
