Prix MiMo-V2-Pro & Omni et Comment Utiliser l'API

Herve Kom

Herve Kom

20 March 2026

Prix MiMo-V2-Pro & Omni et Comment Utiliser l'API

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

En bref

La tarification MiMo-V2-Pro commence à 1 $/1M de jetons d'entrée et 3 $/1M de jetons de sortie (contexte ≤256K). La tarification MiMo-V2-Omni couvre les entrées multimodales (texte, image, audio et vidéo) dans un modèle unifié. Les deux sont accessibles via une API compatible OpenAI à l'adresse platform.xiaomimimo.com. Utilisez Apidog pour tester l'API visuellement, ou Python pour les intégrations en production, et toujours accompagner votre intégration d'un test unitaire.

Introduction

Xiaomi a lancé trois nouveaux modèles d'IA le 18 mars 2026  et la communauté des développeurs l'a rapidement remarqué. MiMo-V2-Pro et MiMo-V2-Omni sont les deux versions phares : l'une conçue pour le raisonnement agentique profond, l'autre pour une véritable compréhension multimodale. Si vous essayez de comprendre la tarification MiMo-V2-Pro, la tarification Omni, ou simplement comment utiliser l'API dans votre pile technologique, ce guide vous explique tout. Nous allons détailler les niveaux de tarification complets, présenter les capacités de l'API et vous montrer deux chemins d'intégration : un flux de travail basé sur une interface graphique avec Apidog et une approche Python avec un test unitaire pour valider votre configuration.

💡
Avant d'écrire du code pour l'API MiMo-V2-Pro ou Omni, téléchargez Apidog gratuitement. Vous pouvez tester visuellement les requêtes, valider les réponses, ajouter des assertions de test unitaire et déboguer l'utilisation des jetons instantanément, tout cela sans consommer de jetons ni écrire une seule ligne de Python.
bouton

Détail de la tarification MiMo-V2-Pro et MiMo-V2-Omni

Comprendre la tarification MiMo-V2-Pro et la tarification Omni est la première étape avant de commencer à appeler l'API. Les deux modèles utilisent une tarification échelonnée basée sur les jetons, et la structure de coûts est suffisamment compétitive pour qu'ils méritent une considération sérieuse pour les charges de travail en production.

Tarification MiMo-V2-Pro : Échelonnée par longueur de contexte

La tarification MiMo-V2-Pro est divisée en deux niveaux en fonction de la quantité de contexte que vous utilisez par requête :

Longueur du contexteEntrée (par 1M de jetons)Sortie (par 1M de jetons)
≤ 256K jetons$1.00$3.00
256K – 1M jetons$2.00$6.00

La structure échelonnée reflète la fenêtre de contexte de 1 million de jetons du modèle, l'une des plus grandes disponibles. Pour la plupart des charges de travail qui restent sous 256K jetons, la tarification MiMo-V2-Pro est extrêmement compétitive : la sortie à 3 $/1M ne représente qu'un huitième du prix de Claude Opus. Pour les tâches à long terme comme le traitement de bases de code complètes ou les séquences de planification étendues, le niveau 256K-1M s'applique.

Tarification MiMo-V2-Omni

La tarification Omni suit une structure similaire à celle de MiMo-V2-Pro, avec des considérations supplémentaires pour les entrées multimodales. MiMo-V2-Omni traite nativement le texte, l'image, l'audio et la vidéo dans une architecture unifiée, non pas comme des modules séparés ajoutés. Les jetons d'image et d'audio sont comptés parallèlement aux jetons de texte, de sorte que la tarification Omni évolue avec la richesse de vos entrées.

Pour les tâches purement textuelles, la tarification Omni est comparable à MiMo-V2-Pro. Pour les charges de travail multimodales, attendez-vous à des nombres de jetons plus élevés par requête en raison de la tokénisation des images et de l'audio.

Comparaison des tarifs de la famille MiMo-V2

Pour mettre en contexte la tarification MiMo-V2-Pro et la tarification Omni :

ModèleEntrée (par 1M de jetons)Sortie (par 1M de jetons)Fenêtre de contexteModalités
MiMo-V2-Pro$1.00 / $2.00*$3.00 / $6.00*1M de jetonsTexte
MiMo-V2-Omni~$1.00*~$3.00*256K jetonsTexte, Image, Audio, Vidéo
MiMo-V2-Flash$0.10$0.30256K jetonsTexte

Échelonné ou approximatif : vérifiez les tarifs actuels sur platform.xiaomimimo.com

MiMo-V2-Flash est l'option la moins chère pour les tâches purement textuelles. MiMo-V2-Pro est le bon choix lorsque vous avez besoin d'un raisonnement approfondi et d'un long contexte. MiMo-V2-Omni est le choix pour les pipelines multimodaux où la tarification Omni couvre tous les types d'entrée en un seul appel API.

Capacités de l'API MiMo-V2-Pro et Omni

Avant d'apprendre comment utiliser l'API, il est utile de savoir ce que chaque modèle fait réellement.

MiMo-V2-Pro est le modèle de raisonnement phare de Xiaomi, conçu pour « l'ère des agents ». Spécifications clés :

MiMo-V2-Omni est le modèle de fondation multimodal de Xiaomi :

Les deux modèles sont disponibles via la plateforme API officielle à l'adresse platform.xiaomimimo.com, avec des points de terminaison compatibles OpenAI, ce qui signifie que vous pouvez les intégrer dans toute intégration SDK OpenAI existante avec des changements minimaux.

Comment utiliser l'API avec Apidog

Apidog est le moyen le plus rapide d'explorer comment utiliser l'API sans écrire de code au préalable. Il vous offre une interface graphique complète pour envoyer des requêtes, inspecter les réponses et exécuter des assertions de test unitaire, le tout au même endroit. Téléchargez Apidog gratuitement avant de commencer.

bouton

Configuration des requêtes API MiMo-V2-Pro et Omni dans Apidog

Utiliser l'API dans Apidog prend moins de deux minutes :

  1. Ouvrez Apidog et créez un nouveau projet, nommez-le par exemple Tests API MiMo-V2.
  2. Créez une nouvelle requête HTTP :

3.  Ajoutez des en-têtes dans l'onglet En-têtes :

CléValeur
AuthorizationBearer YOUR_MIMO_API_KEY
Content-Typeapplication/json

4.  Définissez le corps de la requête (Corps → JSON) pour MiMo-V2-Pro :

{
  "model": "mimo-v2-pro",
  "messages": [
    {
      "role": "user",
      "content": "Écrivez une fonction Python qui vérifie si un nombre est premier, et expliquez comment vous la testeriez unitairement."
    }
  ],
  "temperature": 0.6,
  "max_tokens": 512
}

Pour MiMo-V2-Omni, changez le modèle et ajoutez une entrée image :

{
  "model": "mimo-v2-omni",
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "Décrivez ce que vous voyez sur cette image." },
        { "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
      ]
    }
  ],
  "max_tokens": 300
}

5. Cliquez sur Envoyer. Apidog affiche la réponse complète avec l'utilisation des jetons, vous permettant de suivre les coûts de la tarification MiMo-V2-Pro et de la tarification Omni par requête en temps réel.

Écriture de tests unitaires pour l'API MiMo-V2-Pro et Omni dans Apidog

Apidog dispose d'un moteur de script de test intégré. Après avoir envoyé une requête, ouvrez l'onglet Tests et ajoutez ces assertions de test unitaire :

// Test unitaire 1 : Le statut HTTP est 200
pm.test("Status code is 200", function () {
  pm.response.to.have.status(200);
});

// Test unitaire 2 : Modèle correct retourné (validation de la tarification MiMo-V2-Pro)
pm.test("Model ID is correct", function () {
  const json = pm.response.json();
  pm.expect(json.model).to.include("mimo-v2");
});

// Test unitaire 3 : La réponse contient un message de l'assistant
pm.test("Assistant message is present", function () {
  const json = pm.response.json();
  pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});

// Test unitaire 4 : Utilisation des jetons signalée (pour le suivi de la tarification Omni et Pro)
pm.test("Token usage is present", function () {
  const json = pm.response.json();
  pm.expect(json.usage.total_tokens).to.be.above(0);
});

Ces quatre vérifications de tests unitaires couvrent l'essentiel : le statut, l'identité du modèle, le contenu de la réponse et l'utilisation des jetons. Apidog les exécute automatiquement à chaque envoi, afin que vous détectiez les régressions immédiatement à mesure que vous itérez sur les prompts. Vous pouvez également enregistrer la collection et l'exécuter en CI à l'aide du runner CLI d'Apidog.

Comment utiliser l'API avec Python

Pour une utilisation en production, voici comment utiliser l'API en Python avec une suite complète de tests unitaires utilisant pytest.

Installation

pip install openai pytest

L'API MiMo est compatible OpenAI, donc le SDK openai fonctionne directement.

Appel API de base (MiMo-V2-Pro)

# mimo_client.py
from openai import OpenAI

# Dirige le client OpenAI vers l'API MiMo
client = OpenAI(
    api_key="YOUR_MIMO_API_KEY",
    base_url="https://api.xiaomimimo.com/v1"
)

def ask_mimo_pro(prompt: str) -> dict:
    """Appelle l'API MiMo-V2-Pro et renvoie une réponse structurée."""
    response = client.chat.completions.create(
        model="mimo-v2-pro",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.6,
        max_tokens": 512
    )
    return {
        "content": response.choices[0].message.content,
        "model": response.model,
        "prompt_tokens": response.usage.prompt_tokens,
        "completion_tokens": response.usage.completion_tokens,
        "total_tokens": response.usage.total_tokens,
    }


if __name__ == "__main__":
    result = ask_mimo_pro("Qu'est-ce qu'un test unitaire et pourquoi est-il important ?")
    print(result["content"])

    # Estime le coût en utilisant la tarification MiMo-V2-Pro (niveau ≤256K)
    input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
    output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
    print(f"Coût estimé : ${input_cost + output_cost:.6f}")

Test unitaire pour l'API MiMo-V2-Pro

# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro


@pytest.fixture
def mock_mimo_response():
    """Simule la réponse de l'API MiMo-V2-Pro pour les tests unitaires."""
    mock = MagicMock()
    mock.choices[0].message.content = (
        "Un test unitaire vérifie qu'une seule fonction se comporte correctement de manière isolée."
    )
    mock.model = "mimo-v2-pro"
    mock.usage.prompt_tokens = 20
    mock.usage.completion_tokens = 30
    mock.usage.total_tokens = 50
    return mock


@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
    """Test unitaire : L'API renvoie un contenu de chaîne non vide."""
    mock_create.return_value = mock_mimo_response
    result = ask_mimo_pro("Qu'est-ce qu'un test unitaire ?")
    assert isinstance(result["content"], str)
    assert len(result["content"]) > 0


@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
    """Test unitaire : confirme que l'ID du modèle mimo-v2-pro est utilisé."""
    mock_create.return_value = mock_mimo_response
    result = ask_mimo_pro("Bonjour")
    assert result["model"] == "mimo-v2-pro"


@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
    """Test unitaire : utilisation des jetons présente pour le suivi de la tarification MiMo-V2-Pro."""
    mock_create.return_value = mock_mimo_response
    result = ask_mimo_pro("Bonjour")
    assert result["total_tokens"] > 0
    assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]

Exécutez les tests unitaires :

pytest test_mimo_client.py -v

Sortie attendue :

test_mimo_client.py::test_returns_content        PASSED
test_mimo_client.py::test_correct_model          PASSED
test_mimo_client.py::test_token_usage_for_pricing PASSED

3 passed in 0.28s

Simuler l'API dans votre suite de tests unitaires signifie zéro consommation de jetons lors des exécutions CI, ce qui est important lorsque la tarification MiMo-V2-Pro augmente avec chaque requête dans les pipelines automatisés.

Meilleures pratiques pour l'API MiMo-V2-Pro et Omni

Tirer le meilleur parti de comment utiliser l'API en production signifie être délibéré. Voici les pratiques clés :

Conclusion

La tarification MiMo-V2-Pro à 1 $/1M d'entrée et 3 $/1M de sortie en fait l'un des modèles de raisonnement phares les plus rentables disponibles aujourd'hui. La tarification Omni étend cette valeur aux charges de travail multimodales (texte, image, audio et vidéo) en un seul appel API unifié.

Que vous exploriez comment utiliser l'API pour la première fois avec l'interface graphique d'Apidog, ou que vous construisiez une intégration Python de production soutenue par une suite de tests unitaires, MiMo-V2-Pro et MiMo-V2-Omni s'intègrent parfaitement aux workflows de développement modernes. Commencez par Apidog pour valider visuellement vos requêtes, puis passez au code en toute confiance.

Essayez Apidog gratuitement aucune carte de crédit requise.

bouton

FAQ

Qu'est-ce que la tarification MiMo-V2-Pro ? La tarification MiMo-V2-Pro est de 1 $/1M de jetons d'entrée et 3 $/1M de jetons de sortie pour un contexte allant jusqu'à 256K. Pour un contexte entre 256K et 1M de jetons, c'est 2 $/1M d'entrée et 6 $/1M de sortie.

Qu'est-ce que la tarification MiMo-V2-Omni ? La tarification Omni est comparable à MiMo-V2-Pro pour les entrées textuelles. Les entrées multimodales (image, audio, vidéo) sont tokenisées et facturées parallèlement aux jetons de texte. Consultez platform.xiaomimimo.com pour les derniers tarifs Omni Pricing.

Comment utiliser l'API MiMo-V2-Pro ? Utilisez le SDK Python OpenAI avec base_url="https://api.xiaomimimo.com/v1" et model="mimo-v2-pro". L'API est entièrement compatible OpenAI. Utilisez Apidog pour la tester visuellement avant d'écrire du code.

Comment écrire un test unitaire pour l'API MiMo ? Simulez le client API avec unittest.mock en Python et faites des assertions sur la structure de la réponse. Dans Apidog, utilisez l'onglet Tests pour ajouter des assertions de test unitaire basées sur JavaScript après chaque requête.

Quelle est la différence entre MiMo-V2-Pro et MiMo-V2-Omni ? MiMo-V2-Pro est un modèle de raisonnement uniquement textuel avec 1T paramètres et une fenêtre de contexte de 1M de jetons. MiMo-V2-Omni est un modèle multimodal qui gère nativement le texte, l'image, l'audio et la vidéo dans une architecture unifiée.

Comment la tarification MiMo-V2-Pro se compare-t-elle à celle de MiMo-V2-Flash ? MiMo-V2-Flash est beaucoup moins cher à 0,10 $/1M d'entrée et 0,30 $/1M de sortie, mais MiMo-V2-Pro offre un raisonnement significativement plus puissant et une fenêtre de contexte de 1M de jetons. Choisissez en fonction de la complexité de la tâche.

Où puis-je accéder à l'API MiMo ? L'API MiMo est disponible sur platform.xiaomimimo.com. MiMo-V2-Pro et MiMo-V2-Omni sont également accessibles via des fournisseurs tiers comme OpenRouter et Vercel AI Gateway.

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API