Kurz gesagt
Die MiMo-V2-Pro Preise beginnen bei $1/1M Eingabetoken und $3/1M Ausgabetoken (≤256K Kontext). Die MiMo-V2-Omni Preise decken multimodale Eingaben wie Text, Bild, Audio und Video in einem vereinheitlichten Modell ab. Beide sind über eine OpenAI-kompatible API unter platform.xiaomimimo.com zugänglich. Verwenden Sie Apidog, um die API visuell zu testen, oder Python für Produktionsintegrationen und sichern Sie Ihre Integration immer mit einem Unit-Test ab.
Einführung
Xiaomi hat am 18. März 2026 drei neue KI-Modelle vorgestellt, und die Entwicklergemeinschaft hat dies schnell bemerkt. MiMo-V2-Pro und MiMo-V2-Omni sind die beiden Flaggschiff-Veröffentlichungen: eines für tiefgehende agentische Schlussfolgerungen, das andere für echtes multimodales Verständnis entwickelt. Wenn Sie die MiMo-V2-Pro Preise, die Omni-Preise oder einfach nur erfahren möchten, wie Sie die API verwenden in Ihrem Stack, ist dieser Leitfaden genau das Richtige für Sie. Wir werden die vollständigen Preisstufen aufschlüsseln, die API-Funktionen durchgehen und Ihnen zwei Integrationspfade aufzeigen – einen GUI-basierten Workflow mit Apidog und einen Python-Ansatz mit einem Unit-Test zur Validierung Ihrer Einrichtung.
MiMo-V2-Pro Preise & MiMo-V2-Omni Preisaufschlüsselung
Das Verständnis der MiMo-V2-Pro Preise und Omni-Preise ist der erste Schritt, bevor Sie die API aufrufen. Beide Modelle verwenden gestaffelte, Token-basierte Preise, und die Kostenstruktur ist wettbewerbsfähig genug, um sie für Produktions-Workloads ernsthaft in Betracht zu ziehen.
MiMo-V2-Pro Preise: Gestaffelt nach Kontextlänge
Die MiMo-V2-Pro Preise sind in zwei Stufen unterteilt, basierend darauf, wie viel Kontext Sie pro Anfrage verwenden:
| Kontextlänge | Eingabe (pro 1M Token) | Ausgabe (pro 1M Token) |
|---|---|---|
| ≤ 256K Token | $1.00 | $3.00 |
| 256K – 1M Token | $2.00 | $6.00 |
Die gestaffelte Struktur spiegelt das 1-Millionen-Token-Kontextfenster des Modells wider – eines der größten verfügbaren. Für die meisten Workloads, die unter 256K Token bleiben, sind die MiMo-V2-Pro Preise extrem wettbewerbsfähig: Die Ausgabe zu $3/1M beträgt nur ein Achtel des Preises von Claude Opus. Für Langzeitaufgaben wie die Verarbeitung vollständiger Codebasen oder erweiterter Planungssequenzen gilt die 256K–1M-Stufe.
MiMo-V2-Omni Preise
Die Omni-Preise folgen einer ähnlichen Struktur wie MiMo-V2-Pro, mit zusätzlichen Überlegungen für multimodale Eingaben. MiMo-V2-Omni verarbeitet Text, Bild, Audio und Video nativ in einer vereinheitlichten Architektur – nicht als separate, aufgesetzte Module. Bild- und Audio-Token werden zusammen mit Text-Token gezählt, sodass die Omni-Preise mit der Reichhaltigkeit Ihrer Eingaben skalieren.
Für reine Textaufgaben sind die Omni-Preise vergleichbar mit MiMo-V2-Pro. Bei multimodalen Workloads ist aufgrund der Bild- und Audio-Tokenisierung mit höheren Token-Anzahlen pro Anfrage zu rechnen.
MiMo-V2 Familien Preisvergleich
Um die MiMo-V2-Pro Preise und Omni-Preise in den Kontext zu setzen:
| Modell | Eingabe (pro 1M Token) | Ausgabe (pro 1M Token) | Kontextfenster | Modalitäten |
|---|---|---|---|---|
| MiMo-V2-Pro | $1.00 / $2.00* | $3.00 / $6.00* | 1M Token | Text |
| MiMo-V2-Omni | ~$1.00* | ~$3.00* | 256K Token | Text, Bild, Audio, Video |
| MiMo-V2-Flash | $0.10 | $0.30 | 256K Token | Text |
Gestaffelt oder annähernd – überprüfen Sie die aktuellen Tarife auf platform.xiaomimimo.com
MiMo-V2-Flash ist die günstigste Option für reine Textaufgaben. MiMo-V2-Pro ist die richtige Wahl, wenn Sie tiefgehende Schlussfolgerungen und einen langen Kontext benötigen. MiMo-V2-Omni ist die Wahl für multimodale Pipelines, bei denen die Omni-Preise alle Eingabetypen in einem API-Aufruf abdecken.
MiMo-V2-Pro & Omni API-Funktionen
Bevor Sie lernen, wie Sie die API verwenden, ist es hilfreich zu wissen, was jedes Modell tatsächlich leistet.
MiMo-V2-Pro ist Xiaomis Flaggschiff-Modell für Schlussfolgerungen, das für die "Agenten-Ära" entwickelt wurde. Hauptmerkmale:
- 1 Billion Gesamtparameter, 42 Milliarden aktiv (3x größer als MiMo-V2-Flash)
- 1 Million Token-Kontextfenster verarbeitet vollständige Codebasen und lange Planungssequenzen
- Multi-Token Prediction (MTP) für schnellere Inferenz
- Entwickelt für autonome mehrstufige Schlussfolgerungen, Werkzeugausführung und Softwareentwicklungsprojekte
- Rangiert #1 unter 160 Modellen in seiner Preisklasse im Artificial Analysis Intelligence Index (Punktzahl: 49 gegenüber einem Median von 13)
- Starke Leistung bei SWE-Bench und Coding-Benchmarks
MiMo-V2-Omni ist Xiaomis multimodales Grundlagenmodell:
- Verarbeitet nativ Text, Bild, Audio und Video in einer vereinheitlichten Architektur
- Dedizierte Bild- und Audio-Encoder auf Architekturebene integriert
- Geeignet für Dokumentenverständnis, Audio-Transkription, Videoanalyse und kreuzmodale Schlussfolgerungen
Beide Modelle sind über die offizielle API-Plattform unter platform.xiaomimimo.com verfügbar, mit OpenAI-kompatiblen Endpunkten, was bedeutet, dass Sie sie mit minimalen Änderungen in jede bestehende OpenAI SDK-Integration austauschen können.
So verwenden Sie die API mit Apidog
Apidog ist der schnellste Weg, um zu erkunden, wie Sie die API verwenden, ohne zuerst Code zu schreiben. Es bietet Ihnen eine vollständige GUI zum Senden von Anfragen, Überprüfen von Antworten und Ausführen von Unit-Test-Assertions – alles an einem Ort. Laden Sie Apidog kostenlos herunter, bevor Sie beginnen.
Einrichten von MiMo-V2-Pro & Omni API-Anfragen in Apidog
Die Verwendung der API in Apidog dauert weniger als zwei Minuten:
- Öffnen Sie Apidog und erstellen Sie ein neues Projekt – nennen Sie es zum Beispiel
MiMo-V2 API Tests. - Erstellen Sie eine neue HTTP-Anfrage:
- Methode:
POST - URL:
https://api.xiaomimimo.com/v1/chat/completions
3. Fügen Sie Header auf der Registerkarte "Headers" hinzu:
| Schlüssel | Wert |
|---|---|
Authorization | Bearer YOUR_MIMO_API_KEY |
Content-Type | application/json |
4. Legen Sie den Anfragetext (Body → JSON) für MiMo-V2-Pro fest:
{
"model": "mimo-v2-pro",
"messages": [
{
"role": "user",
"content": "Write a Python function that checks if a number is prime, and explain how you would unit test it."
}
],
"temperature": 0.6,
"max_tokens": 512
}
Für MiMo-V2-Omni ändern Sie das Modell und fügen Sie eine Bildeingabe hinzu:
{
"model": "mimo-v2-omni",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Describe what you see in this image." },
{ "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
]
}
],
"max_tokens": 300
}5. Klicken Sie auf Senden. Apidog zeigt die vollständige Antwort mit Token-Nutzung an, sodass Sie die MiMo-V2-Pro Preise und Omni-Preise pro Anfrage in Echtzeit verfolgen können.
Schreiben von Unit-Tests für die MiMo-V2-Pro & Omni API in Apidog
Apidog verfügt über eine integrierte Testskript-Engine. Nach dem Senden einer Anfrage öffnen Sie die Registerkarte Tests und fügen diese Unit-Test-Assertions hinzu:
// Unit-Test 1: HTTP-Status ist 200
pm.test("Status code is 200", function () {
pm.response.to.have.status(200);
});
// Unit-Test 2: Korrektes Modell zurückgegeben (Validierung der MiMo-V2-Pro Preise)
pm.test("Model ID is correct", function () {
const json = pm.response.json();
pm.expect(json.model).to.include("mimo-v2");
});
// Unit-Test 3: Antwort enthält Assistenten-Nachricht
pm.test("Assistant message is present", function () {
const json = pm.response.json();
pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});
// Unit-Test 4: Token-Nutzung gemeldet (zur Verfolgung von Omni-Preisen und Pro-Preisen)
pm.test("Token usage is present", function () {
const json = pm.response.json();
pm.expect(json.usage.total_tokens).to.be.above(0);
});
Diese vier Unit-Test-Prüfungen decken das Wesentliche ab: Status, Modellidentität, Antwortinhalt und Token-Nutzung. Apidog führt sie bei jedem Senden automatisch aus, sodass Sie Regressionen sofort erkennen, wenn Sie Ihre Prompts iterieren. Sie können die Sammlung auch speichern und in CI mithilfe des CLI-Runners von Apidog ausführen.
So verwenden Sie die API mit Python
Für den Produktionseinsatz erfahren Sie hier, wie Sie die API verwenden in Python mit einer vollständigen Unit-Test-Suite mithilfe von pytest.
Installation
pip install openai pytest
Die MiMo API ist OpenAI-kompatibel, daher funktioniert das openai SDK direkt.
Grundlegender API-Aufruf (MiMo-V2-Pro)
# mimo_client.py
from openai import OpenAI
# Richten Sie den OpenAI-Client auf die MiMo API aus
client = OpenAI(
api_key="YOUR_MIMO_API_KEY",
base_url="https://api.xiaomimimo.com/v1"
)
def ask_mimo_pro(prompt: str) -> dict:
"""Ruft die MiMo-V2-Pro API auf und gibt eine strukturierte Antwort zurück."""
response = client.chat.completions.create(
model="mimo-v2-pro",
messages=[{"role": "user", "content": prompt}],
temperature=0.6,
max_tokens=512
)
return {
"content": response.choices[0].message.content,
"model": response.model,
"prompt_tokens": response.usage.prompt_tokens,
"completion_tokens": response.usage.completion_tokens,
"total_tokens": response.usage.total_tokens,
}
if __name__ == "__main__":
result = ask_mimo_pro("What is a unit test and why does it matter?")
print(result["content"])
# Kosten schätzen mit MiMo-V2-Pro Preisen (≤256K Stufe)
input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
print(f"Estimated cost: ${input_cost + output_cost:.6f}")
Unit-Test für die MiMo-V2-Pro API
# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro
@pytest.fixture
def mock_mimo_response():
"""Simulierte MiMo-V2-Pro API-Antwort für Unit-Tests."""
mock = MagicMock()
mock.choices[0].message.content = (
"A unit test verifies a single function behaves correctly in isolation."
)
mock.model = "mimo-v2-pro"
mock.usage.prompt_tokens = 20
mock.usage.completion_tokens = 30
mock.usage.total_tokens = 50
return mock
@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
"""Unit-Test: API gibt nicht-leeren String-Inhalt zurück."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("What is a unit test?")
assert isinstance(result["content"], str)
assert len(result["content"]) > 0
@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
"""Unit-Test: Bestätigt, dass die Modell-ID mimo-v2-pro verwendet wird."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Hello")
assert result["model"] == "mimo-v2-pro"
@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
"""Unit-Test: Token-Nutzung vorhanden zur Verfolgung der MiMo-V2-Pro Preise."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Hello")
assert result["total_tokens"] > 0
assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]
Führen Sie die Unit-Tests aus:
pytest test_mimo_client.py -v
Erwartete Ausgabe:
test_mimo_client.py::test_returns_content BESTANDEN
test_mimo_client.py::test_correct_model BESTANDEN
test_mimo_client.py::test_token_usage_for_pricing BESTANDEN
3 bestanden in 0.28s
Das Mocking der API in Ihrer Unit-Test-Suite bedeutet keinen Token-Verbrauch während CI-Läufen, was wichtig ist, wenn die MiMo-V2-Pro Preise mit jeder Anfrage in automatisierten Pipelines skalieren.
MiMo-V2-Pro & Omni API Best Practices
Das Beste aus der Verwendung der API in der Produktion herauszuholen, bedeutet, überlegt vorzugehen. Hier sind die wichtigsten Praktiken:
1. Verfolgen Sie die Token-Nutzung, um die Kosten für MiMo-V2-Pro Preise und Omni-Preise zu kontrollieren Protokollieren Sie prompt_tokens und completion_tokens pro Aufruf. Bei $1/1M Eingabe und $3/1M Ausgabe summieren sich ausführliche System-Prompts schnell. Halten Sie sie prägnant.
2. Verwenden Sie Apidog, bevor Sie Code schreiben Bevor Sie eine vollständige Integration erstellen, verwenden Sie Apidog, um Prompts zu prototypisieren und Antwortstrukturen zu validieren. Dies ist der schnellste Weg, um zu lernen, wie man die API verwendet, ohne Token für fehlerhaften Code zu verschwenden. Apidog ermöglicht es Ihnen auch, Anfragesammlungen mit Ihrem Team zu teilen.
3. Schreiben Sie Unit-Tests vom ersten Tag an Fügen Sie einen Unit-Test für jede Funktion hinzu, die die API aufruft. Mocken Sie die Antwort mit unittest.mock, damit Ihre Test-Suite sofort und kostenlos ausgeführt wird. Verwenden Sie die Testskripte von Apidog für GUI-basierte Unit-Test-Abdeckung und pytest für Code-Level-Abdeckung.
4. Wählen Sie das richtige Modell für die Aufgabe Verwenden Sie MiMo-V2-Pro für rechenintensive, textbasierte Aufgaben, insbesondere alles, was Code, Planung oder mehrstufige Logik beinhaltet. Verwenden Sie MiMo-V2-Omni, wenn Ihre Pipeline Bilder, Audio oder Video beinhaltet. Zahlen Sie keine Omni-Preise für Aufgaben, die nur Text benötigen.
5. Bleiben Sie möglichst unter 256K Kontext Die MiMo-V2-Pro Preise verdoppeln sich in der 256K–1M-Stufe. Für RAG-Pipelines rufen Sie nur die relevantesten Abschnitte ab, anstatt das gesamte Dokumentenset zu übergeben.
6. Verwenden Sie das OpenAI SDK für eine einfache Integration Da beide Modelle OpenAI-kompatible Endpunkte bereitstellen, können Sie sie durch Ändern von base_url und model in jede bestehende OpenAI-basierte Codebasis integrieren. Kein neues SDK erforderlich, was die Verwendung der API für Teams, die bereits den OpenAI-Stack verwenden, unkompliziert macht.
Fazit
Die MiMo-V2-Pro Preise von $1/1M Eingabe und $3/1M Ausgabe machen es zu einem der kostengünstigsten Flaggschiff-Modelle für Schlussfolgerungen, die heute verfügbar sind. Die Omni-Preise erweitern diesen Wert auf multimodale Workloads – Text, Bild, Audio und Video – in einem einzigen vereinheitlichten API-Aufruf.
Ob Sie zum ersten Mal mit der GUI von Apidog erkunden, wie Sie die API verwenden, oder eine Python-Produktionsintegration mit einer Unit-Test-Suite erstellen, sowohl MiMo-V2-Pro als auch MiMo-V2-Omni passen nahtlos in moderne Entwickler-Workflows. Beginnen Sie mit Apidog, um Ihre Anfragen visuell zu validieren, und gehen Sie dann selbstbewusst zum Code über.
Apidog kostenlos testen – keine Kreditkarte erforderlich.
FAQ
Was sind die MiMo-V2-Pro Preise? Die MiMo-V2-Pro Preise betragen $1/1M Eingabetoken und $3/1M Ausgabetoken für Kontext bis zu 256K. Für Kontext zwischen 256K und 1M Token sind es $2/1M Eingabe und $6/1M Ausgabe.
Was sind die MiMo-V2-Omni Preise? Die Omni-Preise sind vergleichbar mit MiMo-V2-Pro für Texteingaben. Multimodale Eingaben (Bild, Audio, Video) werden tokenisiert und zusammen mit Text-Tokens abgerechnet. Überprüfen Sie platform.xiaomimimo.com für die aktuellsten Omni-Preise.
Wie verwende ich die MiMo-V2-Pro API? Verwenden Sie das OpenAI Python SDK mit base_url="https://api.xiaomimimo.com/v1" und model="mimo-v2-pro". Die API ist vollständig OpenAI-kompatibel. Verwenden Sie Apidog, um sie visuell zu testen, bevor Sie Code schreiben.
Wie schreibe ich einen Unit-Test für die MiMo API? Simulieren Sie den API-Client mit unittest.mock in Python und überprüfen Sie die Antwortstruktur. In Apidog verwenden Sie die Registerkarte "Tests", um JavaScript-basierte Unit-Test-Assertions nach jeder Anfrage hinzuzufügen.
Was ist der Unterschied zwischen MiMo-V2-Pro und MiMo-V2-Omni? MiMo-V2-Pro ist ein textbasiertes Schlussfolgerungsmodell mit 1T Parametern und einem 1M Token-Kontextfenster. MiMo-V2-Omni ist ein multimodales Modell, das Text, Bild, Audio und Video nativ in einer vereinheitlichten Architektur verarbeitet.
Wie vergleichen sich die MiMo-V2-Pro Preise mit MiMo-V2-Flash? MiMo-V2-Flash ist mit $0.10/1M Eingabe und $0.30/1M Ausgabe viel günstiger, aber MiMo-V2-Pro bietet deutlich stärkere Schlussfolgerungen und ein 1M Token-Kontextfenster. Wählen Sie basierend auf der Aufgabenkomplexität.
Wo kann ich auf die MiMo API zugreifen? Die MiMo API ist unter platform.xiaomimimo.com verfügbar. Sowohl MiMo-V2-Pro als auch MiMo-V2-Omni sind auch über Drittanbieter wie OpenRouter und Vercel AI Gateway zugänglich.
