Resumo
O Preço do MiMo-V2-Pro começa em $1/1M tokens de entrada e $3/1M tokens de saída (contexto ≤256K). O Preço do MiMo-V2-Omni abrange entradas multimodais de texto, imagem, áudio e vídeo em um modelo unificado. Ambos são acessíveis via uma API compatível com OpenAI em platform.xiaomimimo.com. Use o Apidog para testar a API visualmente, ou Python para integrações de produção e sempre apoie sua integração com um teste unitário.
Introdução
A Xiaomi lançou três novos modelos de IA em 18 de março de 2026 e a comunidade de desenvolvedores percebeu rapidamente. O MiMo-V2-Pro e o MiMo-V2-Omni são os dois lançamentos principais: um construído para raciocínio agentivo profundo, o outro para verdadeira compreensão multimodal. Se você está tentando descobrir o Preço do MiMo-V2-Pro, o Preço do Omni, ou simplesmente como usar a API em sua pilha, este guia irá ajudá-lo. Vamos detalhar os níveis de preços completos, percorrer as capacidades da API e mostrar-lhe dois caminhos de integração um fluxo de trabalho baseado em GUI com o Apidog e uma abordagem Python com um teste unitário para validar sua configuração.
Preços do MiMo-V2-Pro e Análise de Preços do MiMo-V2-Omni
Compreender o Preço do MiMo-V2-Pro e o Preço do Omni é o primeiro passo antes de começar a chamar a API. Ambos os modelos usam preços escalonados baseados em tokens, e a estrutura de custos é competitiva o suficiente para torná-los dignos de séria consideração para cargas de trabalho de produção.
Preços do MiMo-V2-Pro: Escalonados por Duração do Contexto
O Preço do MiMo-V2-Pro é dividido em dois níveis com base na quantidade de contexto que você usa por solicitação:
| Duração do Contexto | Entrada (por 1M tokens) | Saída (por 1M tokens) |
|---|---|---|
| ≤ 256K tokens | $1.00 | $3.00 |
| 256K – 1M tokens | $2.00 | $6.00 |
A estrutura em níveis reflete a janela de contexto de 1 milhão de tokens do modelo uma das maiores disponíveis. Para a maioria das cargas de trabalho que permanecem abaixo de 256K tokens, o Preço do MiMo-V2-Pro é extremamente competitivo: a saída a $3/1M é apenas 1/8 do preço do Claude Opus. Para tarefas de longo prazo, como processamento de bases de código completas ou sequências de planejamento estendidas, o nível de 256K–1M se aplica.
Preços do MiMo-V2-Omni
O Preço do Omni segue uma estrutura semelhante ao MiMo-V2-Pro, com considerações adicionais para entradas multimodais. O MiMo-V2-Omni processa nativamente texto, imagem, áudio e vídeo em uma arquitetura unificada, e não como módulos separados. Tokens de imagem e áudio são contados junto com os tokens de texto, então o Preço do Omni escala com a riqueza de suas entradas.
Para tarefas puramente textuais, o Preço do Omni é comparável ao MiMo-V2-Pro. Para cargas de trabalho multimodais, espere contagens de tokens mais altas por solicitação devido à tokenização de imagem e áudio.
Comparativo de Preços da Família MiMo-V2
Para colocar o Preço do MiMo-V2-Pro e o Preço do Omni em contexto:
| Modelo | Entrada (por 1M tokens) | Saída (por 1M tokens) | Janela de Contexto | Modalidades |
|---|---|---|---|---|
| MiMo-V2-Pro | $1.00 / $2.00* | $3.00 / $6.00* | 1M tokens | Texto |
| MiMo-V2-Omni | ~$1.00* | ~$3.00* | 256K tokens | Texto, Imagem, Áudio, Vídeo |
| MiMo-V2-Flash | $0.10 | $0.30 | 256K tokens | Texto |
*Escalonado ou aproximado — verifique as taxas atuais em platform.xiaomimimo.com
O MiMo-V2-Flash é a opção mais barata para tarefas puramente textuais. O MiMo-V2-Pro é a escolha certa quando você precisa de raciocínio profundo e contexto longo. O MiMo-V2-Omni é a escolha para pipelines multimodais onde o Preço do Omni abrange todos os tipos de entrada em uma única chamada de API.
Capacidades da API MiMo-V2-Pro e Omni
Antes de aprender como usar a API, é útil saber o que cada modelo realmente faz.
O MiMo-V2-Pro é o modelo de raciocínio principal da Xiaomi, construído para a "era dos agentes". Especificações principais:
- 1 trilhão de parâmetros totais, 42 bilhões ativos (3x maior que o MiMo-V2-Flash)
- Janela de contexto de 1 milhão de tokens lida com bases de código completas e longas sequências de planejamento
- Previsão Multi-Token (MTP) para inferência mais rápida
- Projetado para raciocínio autônomo multi-passo, execução de ferramentas e tarefas de engenharia de software
- Classificado como #1 entre 160 modelos em sua faixa de preço no Artificial Analysis Intelligence Index (pontuação: 49 vs. mediana de 13)
- Desempenho forte em SWE-Bench e benchmarks de codificação
O MiMo-V2-Omni é o modelo fundacional multimodal da Xiaomi:
- Processa nativamente texto, imagem, áudio e vídeo em uma arquitetura unificada
- Codificadores de imagem e áudio dedicados integrados no nível da arquitetura
- Adequado para compreensão de documentos, transcrição de áudio, análise de vídeo e raciocínio entre modalidades
Ambos os modelos estão disponíveis através da plataforma oficial da API em platform.xiaomimimo.com, com endpoints compatíveis com OpenAI, o que significa que você pode trocá-los em qualquer integração SDK OpenAI existente com mudanças mínimas.
Como Usar a API com Apidog
O Apidog é a maneira mais rápida de explorar como usar a API sem escrever código primeiro. Ele oferece uma GUI completa para enviar solicitações, inspecionar respostas e executar asserções de teste unitário, tudo em um só lugar. Baixe o Apidog gratuitamente antes de começar.
Configurando Solicitações da API MiMo-V2-Pro e Omni no Apidog
Como usar a API no Apidog leva menos de dois minutos:
- Abra o Apidog e crie um novo projeto chame-o de algo como
MiMo-V2 Testes da API. - Crie uma nova solicitação HTTP:
- Método:
POST - URL:
https://api.xiaomimimo.com/v1/chat/completions
3. Adicione cabeçalhos na aba Headers:
| Chave | Valor |
|---|---|
Authorization | Bearer YOUR_MIMO_API_KEY |
Content-Type | application/json |
4. Defina o corpo da solicitação (Body → JSON) para o MiMo-V2-Pro:
{
"model": "mimo-v2-pro",
"messages": [
{
"role": "user",
"content": "Write a Python function that checks if a number is prime, and explain how you would unit test it."
}
],
"temperature": 0.6,
"max_tokens": 512
}
Para o MiMo-V2-Omni, altere o modelo e adicione uma entrada de imagem:
{
"model": "mimo-v2-omni",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Describe what you see in this image." },
{ "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
]
}
],
"max_tokens": 300
}5. Clique em Enviar. O Apidog mostra a resposta completa com o uso de tokens, permitindo que você rastreie os custos do Preço do MiMo-V2-Pro e do Preço do Omni por solicitação em tempo real.
Escrevendo Testes Unitários para a API MiMo-V2-Pro e Omni no Apidog
O Apidog possui um motor de script de teste integrado. Após enviar uma solicitação, abra a aba Tests e adicione estas asserções de teste unitário:
// Teste unitário 1: O status HTTP é 200
pm.test("Status code is 200", function () {
pm.response.to.have.status(200);
});
// Teste unitário 2: Modelo correto retornado (validação do Preço do MiMo-V2-Pro)
pm.test("Model ID is correct", function () {
const json = pm.response.json();
pm.expect(json.model).to.include("mimo-v2");
});
// Teste unitário 3: A resposta contém mensagem do assistente
pm.test("Assistant message is present", function () {
const json = pm.response.json();
pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});
// Teste unitário 4: Uso de tokens reportado (para rastreamento do Preço do Omni e Pro)
pm.test("Token usage is present", function () {
const json = pm.response.json();
pm.expect(json.usage.total_tokens).to.be.above(0);
});
Essas quatro verificações de teste unitário cobrem o essencial: status, identidade do modelo, conteúdo da resposta e uso de tokens. O Apidog os executa automaticamente a cada Envio, para que você detecte regressões imediatamente ao iterar nos prompts. Você também pode salvar a coleção e executá-la em CI usando o executor CLI do Apidog.
Como Usar a API com Python
Para uso em produção, veja como usar a API em Python com um conjunto completo de testes unitários usando pytest.
Instalação
pip install openai pytest
A API MiMo é compatível com OpenAI, então o SDK `openai` funciona diretamente.
Chamada Básica da API (MiMo-V2-Pro)
# mimo_client.py
from openai import OpenAI
# Aponta o cliente OpenAI para a API MiMo
client = OpenAI(
api_key="YOUR_MIMO_API_KEY",
base_url="https://api.xiaomimimo.com/v1"
)
def ask_mimo_pro(prompt: str) -> dict:
"""Chama a API MiMo-V2-Pro e retorna resposta estruturada."""
response = client.chat.completions.create(
model="mimo-v2-pro",
messages=[{"role": "user", "content": prompt}],
temperature=0.6,
max_tokens=512
)
return {
"content": response.choices[0].message.content,
"model": response.model,
"prompt_tokens": response.usage.prompt_tokens,
"completion_tokens": response.usage.completion_tokens,
"total_tokens": response.usage.total_tokens,
}
if __name__ == "__main__":
result = ask_mimo_pro("What is a unit test and why does it matter?")
print(result["content"])
# Estima o custo usando o Preço do MiMo-V2-Pro (nível ≤256K)
input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
print(f"Estimated cost: ${input_cost + output_cost:.6f}")
Teste Unitário para a API MiMo-V2-Pro
# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro
@pytest.fixture
def mock_mimo_response():
"""Simula resposta da API MiMo-V2-Pro para teste unitário."""
mock = MagicMock()
mock.choices[0].message.content = (
"A unit test verifies a single function behaves correctly in isolation."
)
mock.model = "mimo-v2-pro"
mock.usage.prompt_tokens = 20
mock.usage.completion_tokens = 30
mock.usage.total_tokens = 50
return mock
@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
"""Teste unitário: A API retorna conteúdo de string não vazio."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("What is a unit test?")
assert isinstance(result["content"], str)
assert len(result["content"]) > 0
@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
"""Teste unitário: confirma que o ID do modelo mimo-v2-pro é usado."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Hello")
assert result["model"] == "mimo-v2-pro"
@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
"""Teste unitário: uso de tokens presente para rastreamento do Preço do MiMo-V2-Pro."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Hello")
assert result["total_tokens"] > 0
assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]
Execute os testes unitários:
pytest test_mimo_client.py -v
Saída esperada:
test_mimo_client.py::test_returns_content PASSED
test_mimo_client.py::test_correct_model PASSED
test_mimo_client.py::test_token_usage_for_pricing PASSED
3 passed in 0.28s
Simular a API em seu conjunto de testes unitários significa zero gasto de tokens durante as execuções de CI, o que importa quando o Preço do MiMo-V2-Pro escala com cada solicitação em pipelines automatizados.
Melhores Práticas para a API MiMo-V2-Pro e Omni
Tirar o máximo proveito de como usar a API em produção significa ser intencional. Aqui estão as principais práticas:
1. Rastreie o uso de tokens para controlar os custos do Preço do MiMo-V2-Pro e do Preço do Omni Registre prompt_tokens e completion_tokens por chamada. Com $1/1M de entrada e $3/1M de saída, prompts de sistema verbosos se acumulam rapidamente. Mantenha-os concisos.
2. Use o Apidog antes de escrever código Antes de construir uma integração completa, use o Apidog para prototipar prompts e validar formatos de resposta. Esta é a maneira mais rápida de aprender como usar a API sem gastar tokens em código quebrado. O Apidog também permite que você compartilhe coleções de solicitações com sua equipe.
3. Escreva testes unitários desde o primeiro dia Adicione um teste unitário para cada função que chama a API. Simule a resposta com `unittest.mock` para que seu conjunto de testes seja executado instantaneamente e gratuitamente. Use os scripts de teste do Apidog para cobertura de teste unitário baseada em GUI, e `pytest` para cobertura em nível de código.
4. Escolha o modelo certo para a tarefa Use o MiMo-V2-Pro para tarefas textuais que exigem muito raciocínio, especialmente qualquer coisa que envolva código, planejamento ou lógica multi-passos. Use o MiMo-V2-Omni quando seu pipeline envolver imagens, áudio ou vídeo. Não pague o Preço do Omni por tarefas que só precisam de texto.
5. Mantenha-se abaixo de 256K de contexto quando possível O Preço do MiMo-V2-Pro dobra no nível de 256K–1M. Para pipelines RAG, recupere apenas os trechos mais relevantes em vez de passar o conjunto completo de documentos.
6. Use o SDK OpenAI para fácil integração Como ambos os modelos expõem endpoints compatíveis com OpenAI, você pode integrá-los em qualquer base de código existente baseada em OpenAI, alterando `base_url` e `model`. Nenhum novo SDK é necessário, o que torna como usar a API direto para equipes já familiarizadas com a pilha OpenAI.
Conclusão
O Preço do MiMo-V2-Pro de $1/1M de entrada e $3/1M de saída o torna um dos modelos de raciocínio carro-chefe mais econômicos disponíveis hoje. O Preço do Omni estende esse valor para cargas de trabalho multimodais texto, imagem, áudio e vídeo em uma única chamada de API unificada.
Quer você esteja explorando como usar a API pela primeira vez com a GUI do Apidog, ou construindo uma integração Python de produção apoiada por um conjunto de testes unitários, ambos MiMo-V2-Pro e MiMo-V2-Omni se encaixam perfeitamente nos fluxos de trabalho modernos dos desenvolvedores. Comece com o Apidog para validar suas solicitações visualmente, depois passe para o código com confiança.
Experimente o Apidog gratuitamente sem necessidade de cartão de crédito.
Perguntas Frequentes
Qual é o Preço do MiMo-V2-Pro? O Preço do MiMo-V2-Pro é de $1/1M tokens de entrada e $3/1M tokens de saída para contexto de até 256K. Para contexto entre 256K e 1M tokens, é de $2/1M de entrada e $6/1M de saída.
Qual é o Preço do MiMo-V2-Omni? O Preço do Omni é comparável ao MiMo-V2-Pro para entradas de texto. Entradas multimodais (imagem, áudio, vídeo) são tokenizadas e cobradas junto com os tokens de texto. Verifique platform.xiaomimimo.com para as taxas mais recentes do Preço do Omni.
Como usar a API MiMo-V2-Pro? Use o SDK Python da OpenAI com base_url="https://api.xiaomimimo.com/v1" e model="mimo-v2-pro". A API é totalmente compatível com OpenAI. Use o Apidog para testá-la visualmente antes de escrever código.
Como escrevo um teste unitário para a API MiMo? Simule o cliente da API com `unittest.mock` em Python e faça asserções na estrutura da resposta. No Apidog, use a aba Tests para adicionar asserções de teste unitário baseadas em JavaScript após cada solicitação.
Qual a diferença entre MiMo-V2-Pro e MiMo-V2-Omni? O MiMo-V2-Pro é um modelo de raciocínio apenas textual com 1T parâmetros e uma janela de contexto de 1M de tokens. O MiMo-V2-Omni é um modelo multimodal que lida nativamente com texto, imagem, áudio e vídeo em uma arquitetura unificada.
Como o Preço do MiMo-V2-Pro se compara ao MiMo-V2-Flash? O MiMo-V2-Flash é muito mais barato, com $0.10/1M de entrada e $0.30/1M de saída, mas o MiMo-V2-Pro oferece raciocínio significativamente mais forte e uma janela de contexto de 1M de tokens. Escolha com base na complexidade da tarefa.
Onde posso acessar a API MiMo? A API MiMo está disponível em platform.xiaomimimo.com. Ambos MiMo-V2-Pro e MiMo-V2-Omni também são acessíveis via provedores de terceiros como OpenRouter e Vercel AI Gateway.
