Preços MiMo-V2-Pro e Omni: Como Usar a API

Herve Kom

Herve Kom

20 março 2026

Preços MiMo-V2-Pro e Omni: Como Usar a API

Apidog para empresas

Implantação local

SSO & RBAC

Conforme SOC 2

Explorar Apidog Enterprise

Resumo

O Preço do MiMo-V2-Pro começa em $1/1M tokens de entrada e $3/1M tokens de saída (contexto ≤256K). O Preço do MiMo-V2-Omni abrange entradas multimodais de texto, imagem, áudio e vídeo em um modelo unificado. Ambos são acessíveis via uma API compatível com OpenAI em platform.xiaomimimo.com. Use o Apidog para testar a API visualmente, ou Python para integrações de produção e sempre apoie sua integração com um teste unitário.

Introdução

A Xiaomi lançou três novos modelos de IA em 18 de março de 2026 e a comunidade de desenvolvedores percebeu rapidamente. O MiMo-V2-Pro e o MiMo-V2-Omni são os dois lançamentos principais: um construído para raciocínio agentivo profundo, o outro para verdadeira compreensão multimodal. Se você está tentando descobrir o Preço do MiMo-V2-Pro, o Preço do Omni, ou simplesmente como usar a API em sua pilha, este guia irá ajudá-lo. Vamos detalhar os níveis de preços completos, percorrer as capacidades da API e mostrar-lhe dois caminhos de integração um fluxo de trabalho baseado em GUI com o Apidog e uma abordagem Python com um teste unitário para validar sua configuração.

💡
Antes de escrever código para a API MiMo-V2-Pro ou Omni, baixe o Apidog gratuitamente. Você pode testar visualmente as solicitações, validar respostas, adicionar asserções de teste unitário e depurar o uso de tokens instantaneamente, tudo sem gastar tokens ou escrever uma única linha de Python.
botão

Preços do MiMo-V2-Pro e Análise de Preços do MiMo-V2-Omni

Compreender o Preço do MiMo-V2-Pro e o Preço do Omni é o primeiro passo antes de começar a chamar a API. Ambos os modelos usam preços escalonados baseados em tokens, e a estrutura de custos é competitiva o suficiente para torná-los dignos de séria consideração para cargas de trabalho de produção.

Preços do MiMo-V2-Pro: Escalonados por Duração do Contexto

O Preço do MiMo-V2-Pro é dividido em dois níveis com base na quantidade de contexto que você usa por solicitação:

Duração do ContextoEntrada (por 1M tokens)Saída (por 1M tokens)
≤ 256K tokens$1.00$3.00
256K – 1M tokens$2.00$6.00

A estrutura em níveis reflete a janela de contexto de 1 milhão de tokens do modelo uma das maiores disponíveis. Para a maioria das cargas de trabalho que permanecem abaixo de 256K tokens, o Preço do MiMo-V2-Pro é extremamente competitivo: a saída a $3/1M é apenas 1/8 do preço do Claude Opus. Para tarefas de longo prazo, como processamento de bases de código completas ou sequências de planejamento estendidas, o nível de 256K–1M se aplica.

Preços do MiMo-V2-Omni

O Preço do Omni segue uma estrutura semelhante ao MiMo-V2-Pro, com considerações adicionais para entradas multimodais. O MiMo-V2-Omni processa nativamente texto, imagem, áudio e vídeo em uma arquitetura unificada, e não como módulos separados. Tokens de imagem e áudio são contados junto com os tokens de texto, então o Preço do Omni escala com a riqueza de suas entradas.

Para tarefas puramente textuais, o Preço do Omni é comparável ao MiMo-V2-Pro. Para cargas de trabalho multimodais, espere contagens de tokens mais altas por solicitação devido à tokenização de imagem e áudio.

Comparativo de Preços da Família MiMo-V2

Para colocar o Preço do MiMo-V2-Pro e o Preço do Omni em contexto:

ModeloEntrada (por 1M tokens)Saída (por 1M tokens)Janela de ContextoModalidades
MiMo-V2-Pro$1.00 / $2.00*$3.00 / $6.00*1M tokensTexto
MiMo-V2-Omni~$1.00*~$3.00*256K tokensTexto, Imagem, Áudio, Vídeo
MiMo-V2-Flash$0.10$0.30256K tokensTexto

*Escalonado ou aproximado — verifique as taxas atuais em platform.xiaomimimo.com

O MiMo-V2-Flash é a opção mais barata para tarefas puramente textuais. O MiMo-V2-Pro é a escolha certa quando você precisa de raciocínio profundo e contexto longo. O MiMo-V2-Omni é a escolha para pipelines multimodais onde o Preço do Omni abrange todos os tipos de entrada em uma única chamada de API.

Capacidades da API MiMo-V2-Pro e Omni

Antes de aprender como usar a API, é útil saber o que cada modelo realmente faz.

O MiMo-V2-Pro é o modelo de raciocínio principal da Xiaomi, construído para a "era dos agentes". Especificações principais:

O MiMo-V2-Omni é o modelo fundacional multimodal da Xiaomi:

Ambos os modelos estão disponíveis através da plataforma oficial da API em platform.xiaomimimo.com, com endpoints compatíveis com OpenAI, o que significa que você pode trocá-los em qualquer integração SDK OpenAI existente com mudanças mínimas.

Como Usar a API com Apidog

O Apidog é a maneira mais rápida de explorar como usar a API sem escrever código primeiro. Ele oferece uma GUI completa para enviar solicitações, inspecionar respostas e executar asserções de teste unitário, tudo em um só lugar. Baixe o Apidog gratuitamente antes de começar.

botão

Configurando Solicitações da API MiMo-V2-Pro e Omni no Apidog

Como usar a API no Apidog leva menos de dois minutos:

  1. Abra o Apidog e crie um novo projeto chame-o de algo como MiMo-V2 Testes da API.
  2. Crie uma nova solicitação HTTP:

3. Adicione cabeçalhos na aba Headers:

ChaveValor
AuthorizationBearer YOUR_MIMO_API_KEY
Content-Typeapplication/json

4. Defina o corpo da solicitação (Body → JSON) para o MiMo-V2-Pro:

{
  "model": "mimo-v2-pro",
  "messages": [
    {
      "role": "user",
      "content": "Write a Python function that checks if a number is prime, and explain how you would unit test it."
    }
  ],
  "temperature": 0.6,
  "max_tokens": 512
}

Para o MiMo-V2-Omni, altere o modelo e adicione uma entrada de imagem:

{
  "model": "mimo-v2-omni",
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "Describe what you see in this image." },
        { "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
      ]
    }
  ],
  "max_tokens": 300
}

5. Clique em Enviar. O Apidog mostra a resposta completa com o uso de tokens, permitindo que você rastreie os custos do Preço do MiMo-V2-Pro e do Preço do Omni por solicitação em tempo real.

Escrevendo Testes Unitários para a API MiMo-V2-Pro e Omni no Apidog

O Apidog possui um motor de script de teste integrado. Após enviar uma solicitação, abra a aba Tests e adicione estas asserções de teste unitário:

// Teste unitário 1: O status HTTP é 200
pm.test("Status code is 200", function () {
  pm.response.to.have.status(200);
});

// Teste unitário 2: Modelo correto retornado (validação do Preço do MiMo-V2-Pro)
pm.test("Model ID is correct", function () {
  const json = pm.response.json();
  pm.expect(json.model).to.include("mimo-v2");
});

// Teste unitário 3: A resposta contém mensagem do assistente
pm.test("Assistant message is present", function () {
  const json = pm.response.json();
  pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});

// Teste unitário 4: Uso de tokens reportado (para rastreamento do Preço do Omni e Pro)
pm.test("Token usage is present", function () {
  const json = pm.response.json();
  pm.expect(json.usage.total_tokens).to.be.above(0);
});

Essas quatro verificações de teste unitário cobrem o essencial: status, identidade do modelo, conteúdo da resposta e uso de tokens. O Apidog os executa automaticamente a cada Envio, para que você detecte regressões imediatamente ao iterar nos prompts. Você também pode salvar a coleção e executá-la em CI usando o executor CLI do Apidog.

Como Usar a API com Python

Para uso em produção, veja como usar a API em Python com um conjunto completo de testes unitários usando pytest.

Instalação

pip install openai pytest

A API MiMo é compatível com OpenAI, então o SDK `openai` funciona diretamente.

Chamada Básica da API (MiMo-V2-Pro)

# mimo_client.py
from openai import OpenAI

# Aponta o cliente OpenAI para a API MiMo
client = OpenAI(
    api_key="YOUR_MIMO_API_KEY",
    base_url="https://api.xiaomimimo.com/v1"
)

def ask_mimo_pro(prompt: str) -> dict:
    """Chama a API MiMo-V2-Pro e retorna resposta estruturada."""
    response = client.chat.completions.create(
        model="mimo-v2-pro",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.6,
        max_tokens=512
    )
    return {
        "content": response.choices[0].message.content,
        "model": response.model,
        "prompt_tokens": response.usage.prompt_tokens,
        "completion_tokens": response.usage.completion_tokens,
        "total_tokens": response.usage.total_tokens,
    }


if __name__ == "__main__":
    result = ask_mimo_pro("What is a unit test and why does it matter?")
    print(result["content"])

    # Estima o custo usando o Preço do MiMo-V2-Pro (nível ≤256K)
    input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
    output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
    print(f"Estimated cost: ${input_cost + output_cost:.6f}")

Teste Unitário para a API MiMo-V2-Pro

# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro


@pytest.fixture
def mock_mimo_response():
    """Simula resposta da API MiMo-V2-Pro para teste unitário."""
    mock = MagicMock()
    mock.choices[0].message.content = (
        "A unit test verifies a single function behaves correctly in isolation."
    )
    mock.model = "mimo-v2-pro"
    mock.usage.prompt_tokens = 20
    mock.usage.completion_tokens = 30
    mock.usage.total_tokens = 50
    return mock


@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
    """Teste unitário: A API retorna conteúdo de string não vazio."""
    mock_create.return_value = mock_mimo_response
    result = ask_mimo_pro("What is a unit test?")
    assert isinstance(result["content"], str)
    assert len(result["content"]) > 0


@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
    """Teste unitário: confirma que o ID do modelo mimo-v2-pro é usado."""
    mock_create.return_value = mock_mimo_response
    result = ask_mimo_pro("Hello")
    assert result["model"] == "mimo-v2-pro"


@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
    """Teste unitário: uso de tokens presente para rastreamento do Preço do MiMo-V2-Pro."""
    mock_create.return_value = mock_mimo_response
    result = ask_mimo_pro("Hello")
    assert result["total_tokens"] > 0
    assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]

Execute os testes unitários:

pytest test_mimo_client.py -v

Saída esperada:

test_mimo_client.py::test_returns_content        PASSED
test_mimo_client.py::test_correct_model          PASSED
test_mimo_client.py::test_token_usage_for_pricing PASSED

3 passed in 0.28s

Simular a API em seu conjunto de testes unitários significa zero gasto de tokens durante as execuções de CI, o que importa quando o Preço do MiMo-V2-Pro escala com cada solicitação em pipelines automatizados.

Melhores Práticas para a API MiMo-V2-Pro e Omni

Tirar o máximo proveito de como usar a API em produção significa ser intencional. Aqui estão as principais práticas:

1. Rastreie o uso de tokens para controlar os custos do Preço do MiMo-V2-Pro e do Preço do Omni Registre prompt_tokens e completion_tokens por chamada. Com $1/1M de entrada e $3/1M de saída, prompts de sistema verbosos se acumulam rapidamente. Mantenha-os concisos.

2. Use o Apidog antes de escrever código Antes de construir uma integração completa, use o Apidog para prototipar prompts e validar formatos de resposta. Esta é a maneira mais rápida de aprender como usar a API sem gastar tokens em código quebrado. O Apidog também permite que você compartilhe coleções de solicitações com sua equipe.

3. Escreva testes unitários desde o primeiro dia Adicione um teste unitário para cada função que chama a API. Simule a resposta com `unittest.mock` para que seu conjunto de testes seja executado instantaneamente e gratuitamente. Use os scripts de teste do Apidog para cobertura de teste unitário baseada em GUI, e `pytest` para cobertura em nível de código.

4. Escolha o modelo certo para a tarefa Use o MiMo-V2-Pro para tarefas textuais que exigem muito raciocínio, especialmente qualquer coisa que envolva código, planejamento ou lógica multi-passos. Use o MiMo-V2-Omni quando seu pipeline envolver imagens, áudio ou vídeo. Não pague o Preço do Omni por tarefas que só precisam de texto.

5. Mantenha-se abaixo de 256K de contexto quando possível O Preço do MiMo-V2-Pro dobra no nível de 256K–1M. Para pipelines RAG, recupere apenas os trechos mais relevantes em vez de passar o conjunto completo de documentos.

6. Use o SDK OpenAI para fácil integração Como ambos os modelos expõem endpoints compatíveis com OpenAI, você pode integrá-los em qualquer base de código existente baseada em OpenAI, alterando `base_url` e `model`. Nenhum novo SDK é necessário, o que torna como usar a API direto para equipes já familiarizadas com a pilha OpenAI.

Conclusão

O Preço do MiMo-V2-Pro de $1/1M de entrada e $3/1M de saída o torna um dos modelos de raciocínio carro-chefe mais econômicos disponíveis hoje. O Preço do Omni estende esse valor para cargas de trabalho multimodais texto, imagem, áudio e vídeo em uma única chamada de API unificada.

Quer você esteja explorando como usar a API pela primeira vez com a GUI do Apidog, ou construindo uma integração Python de produção apoiada por um conjunto de testes unitários, ambos MiMo-V2-Pro e MiMo-V2-Omni se encaixam perfeitamente nos fluxos de trabalho modernos dos desenvolvedores. Comece com o Apidog para validar suas solicitações visualmente, depois passe para o código com confiança.

Experimente o Apidog gratuitamente sem necessidade de cartão de crédito.

botão

Perguntas Frequentes

Qual é o Preço do MiMo-V2-Pro? O Preço do MiMo-V2-Pro é de $1/1M tokens de entrada e $3/1M tokens de saída para contexto de até 256K. Para contexto entre 256K e 1M tokens, é de $2/1M de entrada e $6/1M de saída.

Qual é o Preço do MiMo-V2-Omni? O Preço do Omni é comparável ao MiMo-V2-Pro para entradas de texto. Entradas multimodais (imagem, áudio, vídeo) são tokenizadas e cobradas junto com os tokens de texto. Verifique platform.xiaomimimo.com para as taxas mais recentes do Preço do Omni.

Como usar a API MiMo-V2-Pro? Use o SDK Python da OpenAI com base_url="https://api.xiaomimimo.com/v1" e model="mimo-v2-pro". A API é totalmente compatível com OpenAI. Use o Apidog para testá-la visualmente antes de escrever código.

Como escrevo um teste unitário para a API MiMo? Simule o cliente da API com `unittest.mock` em Python e faça asserções na estrutura da resposta. No Apidog, use a aba Tests para adicionar asserções de teste unitário baseadas em JavaScript após cada solicitação.

Qual a diferença entre MiMo-V2-Pro e MiMo-V2-Omni? O MiMo-V2-Pro é um modelo de raciocínio apenas textual com 1T parâmetros e uma janela de contexto de 1M de tokens. O MiMo-V2-Omni é um modelo multimodal que lida nativamente com texto, imagem, áudio e vídeo em uma arquitetura unificada.

Como o Preço do MiMo-V2-Pro se compara ao MiMo-V2-Flash? O MiMo-V2-Flash é muito mais barato, com $0.10/1M de entrada e $0.30/1M de saída, mas o MiMo-V2-Pro oferece raciocínio significativamente mais forte e uma janela de contexto de 1M de tokens. Escolha com base na complexidade da tarefa.

Onde posso acessar a API MiMo? A API MiMo está disponível em platform.xiaomimimo.com. Ambos MiMo-V2-Pro e MiMo-V2-Omni também são acessíveis via provedores de terceiros como OpenRouter e Vercel AI Gateway.

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs