要約
MiMo-V2-Proの料金は、入力トークン100万あたり1ドル、出力トークン100万あたり3ドル(コンテキスト256K以下)から開始します。MiMo-V2-Omniの料金は、テキスト、画像、音声、動画といったマルチモーダル入力を統合モデルでカバーします。どちらもplatform.xiaomimimo.comでOpenAI互換APIを介して利用可能です。APIの視覚的なテストにはApidogを、本番環境への統合にはPythonを使用し、常に単体テストで統合を裏付けましょう。
はじめに
Xiaomiは2026年3月18日に3つの新しいAIモデルを発表し、開発者コミュニティはすぐに注目しました。MiMo-V2-ProとMiMo-V2-Omniは、主要な2つのリリースです。一方は深いエージェント的推論のために構築され、もう一方は真のマルチモーダル理解のために作られています。MiMo-V2-Proの料金、Omniの料金、または単にスタックでAPIを使用する方法を知りたい場合、このガイドが役立ちます。料金体系を詳しく解説し、APIの機能を紹介し、Apidogを使ったGUIベースのワークフローと、単体テストでセットアップを検証するPythonアプローチという2つの統合パスを示します。
MiMo-V2-Proの料金とMiMo-V2-Omniの料金の内訳
MiMo-V2-Proの料金とOmniの料金を理解することは、APIを呼び出す前に踏むべき最初のステップです。両モデルとも階層型トークンベースの料金体系を採用しており、本番ワークロードにとって真剣に検討する価値のある競争力のあるコスト構造です。
MiMo-V2-Proの料金:コンテキスト長による階層化
MiMo-V2-Proの料金は、リクエストごとに使用するコンテキストの量に基づいて2つの階層に分かれています。
| コンテキスト長 | 入力(100万トークンあたり) | 出力(100万トークンあたり) |
|---|---|---|
| ≤ 256Kトークン | $1.00 | $3.00 |
| 256K – 1Mトークン | $2.00 | $6.00 |
この階層構造は、モデルが持つ100万トークンという最大級のコンテキストウィンドウを反映しています。ほとんどのワークロードで256Kトークン以下に収まる場合、MiMo-V2-Proの料金は非常に競争力があります。出力100万トークンあたり3ドルは、Claude Opusの8分の1の価格です。コードベース全体の処理や拡張された計画シーケンスのような長期間のタスクには、256K~1Mの階層が適用されます。
MiMo-V2-Omniの料金
Omniの料金は、MiMo-V2-Proと類似の構造を持ちますが、マルチモーダル入力については追加の考慮事項があります。MiMo-V2-Omniは、個別の後付けモジュールとしてではなく、統一されたアーキテクチャでテキスト、画像、音声、動画をネイティブに処理します。画像および音声トークンはテキストトークンとともにカウントされるため、Omniの料金は入力の豊富さに応じて変動します。
純粋なテキストタスクの場合、Omniの料金はMiMo-V2-Proに匹敵します。マルチモーダルワークロードの場合、画像や音声のトークン化により、リクエストあたりのトークン数は増加すると予想されます。
MiMo-V2ファミリーの料金比較
MiMo-V2-Proの料金とOmniの料金を比較すると以下の通りです。
| モデル | 入力(100万トークンあたり) | 出力(100万トークンあたり) | コンテキストウィンドウ | モダリティ |
|---|---|---|---|---|
| MiMo-V2-Pro | $1.00 / $2.00* | $3.00 / $6.00* | 1Mトークン | テキスト |
| MiMo-V2-Omni | ~$1.00* | ~$3.00* | 256Kトークン | テキスト、画像、音声、動画 |
| MiMo-V2-Flash | $0.10 | $0.30 | 256Kトークン | テキスト |
階層型または概算です。最新の料金はplatform.xiaomimimo.comで確認してください。
MiMo-V2-Flashは、純粋なテキストタスクで最も安価なオプションです。深い推論と長いコンテキストが必要な場合は、MiMo-V2-Proが最適な選択肢です。マルチモーダルパイプラインで、Omniの料金が1つのAPI呼び出しですべての入力タイプをカバーする場合は、MiMo-V2-Omniが最適です。
MiMo-V2-Pro & Omni APIの機能
APIの使用方法を学ぶ前に、各モデルが実際に何をするのかを知っておくと役立ちます。
MiMo-V2-Proは、Xiaomiの主力推論モデルで、「エージェント時代」のために構築されました。主な仕様:
- 合計1兆パラメータ、アクティブパラメータは420億(MiMo-V2-Flashの3倍)
- 100万トークンのコンテキストウィンドウにより、コードベース全体や長期間の計画シーケンスを処理可能
- より高速な推論のためのマルチトークン予測(MTP)
- 自律的な多段階推論、ツール実行、ソフトウェアエンジニアリングタスク向けに設計
- Artificial Analysis Intelligence Indexにおいて、その価格帯の160モデル中第1位にランクイン(スコア:49 vs 中央値13)
- SWE-Benchおよびコーディングベンチマークで強力なパフォーマンスを発揮
MiMo-V2-Omniは、Xiaomiのマルチモーダル基盤モデルです。
- 統一されたアーキテクチャでテキスト、画像、音声、動画をネイティブに処理
- アーキテクチャレベルで統合された専用の画像および音声エンコーダ
- 文書理解、音声転写、動画分析、クロスモーダル推論に適しています
両モデルは、platform.xiaomimimo.comの公式APIプラットフォームで利用可能であり、OpenAI互換のエンドポイントを備えているため、最小限の変更で既存のOpenAI SDK統合に組み込むことができます。
ApidogでAPIを使用する方法
Apidogは、最初にコードを書くことなくAPIの使用方法を探求する最速の方法です。リクエストの送信、レスポンスの検査、単体テストのアサーション実行をすべて1か所で実行できる完全なGUIを提供します。Apidogを無料でダウンロードしてから始めてください。
ApidogでのMiMo-V2-Pro & Omni APIリクエストの設定
ApidogでAPIを使用する方法は2分もかかりません。
- Apidogを開き、新しいプロジェクトを作成します。例えば
MiMo-V2 APIテストという名前を付けます。 - 新しいHTTPリクエストを作成します:
- メソッド:
POST - URL:
https://api.xiaomimimo.com/v1/chat/completions
3. ヘッダータブでヘッダーを追加します:
| キー | 値 |
|---|---|
Authorization | Bearer YOUR_MIMO_API_KEY |
Content-Type | application/json |
4. MiMo-V2-Proのリクエストボディを設定します(Body → JSON):
{
"model": "mimo-v2-pro",
"messages": [
{
"role": "user",
"content": "与えられた数値が素数であるかをチェックし、その単体テスト方法を説明するPython関数を作成してください。"
}
],
"temperature": 0.6,
"max_tokens": 512
}
MiMo-V2-Omniの場合、モデルを変更し、画像入力を追加します:
{
"model": "mimo-v2-omni",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "この画像に何が見えるか説明してください。" },
{ "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
]
}
],
"max_tokens": 300
}5. 送信をクリックします。Apidogはトークン使用量を含む完全なレスポンスを表示し、MiMo-V2-Proの料金とOmniの料金をリクエストごとにリアルタイムで追跡できます。
ApidogでMiMo-V2-Pro & Omni APIの単体テストを記述する
Apidogには組み込みのテストスクリプトエンジンがあります。リクエストを送信した後、テストタブを開き、これらの単体テストアサーションを追加します。
// 単体テスト1:HTTPステータスが200であること
pm.test("Status code is 200", function () {
pm.response.to.have.status(200);
});
// 単体テスト2:正しいモデルが返されたこと(MiMo-V2-Proの料金検証)
pm.test("Model ID is correct", function () {
const json = pm.response.json();
pm.expect(json.model).to.include("mimo-v2");
});
// 単体テスト3:レスポンスにアシスタントメッセージが含まれていること
pm.test("Assistant message is present", function () {
const json = pm.response.json();
pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});
// 単体テスト4:トークン使用量が報告されたこと(Omniの料金とProの料金追跡用)
pm.test("Token usage is present", function () {
const json = pm.response.json();
pm.expect(json.usage.total_tokens).to.be.above(0);
});
これら4つの単体テストチェックは、ステータス、モデルID、レスポンス内容、トークン使用量という基本的な要素をカバーしています。Apidogは送信ごとにこれらを自動的に実行するため、プロンプトの反復中にリグレッションを即座に検出できます。コレクションを保存し、ApidogのCLIランナーを使用してCIで実行することもできます。
PythonでAPIを使用する方法
本番環境で使用する場合、Pythonでpytestを使った完全な単体テストスイートでAPIを使用する方法を以下に示します。
インストール
pip install openai pytest
MiMo APIはOpenAI互換なので、openai SDKが直接動作します。
基本的なAPI呼び出し(MiMo-V2-Pro)
# mimo_client.py
from openai import OpenAI
# MiMo APIにOpenAIクライアントを接続
client = OpenAI(
api_key="YOUR_MIMO_API_KEY",
base_url="https://api.xiaomimimo.com/v1"
)
def ask_mimo_pro(prompt: str) -> dict:
"""MiMo-V2-Pro APIを呼び出し、構造化されたレスポンスを返します。"""
response = client.chat.completions.create(
model="mimo-v2-pro",
messages=[{"role": "user", "content": prompt}],
temperature=0.6,
max_tokens=512
)
return {
"content": response.choices[0].message.content,
"model": response.model,
"prompt_tokens": response.usage.prompt_tokens,
"completion_tokens": response.usage.completion_tokens,
"total_tokens": response.usage.total_tokens,
}
if __name__ == "__main__":
result = ask_mimo_pro("単体テストとは何ですか?なぜ重要なのでしょうか?")
print(result["content"])
# MiMo-V2-Proの料金(256K以下の階層)を使用してコストを推定
input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
print(f"推定コスト: ${input_cost + output_cost:.6f}")
MiMo-V2-Pro APIの単体テスト
# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro
@pytest.fixture
def mock_mimo_response():
"""単体テスト用のMiMo-V2-Pro APIレスポンスをモックします。"""
mock = MagicMock()
mock.choices[0].message.content = (
"単体テストは、単一の関数が単独で正しく動作することを検証します。"
)
mock.model = "mimo-v2-pro"
mock.usage.prompt_tokens = 20
mock.usage.completion_tokens = 30
mock.usage.total_tokens = 50
return mock
@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
"""単体テスト:APIが空でない文字列コンテンツを返すこと。"""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("単体テストとは何ですか?")
assert isinstance(result["content"], str)
assert len(result["content"]) > 0
@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
"""単体テスト:mimo-v2-proモデルIDが使用されていることを確認します。"""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("こんにちは")
assert result["model"] == "mimo-v2-pro"
@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
"""単体テスト:MiMo-V2-Proの料金追跡のためにトークン使用量が存在すること。"""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("こんにちは")
assert result["total_tokens"] > 0
assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]
単体テストを実行します:
pytest test_mimo_client.py -v
予想される出力:
test_mimo_client.py::test_returns_content PASSED
test_mimo_client.py::test_correct_model PASSED
test_mimo_client.py::test_token_usage_for_pricing PASSED
3 passed in 0.28s
単体テストスイートでAPIをモックすることは、CI実行中にトークンを消費しないことを意味します。これは、自動化されたパイプラインでリクエストごとにMiMo-V2-Proの料金が変動する場合に重要です。
MiMo-V2-Pro & Omni APIのベストプラクティス
本番環境でAPIを最大限に活用するには、意図的なアプローチが必要です。以下に主要な実践方法を示します。
1. MiMo-V2-Proの料金とOmniの料金コストを管理するためにトークン使用量を追跡します 呼び出しごとにprompt_tokensとcompletion_tokensをログに記録します。入力100万トークンあたり1ドル、出力100万トークンあたり3ドルでは、冗長なシステムプロンプトはすぐに高額になります。簡潔に保ちましょう。
2. コードを書く前にApidogを使用します 完全な統合を構築する前に、Apidogを使用してプロンプトをプロトタイプ化し、レスポンスの形式を検証します。これは、壊れたコードにトークンを消費することなくAPIの使用方法を学ぶ最速の方法です。Apidogを使用すると、リクエストコレクションをチームと共有することもできます。
3. 初日から単体テストを記述します APIを呼び出すすべての関数に単体テストを追加します。テストスイートが瞬時に無料で実行されるように、unittest.mockを使用してレスポンスをモックします。GUIベースの単体テストカバレッジにはApidogのテストスクリプトを、コードレベルのカバレッジにはpytestを使用します。
4. タスクに適したモデルを選択します 推論負荷の高いテキストのみのタスク、特にコード、計画、または多段階ロジックを伴うものには、MiMo-V2-Proを使用します。パイプラインに画像、音声、または動画が含まれる場合は、MiMo-V2-Omniを使用します。テキストのみで済むタスクにOmniの料金を支払う必要はありません。
5. 可能な限り256Kコンテキスト以下に保ちます MiMo-V2-Proの料金は、256K~1Mの階層で2倍になります。RAGパイプラインでは、ドキュメントセット全体を渡すのではなく、最も関連性の高いチャンクのみを取得します。
6. 簡単な統合のためにOpenAI SDKを使用します 両モデルともOpenAI互換のエンドポイントを公開しているため、base_urlとmodelを変更するだけで、既存のOpenAIベースのコードベースに統合できます。新しいSDKは必要ないため、OpenAIスタックをすでに利用しているチームにとってAPIの使用方法は簡単です。
まとめ
MiMo-V2-Proの料金が入力100万トークンあたり1ドル、出力100万トークンあたり3ドルであることは、現在利用可能な最も費用対効果の高い主力推論モデルの1つであることを意味します。Omniの料金は、単一の統合API呼び出しでテキスト、画像、音声、動画といったマルチモーダルワークロードにその価値を拡大します。
ApidogのGUIで初めてAPIの使用方法を検討している場合でも、単体テストスイートでサポートされた本番Python統合を構築している場合でも、MiMo-V2-ProとMiMo-V2-Omniはどちらも最新の開発者ワークフローにうまく適合します。まずApidogで視覚的にリクエストを検証し、その後自信を持ってコードに移行してください。
Apidogを無料で試す クレジットカードは不要です。
よくある質問
MiMo-V2-Proの料金はいくらですか? MiMo-V2-Proの料金は、コンテキスト256K以下の場合、入力トークン100万あたり1ドル、出力トークン100万あたり3ドルです。コンテキストが256Kから1Mトークンの場合、入力100万あたり2ドル、出力100万あたり6ドルです。
MiMo-V2-Omniの料金はいくらですか? Omniの料金は、テキスト入力に関してはMiMo-V2-Proに匹敵します。マルチモーダル入力(画像、音声、動画)はテキストトークンと同様にトークン化され、課金されます。最新のOmniの料金はplatform.xiaomimimo.comで確認してください。
MiMo-V2-Pro APIの使用方法は? base_url="https://api.xiaomimimo.com/v1"およびmodel="mimo-v2-pro"を指定してOpenAI Python SDKを使用します。APIは完全にOpenAI互換です。コードを記述する前にApidogで視覚的にテストしてください。
MiMo APIの単体テストの書き方は? Pythonでunittest.mockを使用してAPIクライアントをモックし、レスポンス構造をアサートします。Apidogでは、テストタブを使用して、各リクエスト後にJavaScriptベースの単体テストアサーションを追加します。
MiMo-V2-ProとMiMo-V2-Omniの違いは何ですか? MiMo-V2-Proは、1兆パラメータと100万トークンのコンテキストウィンドウを持つテキスト専用の推論モデルです。MiMo-V2-Omniは、テキスト、画像、音声、動画を統一されたアーキテクチャでネイティブに処理するマルチモーダルモデルです。
MiMo-V2-Proの料金はMiMo-V2-Flashと比較してどうですか? MiMo-V2-Flashは、入力100万あたり0.10ドル、出力100万あたり0.30ドルと非常に安価ですが、MiMo-V2-Proははるかに強力な推論能力と100万トークンのコンテキストウィンドウを提供します。タスクの複雑さに応じて選択してください。
MiMo APIはどこでアクセスできますか? MiMo APIはplatform.xiaomimimo.comで利用可能です。MiMo-V2-ProとMiMo-V2-Omniの両方は、OpenRouterやVercel AI Gatewayのようなサードパーティプロバイダーからもアクセスできます。
