Xiaomi MiMo V2.5 APIの価格は、2026年5月27日に、入力トークン100万個あたり一律1ドル、出力トークン100万個あたり3ドルに値下げされ、この新料金が恒久化されました。以前の長文コンテキスト層(256Kトークンを超えるプロンプトには基本料金に急激な倍率が適用されるもの)は廃止されました。コンテキストの長さにF関係なく、料金は1つになりました。ほとんどのワークロードにとって、主要なニュースは次の1文に集約されます。MiMo V2.5は、稼働中の3つの最安値1Mコンテキストモデルの1つであり、今後もその地位を維持します。
要約
- Xiaomi MiMo V2.5の2026年5月27日からの恒久料金: 入力100万トークンあたり1.00ドル、出力100万トークンあたり3.00ドル、キャッシュ100万トークンあたり0.20ドル。1Mトークンのコンテキストウィンドウ付き。
- 「最大99%オフ」という主張は、長文コンテキスト層において現実です。以前の料金体系では、256Kを超える入力トークンで料金が急激に上昇しましたが、新しい一律料金によりその倍率はなくなりました。
- トークンプランの顧客は、有効期間内の使用済みクレジットが完全にリセットされ、クォータが5倍から8倍に増加しました。
- この値下げは恒久的なものであり、プロモーションではありません。Xiaomiの公式通知には「モデル全体の料金体系を恒久的に刷新する」と記載されています。
- 背景: Xiaomiは、今週、フロンティア層のモデルを恒久的に値下げした中国のラボとしては2番目です。DeepSeekは3日前にV4-Proを定価の4分の1で恒久化しました。
2026年5月27日に何が変わったか
Xiaomiの公式価格更新通知には3つの変更点が記されています。3つ全てが5月27日北京時間00:00(UTC協定世界時5月26日16:00)に発効しました。

1. コンテキストウィンドウ全体で一律料金。 以前のMiMo V2.5の料金体系は段階的でした。最大32K入力トークンのプロンプトには基本料金が適用され、32Kから256Kの範囲では倍率が、256K以上ではさらに急な倍率が適用されていました。新しい料金体系では、トークンの種類ごとに1つの価格が設定されています。長文コンテキストを使用するアプリケーションは、長文コンテキストに対する追加料金を支払う必要がなくなります。
2. 恒久的であり、プロモーションではない。 通知には「恒久的値下げ」というフレーズが2回、「モデル全体の料金体系を恒久的に刷新する」というフレーズが1回使われています。有効期限も、撤回条項もありません。これを新しい定価として扱ってください。
3. トークンプランの特典のリセット。 トークンプラン(Xiaomiのプリペイドクォータシステム)をご利用の場合、クレジット残高は5倍から8倍に増加し、有効期間内にすでに消費したすべてのクレジットが返金されました。有効期間自体は延長されなかったため、既存のプランは予算の思わぬ恩恵を受けましたが、期間が長くなったわけではありません。

「最大99%オフ」という見出しの主張は、特に長文コンテキスト帯に適用されます。256K以上の入力トークンに対する以前の価格は非常に高かったため、これを100万トークンあたり1ドルに一律化することで90%以上の削減が実現されます。基本層のワークロードについては、削減幅は小さいものの、依然として重要です。
新しい恒久料金表
100万トークンあたりの料金(米ドル)、即時適用され恒久的なもの:
| モデル | 入力 | 出力 | キャッシュ | コンテキスト |
|---|---|---|---|---|
| MiMo V2.5 Pro | $1.00 | $3.00 | $0.20 | 1Mトークン |
| MiMo V2 Flash | ~$0.10 | ~$0.40 | $0.02 | 256Kトークン |
表からは明らかでない詳細がいくつかあります。
- キャッシュ料金(V2.5 Proの場合100万トークンあたり0.20ドル)は、入力料金の5分の1です。これはDeepSeekの入力ミス対入力ヒットの120:1という比率よりも悪い比率です。Xiaomiのキャッシュは繰り返されるシステムプロンプトには依然として有用ですが、絶対的な節約額は小さくなります。
- 1Mコンテキストウィンドウは、ほとんどの記事が見過ごしている点です。米国のフロンティアモデルのほとんどは200Kから400Kで上限が設定されています。MiMo V2.5 Proはドキュメント全体を受け入れます。
- 通知ではV2.5 OmniおよびTTSバリアントについて言及していますが、詳細には触れていません。これらはプラットフォーム上で別途確認してください。
以前のV2-Proの料金を参考に、弊社の常設MiMo V2-Pro & Omni 料金ガイドをご覧ください。
MiMo V2.5が低価格以外にもたらすもの
5月27日の発表は価格変更に関するものですが、V2.5自体も4月にリリースされたV2-Proからの大幅なアップグレードです。注目すべき3つの変更点は以下の通りです。
- より長い実用的なコンテキスト。 V2.5 Proは1Mトークンの理論的ウィンドウを維持していますが、Xiaomiはほとんどの長文コンテキストモデルで性能が低下する200Kから800Kの範囲での検索品質を向上させました。Needle-in-haystackの精度は800Kトークンまで95%以上を維持します。
- ツール呼び出し形式のコンプライアンス向上。 V2-Proでは、ストリーミング応答内で並列ツール呼び出しが不正なJSONを返すという既知の問題がありました。V2.5ではこれらの失敗が減少しましたが、ゼロではありません。いずれにしてもJSONスキーマの検証を計画してください。
- 刷新されたトレーニングコーパス。 V2.5は2026年第1四半期までのデータでトレーニングされました。引用情報と知識のカットオフは、V2-Proよりも約3ヶ月進んでいます。
これらはいずれも主要なベンチマークではありませんが、実際の製品展開に現れる変更点です。より低価格とより長い信頼性の高いコンテキストウィンドウを組み合わせることで、5月27日以前には存在しなかった本格的な長文作業の選択肢が生まれます。
MiMo V2.5が他のモデルとどう比較されるか
興味深い比較対象はV2.5の過去のバージョンではありません。2026年5月に出荷されている他のフロンティア層APIオプションとの比較です。
| モデル | 入力 ($/MTok) | 出力 ($/MTok) | コンテキスト |
|---|---|---|---|
| Xiaomi MiMo V2.5 Pro | $1.00 | $3.00 | 1M |
| DeepSeek V4-Pro | $0.435 | $0.87 | 128K |
| GPT-5.5 | $5.00 | $30.00 | 200K |
| Claude Opus 4.7 | $3.00 | $15.00 | 200K |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | 1M |
3つのポイント:
- DeepSeek V4-Proは、トークン単価でMiMo V2.5よりも依然として安価です。 入力で約2.3倍、出力で約3.5倍安いです。トークンあたりの純粋なコストが唯一の指標であれば、DeepSeekが優位です。
- MiMo V2.5は、1Mコンテキストのワークロードで優位に立ちます。 Gemini 3.5 Flashが表内で唯一の他の1Mコンテキストオプションですが、入力で1.5倍、出力で3倍高価です。
- Artificial Analysisによると、MiMo V2.5は、同様のベンチマーク性能を持ちながら、GPT-5.5と比較して入力で5倍、出力で10倍安価です。
この比較におけるDeepSeek側については、DeepSeek V4-Pro 75%値下げが恒久化をご覧ください。これら2つの記事は補完的なものであり、いずれも今週の中国ラボによるフロンティア層モデルの恒久的な値下げについて取り上げています。
3つのワークロード、3つの新しい費用
新しい恒久料金を使用した3つの具体的なケース:
1. 企業PDFに対する長文ドキュメントRAG。 1日あたり50,000クエリ、クエリあたり800Kトークンのコンテキスト、1Kトークンの回答。以前のMiMo V2.5長文コンテキスト層(推定100万トークンあたり50ドルの実効料金):月額約60,000ドル。新しい一律料金:月額約1,225ドル。削減額:月額58,775ドル。
2. コードレビューエージェント。 1日あたり5,000プルリクエスト、30Kトークンのリポジトリコンテキスト、2Kトークンのコメント出力。以前のGPT-5.5の月額費用:約5,250ドル。新しいMiMo V2.5:約510ドル。削減額:月額4,740ドル。
3. カスタマーサポートチャットボット。 1日あたり200,000ターン、4Kトークンのシステムプロンプト、300トークンの応答。以前のClaude Opus 4.7の月額費用:約11,250ドル。新しいMiMo V2.5:約805ドル。削減額:月額10,445ドル。
ワークロード1は、MiMo V2.5が他と一線を画す点です。この値下げ以前は、長文コンテキストのジョブはどのフロンティアAPIでも法外な費用がかかっていました。もはやそうではありません。以前は要約ツールやチャンキングパイプラインに送られていた同じドキュメントを、トークン予算のやりくりをすることなく、モデルにそのまま渡せるようになりました。
キャッシュヒットに関する短い注意
キャッシュされた入力料金(100万トークンあたり0.20ドル)は、キャッシュミス料金(1.00ドル)の5分の1です。これはDeepSeekの120:1の比率よりも小さいキャッシュ割引ですが、安定したシステムプロンプトを再利用するエージェントにとっては依然として意味があります。
具体的な例を挙げます。アシスタントが6,000トークンのシステムプロンプトを使用し、1日あたり80,000回のチャットターンを処理し、平均的なユーザーメッセージが250入力トークン、平均的な応答が600出力トークンだとします。
- キャッシュヒットなしの場合:80,000ターン × 6,250入力 × $1.00 / 1,000,000 = 入力のみで1日あたり500ドル。
- システムプロンプトのプレフィックスで60%のキャッシュヒットがあった場合:80,000 × (250 × $1.00 + 6,000 × (0.6 × $0.20 + 0.4 × $1.00)) / 1,000,000 = 1日あたり約271ドル。46%の削減。
これはDeepSeekが提供する88%のキャッシュ効果ではありませんが、入力だけで1日500ドルかかるワークロードの場合、半額はかなりの金額です。システムプロンプトを固定し、取得されたコンテキストを安定的に並べ替え、リクエストごとのタイムスタンプをプレフィックスに挿入しないようにしましょう。他の場所でキャッシュヒットを得るためのルールは、ここでも同様に適用されます。
MiMo V2.5が適切な場合とそうでない場合
新しい料金体系により、MiMo V2.5は2つのワークロードクラスでデフォルトの選択肢となり、1つのワークロードクラスでは不適切な選択肢となります。
適切な場合:
- 長文ドキュメントRAG、コードベースエージェント、リポジトリ全体の変更。 自然に200Kトークン以上のコンテキストに収まるものすべて。一律料金と1Mウィンドウは、安価なティアでは他に類を見ません。
- 大量のドキュメント処理。 料金は予測可能であり、キャッシュ料金(100万トークンあたり0.20ドル)により、同じプレフィックスを低コストでバッチ処理できます。プロンプトキャッシュがLLMのパフォーマンスを向上させコストを削減する方法で、プロバイダー間のキャッシュメカニズムを確認してください。
不適切な場合:
- レイテンシが重要なインタラクティブチャット。 MiMo V2.5 Proは、最速のファーストトークンモデルではありません。タイプアヘッド、オートコンプリート、または1秒未満のチャットには、DeepSeek V4-FlashまたはGemini 3.5 Flashが、同様のコストでより良いレイテンシプロファイルを提供します。
注意点:
- データレジデンシー。 中国にあるXiaomiのインフラを経由して呼び出しが行われます。DeepSeekと同じ調達上の検討事項があります。
- 信頼性。 XiaomiのファーストパーティAPIは、米国でホストされているフロンティアモデルよりも運用履歴が短いです。SLAに裏打ちされた本番環境では、OpenRouterまたは他のアグリゲーターを経由させてください。
- 関数呼び出しの同等性。 スキーマレベルではOpenAI互換ですが、ストリーミングツール引数や並列ツール呼び出しに関するエッジケースがあります。出荷前にテストしてください。
V2.5の前提となるV2-Proのローンチコンテキストについては、Xiaomiが独自のAIモデルをリリース、OpenRouterで無料をご覧ください。無料ティアの導入については、Xiaomi MiMo Orbit無料100Tトークンプログラムで資格と登録方法を説明しています。
2026年のLLM価格競争の現状
MiMo V2.5は、わずか1週間のうちに中国のラボがフロンティア層モデルに対して行った2回目の恒久的な値下げです。DeepSeekは5月22日にV4-Proを定価の4分の1で恒久化しました。Kimi K2は第1四半期に先に値下げを行いました。OpenAI O3は2月に80%値下げしました。パターンは明確です。
- 中国のラボは価格で競争しています。 これらの値下げはプロモーションではなく、構造的なものです。
- 米国のラボは機能とバンドルで競争しています。 OpenAIとAnthropicはフラッグシップ層の価格を維持し、プレミアムを正当化するために機能(思考モード、MCPサーバー、エージェントワークフロー)を出荷しています。
- Artificial Analysisによると、ほとんどのコーディングおよび推論タスクで、MiMo V2.5の公開ベンチマークはGPT-5.5と1桁台のパーセンテージポイント差に収まっており、ベンチマークの差は非常に小さいため、ほとんどのワークロードで再テストを行うべきです。
この全体像の残りの部分については、以下をご覧ください。
- DeepSeek V4-Proの恒久的な値下げでは、同様の中国ラボの動きを取り上げています。
- Kimi K2 APIの料金では、2026年の3番目の主要な中国製モデルの値下げについて詳しく説明しています。
- OpenAI O3の値下げでは、2月の米国の対応を取り上げています。
- Gemini 3.0 APIのコストでは、Googleのティア戦略をマッピングしています。
- Claude APIの全コスト内訳では、Opus、Sonnet、Haikuがどのように位置付けられるかを詳しく説明しています。MiMo-7Bは異なるニッチに属します。MiMo-7B-RLのベンチマークでXiaomiの小型モデルラインナップをご覧ください。
これがあなたの構築にどう影響するか
MiMo V2.5の値下げはマーケティング戦略ではありません。これは1Mコンテキスト層の構造的な再価格設定であり、値下げは恒久的なものです。もしコストを理由に長文ドキュメントRAG、リポジトリ全体のコードエージェント、または200Kトークン以上のコンテキストを必要とするワークロードを延期していたのであれば、前四半期に見積もった予算は、今四半期の必要量を桁違いに過大評価している可能性があります。
具体的な次の3つのステップ:
- トークンボリュームで上位3つのワークロードを取り出し、新しい一律料金で再計算してください。長文コンテキストを使用しているものは驚くべき結果になるでしょう。
- MiMo V2.5 Proと現在のモデルに対して、同じプロンプトを使用して100サンプル評価を実行してください。ほとんどのチームでは、トラフィックの70%から85%で品質帯が許容できることがわかります。
- Apidog回帰テストスイートをセットアップすることで、次回の値下げがあったとしても(間違いなくあります)、評価に数週間ではなく数時間で済むようになります。
価格の下限が再び動きました。それに合わせて構築しましょう。
