انخفض سعر واجهة برمجة التطبيقات Xiaomi MiMo V2.5 إلى سعر ثابت قدره 1 دولار لكل مليون رمز إدخال و 3 دولارات لكل مليون رمز إخراج في 27 مايو 2026، وقد جعل الفريق السعر الجديد دائمًا. لقد اختفت الطبقة القديمة ذات السياق الطويل، حيث كانت المطالبات التي تتجاوز 256 ألف رمز تحمل مضاعفًا كبيرًا على السعر الأساسي. الآن سعر واحد، بغض النظر عن طول السياق. بالنسبة لمعظم أعباء العمل، العنوان الرئيسي هو جملة واحدة: MiMo V2.5 هو أحد أرخص ثلاثة نماذج بسياق 1 مليون قيد الإنتاج، ويبقى كذلك.
ملخص سريع
- تسعير Xiaomi MiMo V2.5 الدائم اعتبارًا من 27 مايو 2026: 1.00 دولار للإدخال، 3.00 دولارات للإخراج، 0.20 دولار للرموز المخزنة مؤقتًا لكل مليون رمز، مع نافذة سياق بحجم 1 مليون رمز.
- ادعاء "خصم يصل إلى 99%" حقيقي على طبقة السياق الطويل. كان الجدول السابق يتصاعد بشكل كبير بعد 256 ألف رمز إدخال. يلغي السعر الثابت الجديد المضاعف.
- حصل عملاء خطة الرموز (Token Plan) على زيادة في الحصة تتراوح من 5x إلى 8x وإعادة تعيين كامل للرصيد المستخدم ضمن فترة صلاحيتهم.
- التخفيض دائم، وليس ترويجيًا. يقول الإشعار الرسمي لشاومي "تجديد دائم لنظام تسعير النموذج بالكامل".
- السياق: شاومي هي ثاني مختبر صيني يجري تخفيضًا دائمًا على مستوى الطبقة الرائدة هذا الأسبوع. جعلت DeepSeek نموذج V4-Pro دائمًا بسعر ربع سعر القائمة قبل ثلاثة أيام.
ما الذي تغير في 27 مايو 2026
يوضح إشعار تحديث الأسعار الرسمي من شاومي ثلاثة تغييرات. دخلت التغييرات الثلاثة حيز التنفيذ في الساعة 00:00 بتوقيت بكين يوم 27 مايو، وهو ما يوافق الساعة 16:00 بالتوقيت العالمي المنسق (UTC) يوم 26 مايو.

1. تسعير موحد عبر نوافذ السياق. استخدم جدول MiMo V2.5 القديم أسعارًا متدرجة: سعر أساسي للمطالبات حتى 32 ألف رمز إدخال، ومضاعف للنطاق من 32 ألف إلى 256 ألف، وسعر أكثر حدة فوق 256 ألف. يحتوي الجدول الجديد على رقم واحد لكل نوع رمز. تتوقف تطبيقات السياق الطويل عن دفع ضريبة السياق الطويل.
2. دائم، وليس ترويجيًا. يستخدم الإشعار عبارة "تخفيض دائم في الأسعار" مرتين وعبارة "تجديد دائم لنظام تسعير النموذج بالكامل" مرة واحدة. لا يوجد تاريخ انتهاء. لا يوجد بند للتراجع. عاملها على أنها السعر الرسمي الجديد.
3. إعادة تعيين مكافآت خطة الرموز (Token Plan). إذا كنت مشتركًا في خطة رموز (نظام الحصة المدفوعة مسبقًا من شاومي)، فقد زاد رصيد ائتمانك من 5 إلى 8 مرات وتم استرداد كل رصيد استهلكته بالفعل ضمن فترة صلاحيتك. لم يتم تمديد فترة الصلاحية نفسها، لذا حصلت الخطط الحالية على مكاسب مالية إضافية ولكن ليس وقتًا أطول.

ينطبق ادعاء العنوان الرئيسي "خصم يصل إلى 99%" على نطاق السياق الطويل تحديدًا. كان السعر السابق لـ 256 ألف رمز إدخال أو أكثر مرتفعًا بما يكفي لدرجة أن تسويته إلى 1 دولار/مليون يؤدي إلى تخفيض بنسبة تزيد عن 90%. بالنسبة لأعباء العمل التي كانت ضمن الطبقة الأساسية، فإن التخفيض أصغر ولكنه لا يزال جوهريًا.
ورقة الأسعار الدائمة الجديدة
الأسعار لكل مليون رمز، بالدولار الأمريكي، سارية المفعول فورًا وبشكل دائم:
| النموذج | الإدخال | الإخراج | المخزن مؤقتًا | السياق |
|---|---|---|---|---|
| MiMo V2.5 Pro | $1.00 | $3.00 | $0.20 | 1 مليون رمز |
| MiMo V2 Flash | ~$0.10 | ~$0.40 | $0.02 | 256 ألف رمز |
بعض التفاصيل التي لا توضحها الطاولة:
- سعر التخزين المؤقت (0.20 دولار/مليون لـ V2.5 Pro) هو 5 أضعاف سعر الإدخال. هذه نسبة أسوأ من نسبة DeepSeek البالغة 120:1 بين عدم إصابة الإدخال وإصابة الإدخال. لا يزال التخزين المؤقت لشاومي مفيدًا للمطالبات النظامية المتكررة، لكن الوفورات أقل من حيث القيمة المطلقة.
- نافذة السياق بحجم 1 مليون رمز هي الجزء الذي لا تبرزه معظم المقالات. تتوقف معظم النماذج الرائدة المستضافة في الولايات المتحدة عند 200 ألف إلى 400 ألف. يستوعب MiMo V2.5 Pro المستند بالكامل.
- يشير الإشعار إلى متغيرات V2.5 Omni و TTS لكنه لا يفصلها. تحقق منها بشكل منفصل على المنصة.
للاطلاع على تسعير V2-Pro الأقدم كنقطة مرجعية، راجع دليل تسعير واستخدام API لـ MiMo V2-Pro و Omni.
ما يقدمه MiMo V2.5 بخلاف الأسعار الأرخص
إعلان 27 مايو هو حدث تسعير، لكن V2.5 نفسه يمثل أيضًا ترقية مهمة عن V2-Pro الذي تم إطلاقه في أبريل. ثلاثة تغييرات تستحق الملاحظة:
- سياق عملي أطول. يحتفظ V2.5 Pro بالنافذة النظرية التي تبلغ مليون رمز، لكن شاومي عززت جودة الاسترجاع في النطاق من 200 ألف إلى 800 ألف حيث تتدهور معظم نماذج السياق الطويل. تحافظ دقة "الإبرة في كومة القش" على نسبة تزيد عن 95% حتى 800 ألف رمز.
- امتثال أفضل لتنسيق استدعاء الأدوات. كان لدى V2-Pro مشكلات معروفة في استدعاءات الأدوات المتوازية التي تعيد JSON مشوهًا داخل الاستجابات المتدفقة. يقلل V2.5 من هذه الأعطال، وإن لم يكن إلى الصفر. خطط للتحقق من صحة مخطط JSON على أي حال.
- مجموعة بيانات تدريب محدثة. تم تدريب V2.5 باستخدام بيانات حتى الربع الأول من عام 2026. تقع المراجع وقطع المعرفة قبل V2-Pro بحوالي ثلاثة أشهر.
لا يمثل أي من هذه المعايير عناوين رئيسية، لكنها التغييرات التي تظهر في عمليات النشر الإنتاجية الحقيقية. عند إقران الأسعار الأرخص بنافذة السياق الأطول والموثوقة، يصبح لديك خيار لم يكن موجودًا لعمل المستندات الطويلة الجاد قبل 27 مايو.
كيف يقارن MiMo V2.5 ببقية المجال
المقارنة المثيرة للاهتمام ليست بين V2.5 ونسخته القديمة. بل هي مقارنته بخيارات API الأخرى من الفئة الرائدة التي ستصدر في مايو 2026:
| النموذج | الإدخال (دولار/مليون رمز) | الإخراج (دولار/مليون رمز) | السياق |
|---|---|---|---|
| Xiaomi MiMo V2.5 Pro | $1.00 | $3.00 | 1 مليون |
| DeepSeek V4-Pro | $0.435 | $0.87 | 128 ألف |
| GPT-5.5 | $5.00 | $30.00 | 200 ألف |
| Claude Opus 4.7 | $3.00 | $15.00 | 200 ألف |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | 1 مليون |
ثلاث نقاط رئيسية:
- لا يزال DeepSeek V4-Pro أرخص من MiMo V2.5 على أساس كل رمز. أرخص بحوالي 2.3 مرة على الإدخال و 3.5 مرة على الإخراج. إذا كان معيار التكلفة لكل رمز هو الوحيد لديك، فـ DeepSeek يفوز.
- يتفوق MiMo V2.5 في أعباء العمل ذات السياق الذي يبلغ 1 مليون رمز. Gemini 3.5 Flash هو الخيار الآخر الوحيد الذي يدعم سياق 1 مليون رمز في الجدول، وهو أغلى 1.5 مرة على الإدخال و 3 مرات أغلى على الإخراج.
- MiMo V2.5 أرخص 5 مرات من GPT-5.5 على الإدخال و 10 مرات أرخص على الإخراج، مع أداء معياري مماثل وفقًا لـ Artificial Analysis.
للاطلاع على جانب DeepSeek من هذه المقارنة، راجع تخفيض سعر DeepSeek V4-Pro بنسبة 75% أصبح دائمًا. المقالتان قراءات مكملة. كلاهما يغطي تخفيضات هذا الأسبوع الدائمة على مستوى الطبقة الرائدة من المختبرات الصينية.
ثلاثة أعباء عمل، ثلاث فواتير جديدة
ثلاث حالات ملموسة باستخدام الأسعار الدائمة الجديدة:
1. استرجاع وتوليد معزز (RAG) للمستندات الطويلة عبر ملفات PDF الخاصة بالشركات. 50,000 استعلام/يوم، سياق 800 ألف رمز لكل استعلام، إجابات 1 ألف رمز. طبقة السياق الطويل القديمة لـ MiMo V2.5 (معدل فعال مقدر بـ 50 دولار/مليون): حوالي 60,000 دولار/شهر. السعر الثابت الجديد: حوالي 1,225 دولار/شهر. الوفورات: 58,775 دولار/شهر.
2. وكيل مراجعة الأكواد. 5,000 طلب سحب/يوم، سياق مستودع 30 ألف رمز، إخراج تعليق 2 ألف رمز. الفاتورة الشهرية القديمة لـ GPT-5.5: حوالي 5,250 دولارًا. MiMo V2.5 الجديد: حوالي 510 دولارات. الوفورات: 4,740 دولارًا/شهر.
3. روبوت الدردشة لدعم العملاء. 200,000 دورة/يوم، مطالبة نظامية 4 آلاف رمز، استجابات 300 رمز. الفاتورة الشهرية القديمة لـ Claude Opus 4.7: حوالي 11,250 دولارًا. MiMo V2.5 الجديد: حوالي 805 دولارات. الوفورات: 10,445 دولارًا/شهر.
العبء العملي رقم 1 هو حيث يتميز MiMo V2.5 عن البقية. كانت مهام السياق الطويل باهظة الثمن بشكل كبير على كل واجهة برمجة تطبيقات (API) رائدة قبل هذا التخفيض. لم تعد كذلك الآن. يمكن الآن إرسال نفس المستندات التي كانت تُرسل إلى ملخصات وخطوط أنابيب التجزئة إلى النموذج بالكامل، دون أي تلاعب بميزانية الرموز.
ملاحظة قصيرة حول إصابات التخزين المؤقت (Cache Hits)
سعر الإدخال المخزن مؤقتًا البالغ 0.20 دولار/مليون أرخص 5 مرات من سعر عدم إصابة التخزين المؤقت البالغ 1.00 دولار. هذا خصم أصغر للتخزين المؤقت من نسبة DeepSeek البالغة 120:1، لكنه لا يزال ذا معنى لأي وكيل يعيد استخدام مطالبة نظامية مستقرة.
مثال عملي. لنفترض أن مساعدك يستخدم مطالبة نظامية مكونة من 6,000 رمز ويتعامل مع 80,000 دورة دردشة يوميًا، بمتوسط رسالة مستخدم 250 رمز إدخال ومتوسط استجابة 600 رمز إخراج:
- بدون إصابات التخزين المؤقت: 80,000 دورة × 6,250 إدخال × 1.00 دولار / 1,000,000 = 500 دولار يوميًا على الإدخال وحده.
- مع 60% إصابات تخزين مؤقت على بادئة المطالبة النظامية: 80,000 × (250 × 1.00 دولار + 6,000 × (0.6 × 0.20 دولار + 0.4 × 1.00 دولار)) / 1,000,000 = حوالي 271 دولارًا يوميًا. تخفيض بنسبة 46%.
هذا ليس الـ 88% التي يوفرها التخزين المؤقت لـ DeepSeek، ولكن على عبء عمل يصل إلى 500 دولار يوميًا على الإدخال، فإن خصم النصف يمثل مالاً حقيقيًا. ثبّت المطالبة النظامية، ورتب السياق المسترجع بشكل ثابت، ولا تحقن طوابع زمنية لكل طلب في البادئة. نفس القواعد التي تحقق إصابات التخزين المؤقت في كل مكان آخر تنطبق هنا أيضًا.
متى يكون MiMo V2.5 الخيار الصحيح، ومتى لا يكون كذلك
يجعل التسعير الجديد MiMo V2.5 الخيار الافتراضي لفئتين من أعباء العمل وخيارًا سيئًا لواحدة.
الخيار الصحيح:
- RAG للمستندات الطويلة، وكلاء قاعدة الأكواد، إعادة هيكلة المستودعات بالكامل. أي شيء يتناسب بشكل طبيعي مع سياق >200 ألف رمز. التسعير الثابت بالإضافة إلى نافذة 1 مليون رمز لا مثيل لهما في الفئة الرخيصة.
- معالجة المستندات ذات الحجم الكبير. التسعير قابل للتنبؤ به، ويسمح لك السعر المخزن مؤقتًا (0.20 دولار/مليون) بتجميع البادئات المتطابقة بتكلفة منخفضة. راجع كيف يعزز التخزين المؤقت للمطالبات أداء نماذج LLM ويقلل التكاليف لآليات التخزين المؤقت عبر المزودين.
خيار سيء:
- الدردشة التفاعلية الحساسة للكمون. MiMo V2.5 Pro ليس الأسرع في إخراج الرموز الأولى. بالنسبة للإكمال التلقائي أو الدردشة في أقل من ثانية، فإن DeepSeek V4-Flash أو Gemini 3.5 Flash يقدمان ملفات تعريف كمون أفضل بتكلفة مماثلة.
تحذيرات:
- إقامة البيانات. تمر المكالمات عبر البنية التحتية لشاومي في الصين. نفس محادثة المشتريات كما هو الحال مع DeepSeek.
- الموثوقية. تتمتع واجهة برمجة التطبيقات (API) الخاصة بشاومي بتاريخ تشغيلي أقصر من النماذج الرائدة المستضافة في الولايات المتحدة. للإنتاج المدعوم باتفاقية مستوى الخدمة (SLA)، قم بالتوجيه عبر OpenRouter أو أي مجمع آخر.
- تكافؤ استدعاء الوظائف. متوافق مع OpenAI على مستوى المخطط، مع حالات خاصة حول وسيطات الأدوات المتدفقة واستدعاءات الأدوات المتوازية. اختبر قبل النشر.
للاطلاع على سياق إطلاق V2-Pro الذي يمهد لـ V2.5، راجع شاومي أطلقت للتو نموذج الذكاء الاصطناعي الخاص بها، وهو مجاني على OpenRouter. وللتسجيل في الطبقة المجانية، يغطي برنامج Xiaomi MiMo Orbit المجاني لـ 100 ألف رمز الأهلية والتسجيل.
اختبار MiMo V2.5 باستخدام Apidog
توافق المنصة مع OpenAI جيد، وليس مثاليًا. تحقق من تكاملك قبل تحويل حركة مرور الإنتاج.

يتيح لك Apidog توجيه طلب إكمال الدردشة (Chat Completions) إلى https://platform.xiaomimimo.com/v1 باستخدام مفتاح API الخاص بـ MiMo، ثم:
- سجل الاستجابات الذهبية من V2.5 Pro وأعد تشغيلها عند كل تغيير في المطالبة حتى تظهر الانحرافات قبل المستخدمين.
- تحقق من صحة أشكال
tool_callsباستخدام تأكيدات مخطط JSON. تُظهر وسيطات الوظائف المتدفقة عادةً نقاط ضعف التوافق مع OpenAI. - قم بإجراء مقارنات جنبًا إلى جنب مع نموذجك الحالي (GPT-5.5، Claude، DeepSeek V4-Pro) باستخدام نفس دفعة الإدخال باستعمال سيناريوهات اختبار Apidog.
قم بتنزيل Apidog، استورد مخطط OpenAI Chat Completion، غير عنوان URL الأساسي، وسيكون لديك نظام اختبار V2.5 يعمل في أقل من عشر دقائق. نفس سير العمل الذي أوصينا به في كيفية استخدام DeepSeek V4 API.
كيف تتشكل حرب أسعار نماذج اللغات الكبيرة (LLM) لعام 2026
MiMo V2.5 هو ثاني تخفيض دائم على مستوى الطبقة الرائدة من مختبر صيني في أسبوع واحد. جعلت DeepSeek نموذج V4-Pro دائمًا بسعر ربع سعر القائمة في 22 مايو. خفضت Kimi K2 في وقت سابق من الربع الأول. انخفض سعر OpenAI O3 بنسبة 80% في فبراير. النمط واضح:
- تتنافس المختبرات الصينية على السعر. هذه التخفيضات ليست إعلانات ترويجية. إنها هيكلية.
- تتنافس المختبرات الأمريكية على القدرات والحزم. تحافظ OpenAI و Anthropic على أسعار فئتها الرائدة وتقدم ميزات (أوضاع التفكير، خوادم MCP، سير عمل الوكلاء) لتبرير السعر المميز.
- فجوة المعيار صغيرة بما يكفي بحيث يجب على معظم أعباء العمل إعادة الاختبار. تضع المعايير العامة MiMo V2.5 ضمن نقاط مئوية أحادية الرقم من GPT-5.5 في معظم مهام البرمجة والاستدلال وفقًا لـ Artificial Analysis.
لبقية هذه الصورة:
- تخفيض سعر DeepSeek V4-Pro الدائم يغطي الخطوة المماثلة من المختبر الصيني.
- تسعير API لـ Kimi K2 يستعرض التخفيض الصيني الكبير الثالث لعام 2026.
- انخفاض أسعار OpenAI O3 يغطي الاستجابة الأمريكية في فبراير.
- تكلفة Gemini 3.0 API ترسم استراتيجية جوجل للطبقات.
- التحليل الكامل لتكلفة Claude API يستعرض مكانة Opus و Sonnet و Haiku. MiMo-7B يقع في مكانة مختلفة؛ راجع معايير MiMo-7B-RL لجانب النماذج الصغيرة من تشكيلة شاومي.
أين يترك هذا مشروعك
تخفيض MiMo V2.5 ليس حيلة تسويقية. إنه إعادة تسعير هيكلية لطبقة السياق التي تبلغ 1 مليون رمز، والتخفيض دائم. إذا كنت تؤجل RAG المستندات الطويلة، أو وكلاء الأكواد على مستوى المستودع، أو أي عبء عمل يتطلب سياقًا يزيد عن 200 ألف رمز لأسباب تتعلق بالتكلفة، فمن المحتمل أن الميزانية التي قدرتها في الربع الماضي تبالغ في تقدير حاجة هذا الربع بمقدار كبير.
ثلاث خطوات عملية تالية:
- اسحب أهم ثلاثة أعباء عمل لديك حسب حجم الرموز وأعد تسعيرها بالسعر الثابت الجديد. ستفاجئك تلك التي تعمل بسياقات طويلة.
- قم بإجراء تقييم بـ 100 عينة لـ V2.5 Pro ونموذجك الحالي باستخدام مطالبات متطابقة. تجد معظم الفرق أن نطاق الجودة مقبول لـ 70% إلى 85% من حركة المرور.
- قم بإعداد مجموعة اختبار الانحدار Apidog بحيث يستغرق تقييم تخفيض الأسعار التالي، وسيكون هناك تخفيض، ساعات بدلاً من أسابيع.
تحركت أرضية الأسعار مرة أخرى. ابنِ وفقًا لذلك.
