خفضت المختبرات الصينية أسعار واجهات برمجة تطبيقات LLM ست مرات في النصف الأول من عام 2026، وتم الإعلان عن ثلاث من هذه التخفيضات كدائمة. يكلف DeepSeek V4-Pro الآن 0.87 دولار لكل مليون رمز إخراج. قامت Xiaomi MiMo V2.5 بتوحيد فئة السياق الطويل الخاصة بها إلى 3 دولارات للإخراج. يأتي Qwen3 Max من Alibaba بسعر 3.90 دولارات. يحافظ Kimi K2.6 من Moonshot على الحد الأدنى لتكلفة "الإصابة بالذاكرة المؤقتة" عند 0.07 دولار. يبلغ سعر GLM-5 من Zhipu 3.20 دولارات للإخراج. فيما يلي تفاصيل الأسعار الكاملة لأفضل خمس واجهات برمجة تطبيقات رائدة من الصين في مايو 2026، مع ملاحظات القدرات ومصفوفة للمشترين في النهاية حتى تتمكن من اختيار الأنسب لحمل عملك.
باختصار
- الأرخص لكل رمز (إخراج): DeepSeek V4-Pro بسعر 0.87 دولار/مليون رمز إخراج. حوالي 34 ضعفًا أقل من GPT-5.5.
- الأرخص بسياق 1 مليون: Xiaomi MiMo V2.5 Pro بسعر 3 دولارات/مليون رمز إخراج، بسعر ثابت بغض النظر عن طول الإدخال.
- أفضل توازن بين السعر والجودة للإنتاج العام: Alibaba Qwen3 Max بسعر 3.90 دولارات/مليون رمز إخراج، سياق 262 ألف.
- أدنى حد أدنى لتكلفة "الإصابة بالذاكرة المؤقتة" (للمطالبات النظامية الطويلة): Moonshot Kimi K2.6 بسعر 0.07 دولار/مليون رمز مخزن مؤقتًا.
- أعباء العمل التي تتطلب الكثير من الاستدلال: Zhipu GLM-5 بسعر 3.20 دولارات/مليون رمز إخراج، سياق 200 ألف، الأقوى في سلسلة التفكير المنظمة.
- تتنافس جميع المختبرات الخمسة على السعر. تعتبر ثلاثة منها (DeepSeek، MiMo، Kimi) تخفيضاتها لعام 2026 دائمة.
كيف تطورت حرب أسعار LLM الصينية في عام 2026
بدأ النمط في الربع الرابع من عام 2025 وتسارع في الربع الثاني من عام 2026. فيما يلي جدول زمني تقريبي:
- الربع الرابع من 2025: إطلاق DeepSeek V3.2 بسعر 0.28 دولار/مليون رمز إدخال، متجاوزًا أسعار نماذج الذكاء الاصطناعي الرائدة الأمريكية بفارق كبير. تبع ذلك Kimi K2.6 بأسعار متدرجة تعتمد على السياق ومعدل "إصابة بالذاكرة المؤقتة" منخفضًا للغاية في الصناعة يبلغ 0.07 دولار/مليون رمز.
- مارس 2026: كشفت Xiaomi عن MiMo V2-Pro على OpenRouter بأسعار تنافسية ولكنها تعتمد على الفئات.
- أبريل 2026: إطلاق DeepSeek V4 بخصم ترويجي بنسبة 75% كان من المقرر أن ينتهي في 31 مايو.
- 22 مايو 2026: أعلنت DeepSeek أن خصم الـ 75% دائم. يظل V4-Pro بسعر 0.435 دولار/0.87 دولار إلى أجل غير مسمى. التفاصيل الكاملة هنا.
- 27 مايو 2026: جعلت Xiaomi أسعار MiMo V2.5 دائمة عند 1 دولار/3 دولارات، ملغية مضاعف السياق الطويل. المزيد حول تخفيض MiMo.
التخفيضات ليست عشوائية. فكل مختبر يستهدف فجوة تنافسية محددة. DeepSeek يستهدف التكلفة الأولية للرمز الواحد. MiMo يستهدف أعباء العمل ذات السياق الطويل التي تستبعدها النماذج الأخرى بسبب السعر. Qwen وGLM تحافظان على أسعار متوسطة وتتنافسان على القدرة بدلاً من ذلك. Kimi تتنافس على سير عمل الوكلاء والبرمجة عبر الحد الأدنى لتكلفة "الإصابة بالذاكرة المؤقتة".
نظرة سريعة: أفضل 5 واجهات برمجة تطبيقات LLM صينية في مايو 2026
| النموذج | الإدخال ($/مليون رمز) | الإخراج ($/مليون رمز) | إصابة بالذاكرة المؤقتة | السياق | الأفضل في |
|---|---|---|---|---|---|
| DeepSeek V4-Pro | 0.435 دولار | 0.87 دولار | 0.003625 دولار | 128 ألف | الأرخص لكل رمز، البرمجة |
| Xiaomi MiMo V2.5 Pro | 1.00 دولار | 3.00 دولارات | 0.20 دولار | 1 مليون | RAG للمستندات الطويلة، وكلاء المستودعات |
| Alibaba Qwen3 Max | 0.78 دولار | 3.90 دولارات | 0.156 دولار | 262 ألف | توازن الإنتاج |
| Moonshot Kimi K2.6 | 0.16–2.00 دولار (متدرج) | ~2.50 دولار | 0.07 دولار | 128 ألف | مطالبات النظام الطويلة، وكلاء البرمجة |
| Zhipu GLM-5 | 1.00 دولار | 3.20 دولارات | (محدد من قبل المزود) | 200 ألف | الاستدلال المنظم |
بعض التفاصيل التي يجب الانتباه إليها في الجدول:
- DeepSeek وMiMo بسعر ثابت. لا يزال كل مختبر آخر في هذه المجموعة يستخدم شكلاً من أشكال التسعير المتدرج أو مضاعف السياق. التسعير الثابت يجعل تخطيط القدرة الإنتاجية قابلاً للتنبؤ. يمكن أن يفاجئك التسعير المتدرج في الأشهر ذات السياق الطويل.
- تختلف معدلات "الإصابة بالذاكرة المؤقتة" بشكل كبير. يمثل سعر 0.07 دولار لـ Kimi K2.6 و 0.003625 دولار لـ DeepSeek V4-Pro حالتين استثنائيتين. لأي وكيل لديه مطالبة نظامية ثابتة، هذه هي المعدلات التي يجب أن تستخدمها كمعيار، وليس سعر القائمة لـ "خطأ الذاكرة المؤقتة". راجع الغوص العميق في التخزين المؤقت للمطالبات لفهم الآليات.
- تنقسم نوافذ السياق بشكل حاد. يمنحك MiMo V2.5 وحده مليون رمز في الفئة الرخيصة. الأكبر التالي في هذه المجموعة هو Qwen3 Max عند 262 ألف. إذا كانت حمولة عملك تحتاج إلى أكثر من 300 ألف رمز، فإن MiMo ليس خيارًا اختياريًا.
أدناه: يحصل كل نموذج على قسم خاص به يوضح التسعير والقدرة وحمل العمل الذي يتفوق فيه.
DeepSeek: الأرخص لكل رمز
النماذج: V4-Pro (0.435 دولار إدخال / 0.87 دولار إخراج / 0.003625 دولار "إصابة بالذاكرة المؤقتة"، سياق 128 ألف)، V4-Flash (0.14 دولار / 0.28 دولار).
يعتبر V4-Pro من DeepSeek هو الحد الأدنى للأسعار في فئة النماذج الصينية الرائدة. وضع التخفيض الدائم في 22 مايو رموز الإخراج بسعر 0.87 دولار/مليون رمز، وهو ما يقل بنحو 34 مرة عن GPT-5.5 و 17 مرة عن Claude Opus 4.7. تعد "إصابة الذاكرة المؤقتة" بسعر 0.003625 دولار/مليون رمز هي أدنى سعر مباشر من أي مختبر رئيسي. تم التأكيد مقابل صفحة الأسعار الرسمية لـ DeepSeek.
متى يتفوق V4-Pro:
- أعباء العمل كثيفة الإخراج (توليد الأكواد، سلاسل الوكلاء، أدوات المحتوى) حيث تنفق أكثر من 70% من ميزانية الرموز الخاصة بك على الإخراج.
- أي شيء يحتوي على مطالبة نظامية ثابتة تتراوح من 5 آلاف إلى 10 آلاف رمز. تؤدي "إصابات الذاكرة المؤقتة" إلى خفض تكلفة الإدخال الفعالة إلى ما يقرب من الصفر.
- الإنتاج الحساس للتكلفة حيث يمكنك استيعاب 3 إلى 7 نقاط من فجوة الأداء مقارنة بـ GPT-5.5.
متى لا يناسب:
- أعباء العمل ذات المستندات الطويلة (أكثر من 128 ألف سياق). يعتبر MiMo V2.5 الخيار الأرخص من حيث التكلفة المطلقة حتى بمعدلات أعلى لكل رمز لأن DeepSeek لا يمكنه استيعاب المطالبة.
- الدردشة الحساسة لزمن الاستجابة في الوقت الفعلي. V4-Pro هو نموذج "يفكر" بوقت استجابة للرمز الأول يتراوح من 600 إلى 900 مللي ثانية.
لتغطية أعمق: تخفيض سعر DeepSeek V4-Pro الدائم، ما هو DeepSeek V4، كيفية استخدام واجهة برمجة تطبيقات DeepSeek V4.
Xiaomi MiMo: الخيار الأرخص بسياق 1 مليون
النماذج: MiMo V2.5 Pro (1.00 دولار إدخال / 3.00 دولارات إخراج / 0.20 دولار ذاكرة مؤقتة، سياق 1 مليون)، MiMo V2 Flash (~0.10 دولار / ~0.40 دولار، سياق 256 ألف).
أدى تخفيض Xiaomi الدائم في 27 مايو إلى توحيد تسعير MiMo V2.5 عبر نوافذ السياق. اختفت فئات السياق الطويل القديمة، التي كانت تفرض مضاعفات حادة فوق 256 ألف رمز إدخال. يطبق التسعير الجديد نفس معدل 1 دولار / 3 دولارات سواء أرسلت 5 آلاف أو 950 ألف رمز. يصف إشعار تحديث الأسعار الرسمي التخفيض بأنه "دائم".
متى يتفوق V2.5 Pro:
- RAG للمستندات الطويلة، تحليل الأكواد على مستوى المستودع، تلخيص المستندات المتعددة، أي عبء عمل يتناسب مع سياق من 300 ألف إلى 1 مليون رمز.
- معالجة المستندات ذات الحجم الكبير حيث تكون قابلية التنبؤ بالأسعار أكثر أهمية من الحد الأدنى المطلق.
متى لا يناسب:
- الدردشة ذات المطالبات القصيرة. V2.5 Pro أغلى من DeepSeek V4-Pro في أي طول سياق يمكن لـ DeepSeek التعامل معه.
- أعباء العمل الحساسة لزمن الاستجابة. توجد نماذج صينية أسرع لميزانيات الاستجابة في أقل من ثانية.
تمنح نافذة السياق البالغة 1 مليون بالإضافة إلى معدل الذاكرة المؤقتة التنافسي لـ MiMo مكانًا فريدًا هيكليًا في السوق. حتى يمد DeepSeek السياق إلى ما بعد 128 ألف أو توحد Alibaba أسعار Qwen، يمتلك MiMo الربع الرخيص والطويل.
لتغطية أعمق: كم يكلف استخدام Xiaomi MiMo V2.5 في عام 2026، تسعير MiMo V2-Pro و Omni وكيفية استخدام واجهة برمجة التطبيقات، برنامج Xiaomi MiMo Orbit المجاني لـ 100 تيرابايت من الرموز.
Alibaba Qwen: حصان العمل الإنتاجي
النماذج: Qwen3 Max (0.78 دولار إدخال / 3.90 دولارات إخراج / 0.156 دولار ذاكرة مؤقتة، سياق 262 ألف). Qwen 3.7 Max الأحدث بسعر 2.50 دولار/مليون رمز إدخال مع سياق 1 مليون في مرحلة الطرح المبكر. تم التحقق من الأسعار مقابل ورقة Qwen3 Max من pricepertoken.
Qwen3 Max هو النموذج الرائد لـ Alibaba والأكثر انتشارًا من النماذج الصينية في الإنتاج العالمي. يقع عند نقطة سعر تنافسية ولكن ليست على مستوى الحد الأدنى: 1.8 مرة DeepSeek V4-Pro على الإدخال، و 4.5 مرات على الإخراج. يدفع السعر الإضافي مقابل أوسع نظام بيئي للأدوات (دمج بروتوكول Anthropic، توافق OpenAI، استضافة Alibaba Cloud للمؤسسات) ونافذة سياق 262 ألفًا تتعامل مع معظم أعباء عمل المستندات في المؤسسات.
متى يتفوق Qwen3 Max:
- الإنتاج متعدد اللغات. تميل مجموعة بيانات تدريب Qwen بشدة نحو لغات الماندرين واللغات الآسيوية، مما يجعله الأقوى أداءً لغير الإنجليزية في هذه المجموعة.
- سيناريوهات الامتثال للمؤسسات. خيارات اتفاقية مستوى الخدمة للمؤسسات ومناطق السحابة من Alibaba هي الأكثر نضجًا من أي مختبر صيني.
- أعباء العمل التي تحتاج إلى سياق من 200 ألف إلى 262 ألف ولكن لا تبرر نطاق جودة MiMo الممتاز.
متى لا يناسب:
- أعباء العمل كثيفة الإخراج والحساسة للتكلفة. بسعر 3.90 دولارات/مليون رمز إخراج، تدفع 4.5 مرة سعر DeepSeek. إذا كان حمل عملك يتحمل جودة DeepSeek، فقم بالتبديل.
لتغطية أعمق: Qwen 3 مقابل OpenAI و DeepSeek: مقارنة تقنية متعمقة لمطوري واجهات برمجة التطبيقات.
Moonshot Kimi: المتخصص في البرمجة
النماذج: Kimi K2.6 مع تسعير إدخال متدرج حسب السياق (من 0.16 دولار إلى 2.00 دولار/مليون رمز عبر نطاقات 8 آلاف، 32 ألف، 64 ألف، و 128 ألف)، حد أدنى لتكلفة "إصابة بالذاكرة المؤقتة" 0.07 دولار/مليون رمز، ومعدلات إخراج حوالي 2.50 دولار/مليون رمز في النطاق المتوسط.
Kimi K2.6 هو بطل "إصابات الذاكرة المؤقتة". يبلغ معدل 0.07 دولار/مليون رمز عند "الإصابة" هو أدنى رقم مباشر من أي مختبر رئيسي. وبالتزامن مع قدرات Kimi القوية في استدعاء الأدوات ودعم الوكلاء ذوي التشغيل الطويل، فإن K2.6 هو النموذج الذي يتفوق في سير العمل حيث تعيد استخدام مطالبة نظامية كبيرة عبر العديد من الدورات: وكلاء البرمجة، روبوتات الدردشة لدعم العملاء مع مطالبات شخصية ثابتة، مسارات استرجاع مع كتل سياق ثابتة.
متى يتفوق K2.6:
- وكلاء البرمجة (سير عمل بأسلوب Claude Code). يضمن الامتثال القوي لتنسيق استدعاء الأدوات وأدنى حد أدنى لتكلفة "إصابة بالذاكرة المؤقتة" أن تكون أنماط السياق المتكررة شبه مجانية.
- جلسات الدردشة طويلة الأمد حيث تكون مطالبة النظام وأمثلة قليلة الطلقات ثابتة.
متى لا يناسب:
- أعباء العمل المتقطعة والمتنوعة حيث تتغير البادئات مع كل طلب. يعني سعر الإدخال المتدرج أن مفاجآت طول السياق يمكن أن ترفع فاتورتك بشكل كبير.
- الميزانية القابلة للتنبؤ. تعني انتقالات الفئة عند 32 ألف، 64 ألف، و 128 ألف رمز إدخال أن نفس نوع الاستعلام يمكن أن يكلف 4 أضعاف في يوم طويل مقارنة بيوم قصير.
لتغطية أعمق: هل يستحق تسعير واجهة برمجة تطبيقات Kimi K2 الضجة حقًا للمطورين في عام 2026؟
Zhipu GLM: المنافس في الاستدلال
النماذج: GLM-5 (1.00 دولار إدخال / 3.20 دولارات إخراج، سياق 200 ألف)، GLM-5.1 (0.98 دولار / 3.08 دولارات، سياق 200 ألف). تم التحقق من الأسعار مقابل نظرة عامة على الأسعار الرسمية لـ Z.AI.
تم إطلاق GLM-5 من Zhipu بزيادة سعر 30% عن GLM-4.7 (خطوة مخالفة للاتجاه السائد في سوق يتسابق نحو القاع)، ثم أصدر GLM-5.1 بخصم هامشي. يعكس التسعير موقع Zhipu: ليس الأرخص، ولكنه الأقوى في الاستدلال المنظم ومهام "سلسلة التفكير".
متى يتفوق GLM-5:
- الرياضيات، الاستدلال الرسمي، مهام "سلسلة التفكير" المنظمة. يحتل GLM-5 الصدارة في العديد من المعايير من فئة GPQA بين النماذج الصينية الرائدة.
- أعباء العمل حيث تكون التكلفة الهامشية صغيرة مقارنة بتكلفة الإجابات الخاطئة (التحليل المالي، التلخيص القانوني، الاستدلال العلمي).
- سير عمل الوكلاء متعدد الخطوات التي تستفيد من تتبع الاستدلال النظيف.
متى لا يناسب:
- التطبيقات الحساسة للتكلفة. GLM-5 هو الخيار الأكثر تكلفة في هذه المجموعة على الإدخال والإخراج مجتمعين. إذا كانت التكلفة الأولية هي ما تحسّن من أجله، فابحث في مكان آخر.
- أعباء العمل التي لا تكافئ الاستدلال القوي. لتوليد المحتوى أو التلخيص المباشر، لا يستحق قسط GLM.
لتغطية أعمق: GLM-5 مقابل DeepSeek V3 مقابل GPT-5: السرعة، التكلفة، ومقارنة عملية للمطورين، GLM-5.1 مقابل Claude, GPT, Gemini, DeepSeek.
الأرخص لكل عبء عمل: مصفوفة للمشترين
بالنسبة لخمسة من أعباء العمل الإنتاجية الشائعة، إليك النموذج الفائز:
| عبء العمل | الفائز | السبب |
|---|---|---|
| توليد الأكواد (كثيف الإخراج) | DeepSeek V4-Pro | سعر 0.87 دولار/مليون رمز إخراج لا يُضاهى |
| RAG للمستندات الطويلة (سياق >300 ألف) | Xiaomi MiMo V2.5 Pro | الخيار الوحيد بسعر ثابت وسياق 1 مليون |
| وكيل برمجة بمطالبة نظامية ثابتة | Kimi K2.6 | أدنى حد أدنى لتكلفة "إصابة بالذاكرة المؤقتة" 0.07 دولار/مليون رمز |
| دعم العملاء متعدد اللغات | Alibaba Qwen3 Max | أقوى أداء لغير الإنجليزية |
| الرياضيات، الاستدلال الرسمي، التحليل المنظم | Zhipu GLM-5 | أفضل جودة في "سلسلة التفكير" |
ثلاثة أنماط مدمجة تستحق الإشارة إليها:
- توجيه بنموذجين. تقوم العديد من فرق الإنتاج بتوجيه 70 إلى 85% من حركة المرور إلى DeepSeek V4-Pro وتحافظ على نموذجها الثانوي في الطرف الخلفي الصعب. الوفورات كبيرة وتأثير الجودة صغير لمعظم أعباء العمل.
- تقسيم السياق الطويل. إذا كان عبء عملك ينقسم بين سياقات قصيرة وطويلة، فوجّه السياقات القصيرة إلى DeepSeek والطويلة إلى MiMo. ألم الفوترة الموحدة حقيقي، لكن فارق التكلفة كبير جدًا بحيث لا يمكن تجاهله.
- توحيد بادئات الذاكرة المؤقتة. بغض النظر عن النموذج الذي تختاره، راجع مطالبات نظامك. "إصابات الذاكرة المؤقتة" هي الفوز الرخيص الذي يبقى بغض النظر عن أي تبديل للنموذج.
ملاحظات الجودة والمعايير
ملاحظة حول الجودة، حيث أن التسعير لا يعني شيئًا إذا لم يستطع النموذج إنجاز المهمة.
وفقًا لـ Artificial Analysis، تتجمع النماذج الخمسة في هذه المقارنة ضمن 5 إلى 10 نقاط مئوية من بعضها البعض في معظم المعايير العامة. الفروق الجوهرية المثيرة للاهتمام:
- DeepSeek V4-Pro: قوي في البرمجة (SWE-bench Pro حوالي 55%) والاستدلال (GPQA حوالي 90%). فجوة طفيفة مقارنة بـ GPT-5.5 في مهام الوكلاء طويلة المدى.
- MiMo V2.5 Pro: قوي في استرجاع السياق الطويل (دقة إبرة تزيد عن 95% عند 800 ألف)، متوسط الأداء في البرمجة.
- Qwen3 Max: أفضل أداء لغير الإنجليزية، جودة إنتاج عامة قوية.
- Kimi K2.6: أقوى امتثال لتنسيق استدعاء الأدوات، خاصة لاستدعاء الأدوات المتوازية.
- GLM-5: أفضل جودة استدلال بـ "سلسلة التفكير" في المجموعة.
قم بتشغيل تقييمك الخاص بـ 100 عينة قبل الالتزام. المعايير العامة مفيدة توجيهيًا، ولكن الفجوة المهمة هي تلك المتعلقة بحركة المرور الخاصة بك.
اختبار النماذج الخمسة جميعها باستخدام Apidog
يتطلب نشر الإنتاج متعدد النماذج أداة اختبار متعددة النماذج. يتعامل Apidog مع جميع واجهات برمجة التطبيقات الصينية الخمسة من مساحة عمل واحدة لأن جميعها تقبل أجسام طلبات OpenAI Chat Completions، مع بعض الغرائب الطفيفة في التوافق. سير العمل:

- أنشئ بيئة واحدة لكل مزود في Apidog:
api.deepseek.com،platform.xiaomimimo.com، Alibaba Cloud Model Studio،api.moonshot.cnلـ Moonshot، وopen.bigmodel.cnلـ Zhipu. - استورد مخطط OpenAI Chat Completion مرة واحدة. بدّل عنوان URL الأساسي لكل بيئة.
- شغّل نفس سيناريو الاختبار عبر جميع النماذج الخمسة بنقرة واحدة. قارن الردود، والنتائج، وأزمنة الاستجابة.
- قم بتكوين التحقق من مخطط JSON مقابل أشكال
tool_callsلالتقاط غرائب تنسيق التدفق الفريدة لكل مزود.
حمّل Apidog، استورد حالات الاختبار الخاصة بك، وستحصل على مقارنة خمسية عاملة في أقل من خمس عشرة دقيقة. نفس سير العمل الذي نوصي به في الغوصات العميقة لكل نموذج: تخفيض DeepSeek V4-Pro الدائم، تكلفة MiMo V2.5، تسعير Kimi K2.
إلى أين تتجه حرب الأسعار التالية
تحرك الحد الأدنى للأسعار مرتين في مايو. ومن المرجح أن تكون هناك خطوتان أخريان قبل إغلاق الربع الثالث.
- استجابة Qwen. نادرًا ما كانت Alibaba هي السباقة في التخفيض، ولكنها تتبعها باستمرار في غضون أسابيع. توقع مراجعة لـ Qwen3 Max أو إعلان Qwen 3.8 بحلول يوليو.
- استجابة GLM. تبدو الزيادة بنسبة 30% في GLM-5 من Zhipu متناقضة بشكل متزايد. من المحتمل أن يكون هناك إصدار GLM-5.2 مع تخفيض هيكلي.
- تبسيط هيكل Kimi. يتلاشى تسعير السياق المتدرج. قد توحّد Moonshot سعر K2.6 ليتناسب مع هيكل MiMo.
اِبْنِ وفقًا لذلك. ثلاث خطوات تالية:
- راجع أفضل ثلاثة أعباء عمل لديك مقابل مصفوفة المشترين أعلاه. اختر واحدة لاختبار الهجرة هذا الأسبوع.
- ثبّت بادئات ذاكرة التخزين المؤقت لديك. هذا هو الفوز بغض النظر عن النموذج الذي تستقر عليه.
- قم بتوصيل مجموعة اختبار انحدار Apidog تشير إلى جميع المزودين الخمسة حتى تستغرق الجولة التالية من التخفيضات ساعات لتقييمها بدلاً من أسابيع.
الحد الأدنى للأسعار لم يتوقف عن الانخفاض بعد. ضع بنية نظامك في الاعتبار لما هو قادم.
