أطلقت بايدو ERNIE 5.1 في 9 مايو 2026، والرقم الرئيسي يصعب تجاهله: نموذج Mixture-of-Experts يمتلك ما يقرب من ثلث إجمالي معلمات ERNIE 5.0، وحصل على **المركز الرابع عالميًا في لوحة صدارة Arena Search** والأول بين النماذج الصينية بنتيجة 1,223.
إنها النسخة الأولى من عائلة ERNIE التي تتنافس فيها بايدو بشكل علني في استخدام الأدوات ذاتية التشغيل (agentic tool use)، والكتابة الإبداعية الطويلة، والاستدلال ضد Gemini 3.1 Pro و DeepSeek-V4-Pro، ولم يعد الأمر يقتصر على المهام باللغة الصينية فقط. إذا كنت تبني باستخدام Apidog وكنت تنتظر نموذجًا صينيًا رائدًا يمكنك إدخاله في مكدس عامل ذكي (agent stack) دون الحاجة إلى بصمة 70 مليار معلمة، فإن هذا الإصدار يستحق نظرة متأنية.
يشرح هذا الدليل ما هو ERNIE 5.1، وما الذي تغير تحت الغطاء، وكيف تُقارن المعايير بـ DeepSeek-V4-Pro و Gemini 3.1 Pro، وموقع النموذج إذا كنت تستخدم بالفعل DeepSeek V4 أو Kimi K2.6 في الإنتاج.
TL;DR: ERNIE 5.1 في فقرة واحدة
ERNIE 5.1 هو نموذج MoE نصي فقط تم تدريبه بتكلفة تقارب 6% من تكلفة التدريب المسبق للنماذج الرائدة المشابهة. يبلغ إجمالي المعلمات حوالي ثلث إجمالي معلمات ERNIE 5.0، والمعلمات النشطة لكل تمريرة أمامية تبلغ حوالي النصف. حصل على 1,223 نقطة في لوحة صدارة Arena Search (الرابع عالميًا، والأول في الصين)، وتفوق على DeepSeek-V4-Pro في معايير τ³-bench و SpreadsheetBench-Verified الذاتية (agentic benchmarks)، وحقق 99.6 في AIME26 مع استخدام الأدوات. الوصول متاح حاليًا عبر واجهة دردشة ERNIE، وساحة لعب ERNIE 5.1 في Baidu AI Studio، وواجهة برمجة تطبيقات Qianfan.

لماذا يهم هذا الإصدار
تبرز ثلاثة أشياء، ولا يمثل أي منها "بايدو أطلقت نموذجًا آخر".
1. **نسبة التكلفة إلى الجودة.** تشغيل تدريب مسبق بتكلفة تقارب 6% من تكلفة النماذج المماثلة هو رقم يعيد ضبط توقعات التسعير في جميع أنحاء الصناعة. إذا تمكنت بايدو من تقديم هذا عبر Qianfan بجزء بسيط مما تتقاضاه النماذج المغلقة الرائدة، فإن تسعير واجهات برمجة التطبيقات اللاحقة سيتبع ذلك.
2. **تصميم MoE مرن على ثلاثة محاور.** توجه معظم نماذج MoE عبر العرض (أي الخبراء يتم تفعيلهم) وأحيانًا العمق (تخطي الطبقات). تدعي بايدو أن ERNIE 5.1 يوجه عبر **العمق، العرض، والندرة** في آن واحد، وهي الطريقة التي قلصوا بها النموذج دون فقدان درجات استخدام الأدوات الذاتية (agentic tool-use). هذا أقرب إلى فلسفة التصميم في DeepSeek-V3.x منه إلى نموذج MoE التقليدي على غرار GShard.
3. **القدرة الذاتية (Agentic capability) هي العنوان الرئيسي، وليست ملاحظة سفلية.** تم وضع ERNIE 5.0 كنموذج للمعرفة والكتابة الإبداعية. يسوق ERNIE 5.1 صراحة "قدرات ذاتية على قدم المساواة مع أفضل النماذج في العالم" ويأتي مع ساحة لعب Baidu AI Studio مضبوطة لعروض استخدام الأدوات. هذا تحول استراتيجي.

المعايير، جنبًا إلى جنب
هنا ما نشرته بايدو، مع مقارنته بأقرب نقاط المقارنة العامة.
| المعيار | ERNIE 5.1 | ما يختبره | أقرب منافس |
|---|---|---|---|
| لوحة صدارة Arena Search | 1,223 (الرابع عالميًا، الأول في الصين) | الأسئلة والأجوبة المتعلقة بالبحث بتقييم بشري | Gemini 3.1 Pro, GPT-5.x |
| τ³-bench | يتفوق على DeepSeek-V4-Pro | استخدام الأدوات الذاتية، متعدد الأدوار | DeepSeek-V4-Pro |
| SpreadsheetBench-Verified | يتفوق على DeepSeek-V4-Pro | مهام جداول البيانات الواقعية | DeepSeek-V4-Pro |
| AIME26 (مع الأدوات) | 99.6 | رياضيات المسابقات مع مفسر الأكواد | GPT-5.x, Gemini 3.1 Pro |
| GPQA | “يقارب النماذج الرائدة مغلقة المصدر” | أسئلة وأجوبة علمية بمستوى الدراسات العليا | Claude Sonnet 4.6 |
| MMLU-Pro | “يقارب النماذج الرائدة مغلقة المصدر” | معرفة واسعة | جميع النماذج الرائدة |
بعض التحذيرات الصادقة. تعتمد درجات Arena على مزيج المطالبات ومجموعة المصوتين، ومن المرجح أن تكون المطالبات المائلة نحو اللغة الصينية مفيدة هنا. درجة AIME26 مع الأدوات معززة أيضًا بالأدوات؛ لم يتم الكشف عن رقم AIME الخاص بالاستدلال الخالص. يوصف الكتابة الإبداعية بأنها "تقارب Gemini 3.1 Pro" بدلاً من مطابقتها. ومع ذلك، فإن نتائج τ³-bench و SpreadsheetBench هي التي يجب الانتباه إليها. كلاهما ذاتي التشغيل (agentic)، وكلاهما يتم صيانته خارجيًا، وكلاهما كان صعبًا تاريخيًا التلاعب به.
ما نعرفه عن البنية
كشفت بايدو عن معلومات أقل مما كشفت عنه DeepSeek لسلسلة أوراقها البحثية V3، ولكن هذا ما يؤكده منشور الإصدار والمنشورات المجاورة:
- **إجمالي المعلمات:** حوالي ثلث ERNIE 5.0
- **المعلمات النشطة لكل رمز:** حوالي نصف ERNIE 5.0
- **التوجيه:** مرن على العمق والعرض والندرة (MoE ثلاثي المحاور)
- **تكلفة التدريب المسبق:** ~6% من "النماذج المشابهة"
- **النمطية (Modality):** نص فقط عند الإطلاق (لا رؤية، لا صوت)
- **اللغات:** تتوفر نسخ صينية وإنجليزية
لم يتم الكشف عن طول السياق، وعدد المعلمات الدقيق، وميزانية رموز التدريب. إذا كنت قد بنيت باستخدام نماذج MoE الصينية مثل GLM 5.1 من قبل، فتوقع مساحة تطوير مماثلة.

ما لا يمكنك فعله مع ERNIE 5.1 (بعد)
تجدر الإشارة إلى ذلك حتى لا تصمم شيئًا حوله وتندم لاحقًا.
- **لا يوجد إدخال صور.** ERNIE 5.1 نصي فقط. لسير عمل بايدو متعدد الوسائط، لا يزال يتعين عليك استخدام ERNIE-VL أو نموذج رؤية خارجي.
- **لا يوجد إدخال أو إخراج صوتي.** لا يوجد كلام أصلي، لا يوجد صوت في الوقت الفعلي.
- **لا يوجد إطار سياق منشور.** حتى تؤكد بايدو الرقم، تعامل مع حالات الاستخدام للمستندات الطويلة بحذر.
- **لا توجد أوزان HuggingFace.** هذا نموذج مستضاف فقط. إذا كان النشر المحلي (on-prem) مهمًا، فأنت تبحث عن DeepSeek V4 محليًا أو نموذج لغة كبير محلي (local LLM) بدلاً من ذلك.
كيف يقارن ERNIE 5.1 بالنماذج الصينية الرائدة
إذا كنت تختار بالفعل بين DeepSeek و Kimi و GLM و Qwen، فإليك النموذج الذهني السريع.
- **اختر ERNIE 5.1 عندما** تحتاج إلى استخدام قوي للأدوات الذاتية (agentic tool-use) بالإضافة إلى إجابات معززة بالبحث باللغتين الصينية أو الإنجليزية، وتريد أرخص منحنى تسعير على جانب السحابة الصينية.
- **اختر DeepSeek V4 عندما** تحتاج إلى أوزان مفتوحة، أو نشر محلي، أو أقوى درجة استدلال خالص في الرياضيات الصعبة بدون أدوات.
- **اختر Kimi K2.6 عندما** تحتاج إلى نوافذ سياق طويلة لسير العمل المعتمد على المستندات.
- **اختر GLM 5.1 عندما** تحتاج إلى نموذج عام متوازن ولديك بالفعل Z.ai أو Zhipu في مكدسك.
هذا ليس تصنيفًا صارمًا؛ بل يتعلق بالمفاضلة التي تتناسب مع عبء عملك. قم بإجراء تقييماتك الخاصة على شريحة من 50 مطالبة قبل الالتزام.
أين يمكنك تجربة ERNIE 5.1 اليوم
ثلاثة مسارات، بترتيب الصعوبة:
- **ernie.baidu.com**: واجهة المستخدم للدردشة للمستهلكين. مجانية، لا تتطلب مفتاح API، منطقة الصين. الأفضل لتجربة الكتابة الإبداعية والاستدلال.
- **ساحة لعب ERNIE 5.1 في Baidu AI Studio**: ساحة لعب مستضافة مع عروض توضيحية لاستدعاء الأدوات مجهزة مسبقًا. جيدة للتجارب الذاتية قبل الالتزام بعمل واجهة برمجة التطبيقات.
- **Qianfan API**: نقطة نهاية المطورين. شكل طلب متوافق مع OpenAI، مصادقة Bearer-token. تجد الشرح العملي الكامل في منشورنا المصاحب كيفية استخدام واجهة برمجة تطبيقات ERNIE 5.1.
إذا كنت تقوم بتقييم العديد من موفري النماذج الصينيين بالتوازي، فإن Apidog هي أنظف طريقة لإدارة المفاتيح، وحفظ هياكل الطلبات لكل موفر، ومقارنة الاستجابات جنبًا إلى جنب دون كتابة نصوص مؤقتة.
التسعير والإطلاق
أعلنت بايدو أن ERNIE 5.1 سيتم إطلاقه عبر **أكثر من 10 منصات إنتاج إبداعي** في الأسابيع التي تلي الإطلاق. لم يتم ذكر التسعير العام لكل رمز (per-token pricing) على Qianfan في منشور الإصدار؛ بناءً على ادعاء تكلفة التدريب المسبق الذي يبلغ حوالي 6% وقائمة أسعار Qianfan التاريخية لبايدو، توقع أسعار إدخال في نفس نطاق ERNIE 4.5 Turbo أو أقل. تحقق دائمًا من وحدة تحكم Qianfan المباشرة قبل تحديد الأرقام داخليًا.
كيف يجب على المطورين التفكير في ERNIE 5.1
ثلاث توصيات ملموسة إذا كنت تقرر ما إذا كنت ستدمجه في مكدسك.
1. اختبره مقابل تقييمك الذاتي (agentic eval) الخاص بك، وليس المعيار العام. يعتبر τ³-bench إشارة جيدة ولكنه ليس عبء عملك. قم ببناء تقييم من 20-50 حالة يعكس أنماط استخدامك الحقيقية للأدوات، ثم قارن ERNIE 5.1 بنموذجك الحالي. يشرح اختبار نماذج اللغة الكبيرة كواجهات برمجة تطبيقات إحدى الطرق للقيام بذلك باستخدام Apidog.
2. تعامل مع النموذج كرهان على السحابة الصينية. Qianfan مستضاف في الصين. إذا كانت قواعد إقامة بياناتك تقول "لا بنية تحتية لجمهورية الصين الشعبية"، فهذا غير ممكن بغض النظر عن المعايير.
3. راقب إعلان التسعير. ادعاء تكلفة التدريب المسبق البالغة ~6% هو الرقم الأكثر إثارة للاهتمام في الإصدار. إذا قامت بايدو بتمرير ذلك إلى واجهة برمجة التطبيقات (API)، فإن الحد الأدنى لسعر النموذج الصيني بأكمله سينخفض، مما يجبر DeepSeek و Zhipu و Moonshot على الاستجابة.
الأسئلة المتكررة
**هل ERNIE 5.1 مفتوح المصدر؟** لا. ERNIE 5.1 هو نموذج مستضاف فقط يمكن الوصول إليه من خلال واجهة دردشة بايدو، و Baidu AI Studio، وواجهة برمجة تطبيقات Qianfan. لا توجد أوزان عامة على HuggingFace في وقت كتابة هذا التقرير.
**هل يدعم ERNIE 5.1 إدخال الصور أو الرؤية؟** لا. ERNIE 5.1 نصي فقط عند الإطلاق. تتعامل عائلة ERNIE-VL من بايدو مع مهام الرؤية. إذا كنت بحاجة إلى نموذج صيني متعدد الوسائط واحد، فابحث عن Qwen 3.5 Omni بدلاً من ذلك.
**ما هو طول السياق؟** لم تنشر بايدو رقمًا محددًا لإطار السياق في منشور الإصدار. حتى يؤكدوا ذلك، صمم سير عمل المستندات الطويلة بشكل دفاعي وقم بتقسيم المدخلات.
**هل يمكنني استخدام ERNIE 5.1 من خارج الصين؟** يمكن الوصول إلى واجهة الدردشة وواجهة برمجة تطبيقات Qianfan من معظم المناطق، ولكن زمن الاستجابة والتحقق من الحساب يختلفان. لا تزال بعض ميزات المؤسسات تتطلب رقم هاتف بري رئيسي أو ترخيص عمل. يغطي الدليل المصاحب كيفية استخدام واجهة برمجة تطبيقات ERNIE 5.1 سير الوصول بالتفصيل.
**هل ERNIE 5.1 أفضل من DeepSeek-V4-Pro؟** على τ³-bench و SpreadsheetBench-Verified، تقول بايدو نعم. فيما يتعلق بالوصول إلى الأوزان المفتوحة، لا. في معايير الرياضيات الخاصة بالاستدلال الخالص بدون استخدام الأدوات، لا تقدم الأرقام العامة إجابة واضحة. الموقف الصادق: يستهدفان نماذج نشر مختلفة قليلاً.
هل أنت مستعد للبدء في البناء؟ قم بتنزيل Apidog واستورد مواصفات Qianfan OpenAPI لاختبار ERNIE 5.1 جنبًا إلى جنب مع نموذجك الحالي في مساحة عمل واحدة.
