ما هو نموذج Kimi K2.6؟ شرح نموذج Moonshot AI المفتوح بـ 1 تريليون معلمة

Ashley Innocent

Ashley Innocent

21 أبريل 2026

ما هو نموذج Kimi K2.6؟ شرح نموذج Moonshot AI المفتوح بـ 1 تريليون معلمة

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

أطلقت Moonshot AI نموذج Kimi K2.6 بادعاء جريء: إنه أحدث ما توصلت إليه التقنيات في مجال البرمجة مفتوحة المصدر، والتنفيذ طويل الأمد، وأسراب الوكلاء. وتدعمه الأرقام: 80.2% على SWE-Bench Verified، و96.4% على AIME 2026، و90.5% على GPQA-Diamond، و73.1% على OSWorld-Verified. هذه ليست مقتطفات تسويقية؛ بل تأتي مباشرة من الإعلان الرسمي على kimi.

توضح هذه المقالة ماهية Kimi K2.6، وكيف يغير معمارية Agent Swarm ما يمكن لنموذج واحد فعله، وصورة المعيار مقابل GPT-5.4 وClaude 4.6، وأين يمكنك البدء في استخدامه اليوم.

💡
هل تريد اختبار Kimi K2.6 مقابل أعباء عمل واجهة برمجة التطبيقات الخاصة بك؟ يقوم Apidog بتهيئة نقطة نهاية Moonshot/Kimi المتوافقة مع OpenAI مسبقًا في مساحة عمل مرئية. قم بالاستيراد مرة واحدة، واحفظ رمز Bearer الخاص بك، وقم بتشغيل الدردشة المتدفقة، واستدعاءات الأدوات، وطلبات الرؤية مع سجل كامل. حمل Apidog مجانًا.
زر

ملخص (TL;DR)

Kimi K2.6 في فقرة واحدة

Kimi K2.6 هو نموذج Moonshot AI مفتوح المصدر من الجيل التالي، يركز على البرمجة المتطورة، والتنفيذ طويل الأمد، وأسراب الوكلاء. يعمل على kimi.com، وتطبيق Kimi، وKimi Code، وواجهة برمجة التطبيقات على platform.kimi.ai. إنه أول إصدار من سلسلة K يدفع سعة Agent Swarm إلى 300 وكيل فرعي و4,000+ خطوة متزامنة، مما يجعله قادرًا على جلسات عمل مستقلة تستمر أيامًا، لا ثوانٍ. إذا كنت معتادًا على كيفية تناسب النماذج الرائدة الأخرى مثل Qwen 3.6 (انظر دليل OpenRouter الخاص بنا) أو Qwen3.5-Omni مع سير عمل يعتمد على واجهة برمجة التطبيقات أولاً، فإن Kimi K2.6 يتناسب مع نفس الشكل بتركيز أقوى على الوكلاء.

صورة

نشرت Moonshot جدولًا كاملاً للمقاييس في إعلان Kimi K2.6. أبرز النقاط:

البرمجة

المعيار Kimi K2.6
SWE-Bench Verified 80.2%
SWE-Bench Multilingual 76.7%
SWE-Bench Pro 58.6%
Terminal-Bench 2.0 66.7%

يُطابق SWE-Bench Verified بنسبة 80.2% أداء Claude 4.6 أو يتجاوزه على نفس الاختبار، ويفعل ذلك بأوزان مفتوحة يمكنك تنزيلها. يُمثل Terminal-Bench 2.0 بنسبة 66.7% قفزة قدرها 15.9 نقطة عن K2.5، مما يدل على أن Moonshot ضاعفت جهودها في موثوقية أوامر الشيل ومعالجة الملفات.

استخدام الوكيل والأدوات

المعيار Kimi K2.6
HLE-Full (مع الأدوات) 54.0%
BrowseComp 83.2% (86.3% مع Agent Swarm)
DeepSearchQA (F1) 92.5%
Toolathlon 50.0%
Claw Eval (pass@3) 80.9%
OSWorld-Verified 73.1%

يضع HLE-Full بنسبة 54.0% نموذج K2.6 متفوقًا على GPT-5.4 (52.1%) وClaude 4.6 (53.0%) في هذا المعيار المحدد للتفكير بالإضافة إلى الأدوات. تعني OSWorld-Verified بنسبة 73.1% أن K2.6 يمكنه تشغيل بيئة سطح مكتب حقيقية لمهام على مستوى نظام التشغيل، وهو نفس المجال الذي يستهدفه استخدام الكمبيوتر في Claude Code.

التفكير والمعرفة

المعيار Kimi K2.6
AIME 2026 96.4%
HMMT 2026 (فبراير) 92.7%
GPQA-Diamond 90.5%
IMO-AnswerBench 86.0%

يُعد AIME 2026 بنسبة 96.4% شبه مثالي في معيار رياضيات تنافسي كان صعبًا للغاية على النماذج قبل عام واحد فقط.

الرؤية

المعيار Kimi K2.6
MathVision (مع بايثون) 93.2%
V* (مع بايثون) 96.9%
MMMU-Pro 79.4%
CharXiv (RQ، مع بايثون) 86.7%

تُبرز النتائج التي تحمل علامة "مع بايثون" (with Python) كيف ترتبط الرؤية الآن باستخدام الأدوات: يقرأ K2.6 شكلًا، ويكتب كود بايثون، ويحسب الإجابة في نفس المسار.

سرب الوكلاء: القفزة الهيكلية

يُعد Agent Swarm التغيير المعماري الأبرز في K2.6. يوضحه مدونة Moonshot ببساطة: ينسق K2.6 ما يصل إلى 300 وكيل فرعي بأكثر من 4,000 خطوة منسقة، وهو توسع بمقدار 3 أضعاف عن 100 وكيل و1,500 خطوة في K2.5.

ثلاثة أنماط مهمة:

  1. تجزئة المهام غير المتجانسة. لا يستنسخ النموذج نفسه 300 مرة. بل يقسم المهمة إلى مهام فرعية بملفات مهارات مختلفة (برمجة، بحث، رؤية، تخطيط) ويوجه كل منها إلى المتخصص المناسب.
  2. الذكاء التركيبي. تتواصل الوكلاء الفرعيون عبر حالة مشتركة، مما ينتج عنه مخرجات مستندات، ومواقع ويب، وشرائح عرض، وجداول بيانات في جلسة واحدة. هذا قريب روحًا من كيفية تنظيم معماريات وكيل هيرميس لتنسيق الوكلاء المتعددين.
  3. تحويل المستند إلى مهارة. يصبح التحديد مهارة تحافظ على "الحمض النووي الهيكلي"، مما يعني أن النموذج يمكنه استيعاب مستند تصميم والتصرف كما لو كان لديه معرفة قبلية.

تجارب حقيقية من إعلان Kimi

ثلاثة أمثلة إثبات عمل:

إذا سبق لك وشاهدت وكيل برمجة يضيع المسار بعد 20 استدعاء لأداة، فإن هذه الأرقام تُقرأ بشكل مختلف. قانون التوسع المثير للاهتمام هنا ليس المعاملات؛ بل هو ساعات عمل الوكيل.

كيف تصمد المعمارية

مزيج الخبراء

K2.6 هو نموذج MoE بمعاملات تريليون (1T) مع 32 مليار معامل نشط لكل توكن. تحصل على قدرة من فئة النخبة بتكلفة استدلال أقرب إلى نموذج كثيف بحجم 32 مليار معامل. وينطبق نفس المقايضة كما هو الحال مع الإصدارات الأخرى من عائلة MoE مثل GLM-5V Turbo API؛ حيث يذهب معظم الجهد الهندسي إلى التوجيه.

سياق طويل: 262,144 توكن

نافذة السياق هي 262,144 توكن بالضبط (الرقم التقريبي الذي تشير إليه Moonshot). يصل الحد الأقصى لأطوال التوليد إلى 98,304 توكن لمهام التفكير. وهذا يكفي لتضمين:

أعادت Moonshot كتابة أجزاء من مكدس الانتباه لـ K2.6 للحفاظ على استقرار استدلال السياق الطويل حيث تدهور أداء K2.5.

أخذ العينات الافتراضي

توصي المدونة باستخدام المعلمات الافتراضية للحرارة (temperature) 1.0 وtop-p 1.0 لـ K2.6، وهو أمر جريء مقارنة بمعظم نماذج البرمجة. لا تتبع الافتراضات ذات الحرارة المنخفضة التي تراها في وثائق OpenAI أو Anthropic؛ فقد قام فريق Kimi بضبط K2.6 لإنتاج مخرجات موثوقة عند درجات حرارة أعلى.

مجموعات Claw: طبقة الوكلاء المتعددين فوق النموذج

مجموعات Claw هي معاينة بحثية في إعلان K2.6: نظام بيئي مفتوح حيث يعمل وكلاء وبشر متعددون على نفس المهمة عبر أجهزة الكمبيوتر المحمولة، والهواتف المحمولة، والسحابة. أربع قدرات:

يقيس سجل Claw Eval البالغ 80.9% (pass@3) مدى موثوقية K2.6 في العمل داخل هذه الطبقة. إذا كنت تفكر في فرق من الوكلاء المستقلين بالطريقة التي تصفها شركة وكيل الذكاء الاصطناعي Paperclip، فإن مجموعات Claw هي بنية جاهزة.

التطوير الموجه بالتصميم والوكلاء الاستباقيون

يأتي K2.6 مزودًا بقدرات توليد الواجهات الأمامية تتجاوز إكمال كود الدردشة. من المنشور الرسمي:

تعمل الوكلاء الاستباقيون على مدار الساعة طوال أيام الأسبوع داخل OpenClaw وHermes، حيث ينسقون تطبيقات متعددة في الخلفية. هذا هو نفس نمط "الوكيل لا ينام أبدًا" الذي تبني الفرق عليه حول Google Agent Smith ومكدسات مخصصة مثل بناء Claude Code الخاص بك.

Kimi K2.6 مقابل النماذج المغلقة الرائدة

من جدول المقارنة الرسمي:

المهمة K2.6 GPT-5.4 Claude 4.6 Gemini 3.1 K2.5
HLE-Full (أدوات) 54.0 52.1 53.0 51.4 50.2
BrowseComp 83.2 82.7 83.7 85.9 74.9
Terminal-Bench 2.0 66.7 65.4 65.4 68.5 50.8
SWE-Bench Pro 58.6 57.7 53.4 54.2 50.7

ثلاث نقاط رئيسية:

  1. **يفوز K2.6 أو يتعادل في ثلاث من أصل أربع مهام** في هذا الجدول، بما في ذلك التفوق على GPT-5.4 في HLE-Full وSWE-Bench Pro.
  2. **يتصدر Gemini 3.1 في Terminal-Bench وBrowseComp**، لذا لتصفح الويب أو موثوقية الأوامر الطرفية البحتة، لا يزال ضمن القائمة المختصرة.
  3. **يُشحن K2.6 بأوزان مفتوحة**، وهو ما لا تفعله أي من المنافسين المغلقين.

أين يتوفر Kimi K2.6

دردشة kimi.com

تُعد واجهة Kimi للمستهلكين أسرع طريقة لتجربة K2.6. قم بتسجيل الدخول، واختر K2.6 في محدد النموذج، وستحصل على الدردشة، ووضع الوكيل، وسرب الوكلاء، والرؤية، وتكامل أداة Kimi Code. راجع دليلنا المصاحب حول استخدام Kimi K2.6 مجانًا للحصول على التفاصيل.

تطبيق Kimi

يعكس تطبيق الهاتف المحمول (iOS، Android) تجربة الويب مع إدخال الصوت وإشعارات الدفع لمهام الوكيل طويلة الأمد.

Kimi Code

Kimi Code هو سطح البرمجة الأصلي للطرفية. إنه أقرب في الشعور إلى سير عمل Claude Code منه إلى نافذة الدردشة: يدير K2.6 نظام ملفاتك المحلي، ويقوم بالتعهيدات (commits)، والاختبارات، مع وجود Agent Swarm تحت الغطاء. إذا كنت تبحث عن وكلاء برمجة، فقارنه بـ Cursor Composer 2.

واجهة برمجة التطبيقات (API)

واجهة برمجة التطبيقات متوافقة مع OpenAI. عنوان URL الأساسي هو https://api.moonshot.ai/v1، ومعرفات النماذج هي kimi-k2.6 وkimi-k2.6-thinking. لقد كتبنا دليلًا كاملًا في كيفية استخدام واجهة برمجة تطبيقات Kimi K2.6، بما في ذلك المصادقة، والتدفق، واستدعاء الأدوات، والرؤية، والفيديو، واستدعاء سرب الوكلاء.

الأوزان المفتوحة على Hugging Face

تتوفر الأوزان الكاملة لـ K2.6 على Hugging Face على moonshotai/Kimi-K2.6 بموجب ترخيص MIT معدل. تتيح عمليات الكمّ المجتمعية (ubergarm GGUF، unsloth) تشغيله على أجهزتك الخاصة للفرق التي تمتلك وحدات معالجة رسوميات من فئة H100.

كيف تم تدريب K2.6 (ما كشفت عنه Moonshot)

لا ينشر إعلان Kimi K2.6 وصفة التدريب الكاملة، لكن إشارات المنتج تخبرك أين ذهب الجهد الهندسي:

إذا كنت تكتب استعراضًا لما يميز نموذجًا مفتوحًا جيدًا من عام 2026 عن نموذج رائع، فإن هذه النقاط الأربع تمثل معظم القصة.

من يجب أن يهتم

اختر Kimi K2.6 إذا كنت تبني

التزم بالنماذج المغلقة إذا كنت بحاجة إلى

كيف تختبر Kimi K2.6 في خمس دقائق باستخدام Apidog

بمجرد حصولك على مفتاح API من Moonshot/Kimi، يساعدك Apidog على الانتقال من الصفر إلى اختبار فعال في دقائق:

  1. أنشئ بيئة: BASE_URL = https://api.moonshot.ai/v1، KIMI_API_KEY = sk-....
  2. طلب جديد: POST {{BASE_URL}}/chat/completions.
  3. الرؤوس (Headers): Authorization: Bearer {{KIMI_API_KEY}}، Content-Type: application/json.
  4. الجسم (Body):
{
  "model": "kimi-k2.6",
  "messages": [{"role": "user", "content": "لخص إعلان Kimi K2.6."}],
  "stream": true
}
  1. انقر على إرسال (Send). شاهد الرموز تتدفق.

يتعامل Apidog أيضًا مع سجل الطلبات (إعادة تشغيل تسلسلات استدعاء الأدوات الفاشلة)، والتحقق من صحة المخطط مقابل مواصفات إكمال الدردشة الخاصة بـ OpenAI، والمشاركة الجماعية بمفاتيح لكل عضو، وتكامل VS Code للاختبار داخل المحرر. إذا كنت تستخدم Postman حاليًا، فإن دليلنا لاختبار واجهة برمجة التطبيقات بدون Postman في عام 2026 يوضح لك كيفية التبديل.

الأسئلة الشائعة

هل Kimi K2.6 مفتوح المصدر؟ الأوزان مفتوحة المصدر بموجب ترخيص MIT معدل (moonshotai/Kimi-K2.6). بيانات التدريب وكود التدريب ليسا عامين. وهذا يجعله "ذا أوزان مفتوحة" في الاستخدام الشائع.

كيف يقارن Kimi K2.6 بنسخة K2.5؟ قفزات كبيرة في جميع المجالات، وفقًا لجدول المعايير الرسمي: +3.8 نقطة في HLE-Full، +8.3 في BrowseComp، +15.9 في Terminal-Bench 2.0، +7.9 في SWE-Bench Pro، +20.5 في Claw Eval، وزيادة 3 أضعاف في قدرة Agent Swarm.

ما هي نافذة سياق Kimi K2.6؟ 262,144 توكن. يصل الحد الأقصى للتوليد لمهام التفكير إلى 98,304 توكنات.

هل يمكنني تشغيل Kimi K2.6 محليًا؟ نعم، مع أجهزة قوية. يتطلب نموذج MoE الكامل بحجم 1 تريليون معامل عقدًا متعددة لوحدات معالجة الرسوميات من فئة H100. تُناسب البنيات المكممة (4-بت، 3-بت) من مساهمي المجتمع إعدادات أصغر مع بعض فقدان الجودة. راجع دليل الوصول المجاني لخيارات الكمّ.

هل يدعم Kimi K2.6 استدعاء الأدوات؟ نعم. تتبع واجهة برمجة التطبيقات تنسيق استدعاء الأدوات الخاص بـ OpenAI. يتعامل Agent Swarm مع استدعاءات الأدوات المتوازية بشكل أصلي.

ما الفرق بين Kimi K2.6 وKimi K2.6 Thinking؟ K2.6 هو المتغير السريع للوكيل. يكشف K2.6 Thinking عن سلسلة واضحة من التفكير قبل الإجابة. استخدم Thinking لإثباتات الرياضيات، أو تصحيح الأخطاء الصعبة، أو التخطيط المعقد.

كيف أصل إلى Kimi K2.6 مجانًا؟ دردشة الويب kimi.com مجانية مع حصة يومية. لدى Cloudflare Workers AI طبقة مجانية. الاستضافة الذاتية من أوزان Hugging Face لا تتطلب تكلفة لكل توكن بمجرد امتلاكك للجهاز. تفصيل كامل في كيفية استخدام Kimi K2.6 مجانًا.

كيف يقارن Kimi K2.6 بالنماذج الأخرى ذات الأوزان المفتوحة؟ مقابل Qwen 3.6 وQwen3.5-Omni، يتصدر Kimi K2.6 في معايير البرمجة والوكلاء؛ ولا يزال Qwen يمتلك متغيرات أقوى متعددة اللغات وصغيرة الحجم. مقابل DeepSeek V3.x، يتميز K2.6 بتنسيق الوكلاء.

الملخص

Kimi K2.6 هو النموذج ذو الأوزان المفتوحة الأكثر جاهزية للإنتاج الذي تم إصداره حتى الآن للبرمجة القائمة على الوكلاء والعمل طويل الأمد. يتحد سرب الوكلاء المكون من 300 وكيل، والتنفيذ بـ4,000 خطوة، ونافذة سياق 262 ألف، والأوزان المفتوحة لجعلها أداة فريدة في تشكيلة النماذج الحالية. منشور إعلان Moonshot يصفه بأنه أحدث ما توصلت إليه التقنيات في أعمال الوكلاء مفتوحة المصدر، وتدعم المعايير العامة هذا الادعاء.

إذا كنت تقوم بتقييم النماذج لوكيل برمجة، أو مساعد بحث طويل الأمد، أو نظام متعدد الوكلاء، فإن Kimi K2.6 يجب أن يكون ضمن قائمتك المختصرة. احصل على مفتاح من platform.kimi.ai، افتح Apidog، وأرسل طلبك الأول. ثم تابع من خلال أدلتنا الأكثر تفصيلًا حول واجهة برمجة التطبيقات وطرق الوصول المجاني.

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات