أطلقت Moonshot AI نموذج Kimi K2.6 بادعاء جريء: إنه أحدث ما توصلت إليه التقنيات في مجال البرمجة مفتوحة المصدر، والتنفيذ طويل الأمد، وأسراب الوكلاء. وتدعمه الأرقام: 80.2% على SWE-Bench Verified، و96.4% على AIME 2026، و90.5% على GPQA-Diamond، و73.1% على OSWorld-Verified. هذه ليست مقتطفات تسويقية؛ بل تأتي مباشرة من الإعلان الرسمي على kimi.
توضح هذه المقالة ماهية Kimi K2.6، وكيف يغير معمارية Agent Swarm ما يمكن لنموذج واحد فعله، وصورة المعيار مقابل GPT-5.4 وClaude 4.6، وأين يمكنك البدء في استخدامه اليوم.
ملخص (TL;DR)
- الإصدار: Moonshot AI، أبريل 2026، مفتوح المصدر (الأوزان على Hugging Face، واجهة برمجة التطبيقات على platform.kimi.ai).
- المعمارية: نموذج خليط الخبراء (mixture-of-experts) بمعاملات تريليون (1T)، و32 مليار معامل نشط لكل توكن، وسياق بطول 262,144 توكن (256 ألف).
- الحد الأقصى للإخراج: يصل إلى 98,304 توكنات لمهام التفكير.
- سرب الوكلاء: ما يصل إلى 300 وكيل فرعي، و4,000+ خطوة منسقة لكل مهمة (3 أضعاف سعة K2.5).
- أهم المقاييس: SWE-Bench Verified بنسبة 80.2%، Terminal-Bench 2.0 بنسبة 66.7%، AIME 2026 بنسبة 96.4%، HLE-Full (أدوات) بنسبة 54.0%، OSWorld-Verified بنسبة 73.1%.
- الواجهات: دردشة kimi.com، تطبيق Kimi، Kimi Code، واجهة برمجة التطبيقات (API)، أوزان مفتوحة.
Kimi K2.6 في فقرة واحدة
Kimi K2.6 هو نموذج Moonshot AI مفتوح المصدر من الجيل التالي، يركز على البرمجة المتطورة، والتنفيذ طويل الأمد، وأسراب الوكلاء. يعمل على kimi.com، وتطبيق Kimi، وKimi Code، وواجهة برمجة التطبيقات على platform.kimi.ai. إنه أول إصدار من سلسلة K يدفع سعة Agent Swarm إلى 300 وكيل فرعي و4,000+ خطوة متزامنة، مما يجعله قادرًا على جلسات عمل مستقلة تستمر أيامًا، لا ثوانٍ. إذا كنت معتادًا على كيفية تناسب النماذج الرائدة الأخرى مثل Qwen 3.6 (انظر دليل OpenRouter الخاص بنا) أو Qwen3.5-Omni مع سير عمل يعتمد على واجهة برمجة التطبيقات أولاً، فإن Kimi K2.6 يتناسب مع نفس الشكل بتركيز أقوى على الوكلاء.

نشرت Moonshot جدولًا كاملاً للمقاييس في إعلان Kimi K2.6. أبرز النقاط:
البرمجة
| المعيار | Kimi K2.6 |
|---|---|
| SWE-Bench Verified | 80.2% |
| SWE-Bench Multilingual | 76.7% |
| SWE-Bench Pro | 58.6% |
| Terminal-Bench 2.0 | 66.7% |
يُطابق SWE-Bench Verified بنسبة 80.2% أداء Claude 4.6 أو يتجاوزه على نفس الاختبار، ويفعل ذلك بأوزان مفتوحة يمكنك تنزيلها. يُمثل Terminal-Bench 2.0 بنسبة 66.7% قفزة قدرها 15.9 نقطة عن K2.5، مما يدل على أن Moonshot ضاعفت جهودها في موثوقية أوامر الشيل ومعالجة الملفات.
استخدام الوكيل والأدوات
| المعيار | Kimi K2.6 |
|---|---|
| HLE-Full (مع الأدوات) | 54.0% |
| BrowseComp | 83.2% (86.3% مع Agent Swarm) |
| DeepSearchQA (F1) | 92.5% |
| Toolathlon | 50.0% |
| Claw Eval (pass@3) | 80.9% |
| OSWorld-Verified | 73.1% |
يضع HLE-Full بنسبة 54.0% نموذج K2.6 متفوقًا على GPT-5.4 (52.1%) وClaude 4.6 (53.0%) في هذا المعيار المحدد للتفكير بالإضافة إلى الأدوات. تعني OSWorld-Verified بنسبة 73.1% أن K2.6 يمكنه تشغيل بيئة سطح مكتب حقيقية لمهام على مستوى نظام التشغيل، وهو نفس المجال الذي يستهدفه استخدام الكمبيوتر في Claude Code.
التفكير والمعرفة
| المعيار | Kimi K2.6 |
|---|---|
| AIME 2026 | 96.4% |
| HMMT 2026 (فبراير) | 92.7% |
| GPQA-Diamond | 90.5% |
| IMO-AnswerBench | 86.0% |
يُعد AIME 2026 بنسبة 96.4% شبه مثالي في معيار رياضيات تنافسي كان صعبًا للغاية على النماذج قبل عام واحد فقط.
الرؤية
| المعيار | Kimi K2.6 |
|---|---|
| MathVision (مع بايثون) | 93.2% |
| V* (مع بايثون) | 96.9% |
| MMMU-Pro | 79.4% |
| CharXiv (RQ، مع بايثون) | 86.7% |
تُبرز النتائج التي تحمل علامة "مع بايثون" (with Python) كيف ترتبط الرؤية الآن باستخدام الأدوات: يقرأ K2.6 شكلًا، ويكتب كود بايثون، ويحسب الإجابة في نفس المسار.
سرب الوكلاء: القفزة الهيكلية
يُعد Agent Swarm التغيير المعماري الأبرز في K2.6. يوضحه مدونة Moonshot ببساطة: ينسق K2.6 ما يصل إلى 300 وكيل فرعي بأكثر من 4,000 خطوة منسقة، وهو توسع بمقدار 3 أضعاف عن 100 وكيل و1,500 خطوة في K2.5.
ثلاثة أنماط مهمة:
- تجزئة المهام غير المتجانسة. لا يستنسخ النموذج نفسه 300 مرة. بل يقسم المهمة إلى مهام فرعية بملفات مهارات مختلفة (برمجة، بحث، رؤية، تخطيط) ويوجه كل منها إلى المتخصص المناسب.
- الذكاء التركيبي. تتواصل الوكلاء الفرعيون عبر حالة مشتركة، مما ينتج عنه مخرجات مستندات، ومواقع ويب، وشرائح عرض، وجداول بيانات في جلسة واحدة. هذا قريب روحًا من كيفية تنظيم معماريات وكيل هيرميس لتنسيق الوكلاء المتعددين.
- تحويل المستند إلى مهارة. يصبح التحديد مهارة تحافظ على "الحمض النووي الهيكلي"، مما يعني أن النموذج يمكنه استيعاب مستند تصميم والتصرف كما لو كان لديه معرفة قبلية.
تجارب حقيقية من إعلان Kimi
ثلاثة أمثلة إثبات عمل:
- تحسين استدلال Qwen3.5-0.8B على Mac — أكثر من 12 ساعة من العمل المتواصل، أكثر من 4,000 استدعاء للأداة، 14 تكرارًا، رفع الإنتاجية من 15 إلى 193 توكن/ثانية (أسرع بنحو 20% من خط أساس LM Studio).
- ضبط محرك مالي أساسي للتبادل — 13 ساعة، أكثر من 1,000 استدعاء للأداة، أكثر من 4,000 سطر من الكود تم تعديلها، زيادة متوسطة في الإنتاجية بنسبة 185% (0.43 ← 1.24 ميجا/ثانية)، إنتاجية الأداء بنسبة 133% (1.23 ← 2.86 ميجا/ثانية).
- تشغيل مستقل للبنية التحتية لمدة 5 أيام — معالجة المهام متعددة الخيوط والاستجابة للحوادث بدون إشراف بشري.
إذا سبق لك وشاهدت وكيل برمجة يضيع المسار بعد 20 استدعاء لأداة، فإن هذه الأرقام تُقرأ بشكل مختلف. قانون التوسع المثير للاهتمام هنا ليس المعاملات؛ بل هو ساعات عمل الوكيل.
كيف تصمد المعمارية
مزيج الخبراء
K2.6 هو نموذج MoE بمعاملات تريليون (1T) مع 32 مليار معامل نشط لكل توكن. تحصل على قدرة من فئة النخبة بتكلفة استدلال أقرب إلى نموذج كثيف بحجم 32 مليار معامل. وينطبق نفس المقايضة كما هو الحال مع الإصدارات الأخرى من عائلة MoE مثل GLM-5V Turbo API؛ حيث يذهب معظم الجهد الهندسي إلى التوجيه.
سياق طويل: 262,144 توكن
نافذة السياق هي 262,144 توكن بالضبط (الرقم التقريبي الذي تشير إليه Moonshot). يصل الحد الأقصى لأطوال التوليد إلى 98,304 توكن لمهام التفكير. وهذا يكفي لتضمين:
- قاعدة بيانات كاملة متوسطة الحجم مع مساحة لمسار الوكيل
- وثيقة قانونية أو بحثية كاملة مع مساحة لأسئلة وأجوبة متعددة الأدوار
- سجل استدعاء أدوات متعدد الأيام لجلسات الوكلاء المستمرة
أعادت Moonshot كتابة أجزاء من مكدس الانتباه لـ K2.6 للحفاظ على استقرار استدلال السياق الطويل حيث تدهور أداء K2.5.
أخذ العينات الافتراضي
توصي المدونة باستخدام المعلمات الافتراضية للحرارة (temperature) 1.0 وtop-p 1.0 لـ K2.6، وهو أمر جريء مقارنة بمعظم نماذج البرمجة. لا تتبع الافتراضات ذات الحرارة المنخفضة التي تراها في وثائق OpenAI أو Anthropic؛ فقد قام فريق Kimi بضبط K2.6 لإنتاج مخرجات موثوقة عند درجات حرارة أعلى.
مجموعات Claw: طبقة الوكلاء المتعددين فوق النموذج
مجموعات Claw هي معاينة بحثية في إعلان K2.6: نظام بيئي مفتوح حيث يعمل وكلاء وبشر متعددون على نفس المهمة عبر أجهزة الكمبيوتر المحمولة، والهواتف المحمولة، والسحابة. أربع قدرات:
- مطابقة المهام الديناميكية بناءً على مجموعات أدوات متخصصة
- اكتشاف الأعطال مع إعادة تعيين المهام تلقائيًا
- النشر عبر الأجهزة
- نقاط التحقق التي يتدخل فيها البشر
يقيس سجل Claw Eval البالغ 80.9% (pass@3) مدى موثوقية K2.6 في العمل داخل هذه الطبقة. إذا كنت تفكر في فرق من الوكلاء المستقلين بالطريقة التي تصفها شركة وكيل الذكاء الاصطناعي Paperclip، فإن مجموعات Claw هي بنية جاهزة.
التطوير الموجه بالتصميم والوكلاء الاستباقيون
يأتي K2.6 مزودًا بقدرات توليد الواجهات الأمامية تتجاوز إكمال كود الدردشة. من المنشور الرسمي:
- توليد كامل المكدس بما في ذلك المصادقة وقواعد البيانات والمعاملات
- تكامل أدوات توليد الصور والفيديو ضمن مسارات الوكلاء
- رسوم متحركة تُشغل بالتمرير، وعناصر تفاعلية، ومخرجات جاهزة للإنتاج
تعمل الوكلاء الاستباقيون على مدار الساعة طوال أيام الأسبوع داخل OpenClaw وHermes، حيث ينسقون تطبيقات متعددة في الخلفية. هذا هو نفس نمط "الوكيل لا ينام أبدًا" الذي تبني الفرق عليه حول Google Agent Smith ومكدسات مخصصة مثل بناء Claude Code الخاص بك.
Kimi K2.6 مقابل النماذج المغلقة الرائدة
| المهمة | K2.6 | GPT-5.4 | Claude 4.6 | Gemini 3.1 | K2.5 |
|---|---|---|---|---|---|
| HLE-Full (أدوات) | 54.0 | 52.1 | 53.0 | 51.4 | 50.2 |
| BrowseComp | 83.2 | 82.7 | 83.7 | 85.9 | 74.9 |
| Terminal-Bench 2.0 | 66.7 | 65.4 | 65.4 | 68.5 | 50.8 |
| SWE-Bench Pro | 58.6 | 57.7 | 53.4 | 54.2 | 50.7 |
ثلاث نقاط رئيسية:
- **يفوز K2.6 أو يتعادل في ثلاث من أصل أربع مهام** في هذا الجدول، بما في ذلك التفوق على GPT-5.4 في HLE-Full وSWE-Bench Pro.
- **يتصدر Gemini 3.1 في Terminal-Bench وBrowseComp**، لذا لتصفح الويب أو موثوقية الأوامر الطرفية البحتة، لا يزال ضمن القائمة المختصرة.
- **يُشحن K2.6 بأوزان مفتوحة**، وهو ما لا تفعله أي من المنافسين المغلقين.
أين يتوفر Kimi K2.6
دردشة kimi.com
تُعد واجهة Kimi للمستهلكين أسرع طريقة لتجربة K2.6. قم بتسجيل الدخول، واختر K2.6 في محدد النموذج، وستحصل على الدردشة، ووضع الوكيل، وسرب الوكلاء، والرؤية، وتكامل أداة Kimi Code. راجع دليلنا المصاحب حول استخدام Kimi K2.6 مجانًا للحصول على التفاصيل.
تطبيق Kimi
يعكس تطبيق الهاتف المحمول (iOS، Android) تجربة الويب مع إدخال الصوت وإشعارات الدفع لمهام الوكيل طويلة الأمد.
Kimi Code
Kimi Code هو سطح البرمجة الأصلي للطرفية. إنه أقرب في الشعور إلى سير عمل Claude Code منه إلى نافذة الدردشة: يدير K2.6 نظام ملفاتك المحلي، ويقوم بالتعهيدات (commits)، والاختبارات، مع وجود Agent Swarm تحت الغطاء. إذا كنت تبحث عن وكلاء برمجة، فقارنه بـ Cursor Composer 2.
واجهة برمجة التطبيقات (API)
واجهة برمجة التطبيقات متوافقة مع OpenAI. عنوان URL الأساسي هو https://api.moonshot.ai/v1، ومعرفات النماذج هي kimi-k2.6 وkimi-k2.6-thinking. لقد كتبنا دليلًا كاملًا في كيفية استخدام واجهة برمجة تطبيقات Kimi K2.6، بما في ذلك المصادقة، والتدفق، واستدعاء الأدوات، والرؤية، والفيديو، واستدعاء سرب الوكلاء.
الأوزان المفتوحة على Hugging Face
تتوفر الأوزان الكاملة لـ K2.6 على Hugging Face على moonshotai/Kimi-K2.6 بموجب ترخيص MIT معدل. تتيح عمليات الكمّ المجتمعية (ubergarm GGUF، unsloth) تشغيله على أجهزتك الخاصة للفرق التي تمتلك وحدات معالجة رسوميات من فئة H100.
كيف تم تدريب K2.6 (ما كشفت عنه Moonshot)
لا ينشر إعلان Kimi K2.6 وصفة التدريب الكاملة، لكن إشارات المنتج تخبرك أين ذهب الجهد الهندسي:
- **الاستقرار طويل الأمد** — تشير Moonshot إلى تشغيل الوكلاء لمدة 12 و13 ساعة كدليل على التدريب ضد أنماط الفشل المتعلقة بطول الجلسة. تدهور أداء K2.5 بعد بضع مئات من استدعاءات الأدوات؛ بينما يحافظ K2.6 على أكثر من 4,000 استدعاء.
- **موثوقية استدعاء الأدوات** — معدل نجاح CodeBuddy في استدعاء الأدوات بنسبة 96.60% هو الرقم المعلن. تُعد بيانات استخدام الأدوات الاصطناعية في التدريب هي الطريقة الشائعة التي تحقق بها المختبرات ذلك.
- **تدريب الأسراب التركيبية** — سلوك الوكلاء الفرعيين غير المتجانس يعني إشارة تدريب عبر أدوار وكلاء متعددة (مخطط، مبرمج، باحث، مراجع)، وليس وكيلًا عامًا واحدًا.
- **ربط الرؤية + الكود** — يشير نمط "MathVision مع بايثون" (بنسبة 93.2%) إلى تدريب مشترك متعدد الوسائط + استخدام الأدوات، وليس محول رؤية إضافي.
إذا كنت تكتب استعراضًا لما يميز نموذجًا مفتوحًا جيدًا من عام 2026 عن نموذج رائع، فإن هذه النقاط الأربع تمثل معظم القصة.
من يجب أن يهتم
اختر Kimi K2.6 إذا كنت تبني
- **وكلاء برمجة طويلة الأمد.** تشغيل العروض التوضيحية لمدة 12 ساعة و4,000 خطوة ليس مجرد تسويق؛ بل هو جزء من المعمارية.
- **أنظمة متعددة الوكلاء.** تمنحك Agent Swarm ومجموعات Claw القدرة على تنسيق 300 وكيل دون الحاجة إلى كتابة ذلك بنفسك.
- **الإنتاج بأوزان مفتوحة.** أنت بحاجة إلى سيادة النموذج، أو الضبط الدقيق المخصص، أو التحكم التنظيمي.
- **عمل واجهة برمجة تطبيقات عالي الإنتاجية.** تكلفة استدلال MoE أقل بكثير من تسعير النماذج المغلقة، وتتكامل واجهة برمجة التطبيقات المتوافقة مع OpenAI في الكود الموجود.
التزم بالنماذج المغلقة إذا كنت بحاجة إلى
- **محاذاة صارمة للسلامة.** لا يزال Claude 4.6 يتصدر في الرفض الدقيق والالتزام بالسياسات.
- **وقت استجابة دردشة المستهلك أقل من ثانية.** تعمل جلسات Agent Swarm بالدقائق، وليس بالمللي ثانية.
- **اتفاقيات مستوى الخدمة (SLAs) المغلقة من البائعين.** بالنسبة للصناعات المنظمة، قد يكون عقد الدعم من مختبر رائد أهم من جودة النموذج.
كيف تختبر Kimi K2.6 في خمس دقائق باستخدام Apidog
بمجرد حصولك على مفتاح API من Moonshot/Kimi، يساعدك Apidog على الانتقال من الصفر إلى اختبار فعال في دقائق:
- أنشئ بيئة:
BASE_URL = https://api.moonshot.ai/v1،KIMI_API_KEY = sk-.... - طلب جديد:
POST {{BASE_URL}}/chat/completions. - الرؤوس (Headers):
Authorization: Bearer {{KIMI_API_KEY}}،Content-Type: application/json. - الجسم (Body):
{
"model": "kimi-k2.6",
"messages": [{"role": "user", "content": "لخص إعلان Kimi K2.6."}],
"stream": true
}
- انقر على إرسال (Send). شاهد الرموز تتدفق.
يتعامل Apidog أيضًا مع سجل الطلبات (إعادة تشغيل تسلسلات استدعاء الأدوات الفاشلة)، والتحقق من صحة المخطط مقابل مواصفات إكمال الدردشة الخاصة بـ OpenAI، والمشاركة الجماعية بمفاتيح لكل عضو، وتكامل VS Code للاختبار داخل المحرر. إذا كنت تستخدم Postman حاليًا، فإن دليلنا لاختبار واجهة برمجة التطبيقات بدون Postman في عام 2026 يوضح لك كيفية التبديل.
الأسئلة الشائعة
هل Kimi K2.6 مفتوح المصدر؟ الأوزان مفتوحة المصدر بموجب ترخيص MIT معدل (moonshotai/Kimi-K2.6). بيانات التدريب وكود التدريب ليسا عامين. وهذا يجعله "ذا أوزان مفتوحة" في الاستخدام الشائع.
كيف يقارن Kimi K2.6 بنسخة K2.5؟ قفزات كبيرة في جميع المجالات، وفقًا لجدول المعايير الرسمي: +3.8 نقطة في HLE-Full، +8.3 في BrowseComp، +15.9 في Terminal-Bench 2.0، +7.9 في SWE-Bench Pro، +20.5 في Claw Eval، وزيادة 3 أضعاف في قدرة Agent Swarm.
ما هي نافذة سياق Kimi K2.6؟ 262,144 توكن. يصل الحد الأقصى للتوليد لمهام التفكير إلى 98,304 توكنات.
هل يمكنني تشغيل Kimi K2.6 محليًا؟ نعم، مع أجهزة قوية. يتطلب نموذج MoE الكامل بحجم 1 تريليون معامل عقدًا متعددة لوحدات معالجة الرسوميات من فئة H100. تُناسب البنيات المكممة (4-بت، 3-بت) من مساهمي المجتمع إعدادات أصغر مع بعض فقدان الجودة. راجع دليل الوصول المجاني لخيارات الكمّ.
هل يدعم Kimi K2.6 استدعاء الأدوات؟ نعم. تتبع واجهة برمجة التطبيقات تنسيق استدعاء الأدوات الخاص بـ OpenAI. يتعامل Agent Swarm مع استدعاءات الأدوات المتوازية بشكل أصلي.
ما الفرق بين Kimi K2.6 وKimi K2.6 Thinking؟ K2.6 هو المتغير السريع للوكيل. يكشف K2.6 Thinking عن سلسلة واضحة من التفكير قبل الإجابة. استخدم Thinking لإثباتات الرياضيات، أو تصحيح الأخطاء الصعبة، أو التخطيط المعقد.
كيف أصل إلى Kimi K2.6 مجانًا؟ دردشة الويب kimi.com مجانية مع حصة يومية. لدى Cloudflare Workers AI طبقة مجانية. الاستضافة الذاتية من أوزان Hugging Face لا تتطلب تكلفة لكل توكن بمجرد امتلاكك للجهاز. تفصيل كامل في كيفية استخدام Kimi K2.6 مجانًا.
كيف يقارن Kimi K2.6 بالنماذج الأخرى ذات الأوزان المفتوحة؟ مقابل Qwen 3.6 وQwen3.5-Omni، يتصدر Kimi K2.6 في معايير البرمجة والوكلاء؛ ولا يزال Qwen يمتلك متغيرات أقوى متعددة اللغات وصغيرة الحجم. مقابل DeepSeek V3.x، يتميز K2.6 بتنسيق الوكلاء.
الملخص
Kimi K2.6 هو النموذج ذو الأوزان المفتوحة الأكثر جاهزية للإنتاج الذي تم إصداره حتى الآن للبرمجة القائمة على الوكلاء والعمل طويل الأمد. يتحد سرب الوكلاء المكون من 300 وكيل، والتنفيذ بـ4,000 خطوة، ونافذة سياق 262 ألف، والأوزان المفتوحة لجعلها أداة فريدة في تشكيلة النماذج الحالية. منشور إعلان Moonshot يصفه بأنه أحدث ما توصلت إليه التقنيات في أعمال الوكلاء مفتوحة المصدر، وتدعم المعايير العامة هذا الادعاء.
إذا كنت تقوم بتقييم النماذج لوكيل برمجة، أو مساعد بحث طويل الأمد، أو نظام متعدد الوكلاء، فإن Kimi K2.6 يجب أن يكون ضمن قائمتك المختصرة. احصل على مفتاح من platform.kimi.ai، افتح Apidog، وأرسل طلبك الأول. ثم تابع من خلال أدلتنا الأكثر تفصيلًا حول واجهة برمجة التطبيقات وطرق الوصول المجاني.
