ما هو Qwen 3.5؟ عادةً ما توقّت مختبرات الذكاء الاصطناعي الصينية إصداراتها الرئيسية لتتزامن مع ذروة احتفالات رأس السنة القمرية. في عام 2026، أصدرت شركات Tencent و Zhipu و ByteDance وغيرها تحديثات أولاً. وردت Alibaba في 16 فبراير، قبل ساعات من عطلة 17 فبراير—بإطلاق Qwen 3.5.
يحتوي Qwen 3.5-397B-A17B على 397 مليار معلمة في إعداد MoE متفرق (Sparse MoE). يقوم بتنشيط 17 مليار فقط لكل رمز (token)، مما يوفر استدلالًا متقدمًا وبرمجة ومهام وكيلية بصرية بتكلفة أقل بنسبة 60% وإنتاجية أعلى 8 مرات من سابقاته. يعمل النموذج المفتوح محليًا. يتعامل Qwen3.5-Plus مع الاستدلال المستضاف بسياق مليون رمز (token) على Alibaba Cloud Model Studio.
زر
يغطي هذا الدليل البنية الهجينة لـ Qwen 3.5، وانتصاراته في المقارنات المعيارية، وسير عمل API الدقيق. يقوم المهندسون بضبط الأوزان المفتوحة أو توجيه حركة المرور إلى السحابة باستخدام هذه الخطوات.
ما هو Qwen 3.5 بالضبط؟
صمم فريق Qwen من Alibaba Cloud Qwen 3.5 كخليفة مباشر لـ Qwen 3، معالِجًا كل القيود التي عطلت الأجيال السابقة. يستخدم النموذج المفتوح الرائد، Qwen3.5-397B-A17B، تصميم مزيج الخبراء المتفرق (MoE): يتم توجيه 397 مليار معلمة إجمالية عبر 17 مليار خبير نشط فقط لكل تمريرة أمامية. يوفر هذا التنشيط المتفرق ذكاء النماذج الكثيفة بجزء بسيط من الذاكرة وعمليات الفلوبس (FLOPs).
يعمل Qwen 3.5 كنموذج متعدد الوسائط أصلي حقيقي. على عكس مهايئات الرؤية التي تُضاف إلى البنى الأساسية النصية فقط، يدمج Qwen 3.5 رموز النص والصور والفيديو منذ مرحلة ما قبل التدريب الأولى. تضخ البنية رقع الصور مباشرة في طبقات المحول عبر الدمج المبكر (early fusion)، مما يتيح استدلالًا سلسًا عبر الوسائط. يستغل المهندسون هذا للمهام التي كانت تتطلب سابقًا خطوط أنابيب منفصلة للتعرف الضوئي على الحروف (OCR)، ومحللات التخطيط (layout parsers)، ونماذج الرؤية.

يمد المتغير المستضاف Qwen3.5-Plus هذه القدرة إلى نافذة سياق افتراضية بمليون رمز (token) على Alibaba Cloud Model Studio. تدعم هذه النافذة قواعد بيانات برمجية كاملة، ونصوص فيديو متعددة الساعات، أو تقارير فنية مكونة من 500 صفحة في موجه واحد—مما يلغي مشكلات التجزئة (chunking) التي تعاني منها النماذج ذات السياقات الأقصر.
يتسع نطاق تغطية اللغات ليشمل 201 لغة ولهجة، بزيادة 69% عن Qwen 3. يضغط المفردات الموسعة التي تضم 250 ألف كلمة الرموز (tokens) عبر النصوص المختلفة، مما يقلل تكاليف الاستدلال بنسبة 10-60% للتطبيقات العالمية. يقوم المطورون بضبط Qwen 3.5 على مجموعات بيانات خاصة بالمجالات ويلاحظون تقاربًا أسرع لأن أداة ترميز الأساس (base tokenizer) تتعامل بالفعل مع اللغات ذات الموارد المنخفضة بكفاءة.
تميز أوضاع الاستدلال التكيفية Qwen 3.5 بشكل أكبر. يوفر النموذج ثلاث علامات تشغيل (runtime flags):
enable_thinking: trueيؤدي إلى تشغيل استدلال "سلسلة التفكير" للمهام المعقدة.enable_fast: trueيعطي الأولوية لزمن الوصول المنخفض (latency) للخدمات عالية الإنتاجية.enable_auto: trueيسمح للنموذج بالاختيار ديناميكيًا بناءً على تعقيد الموجه (prompt).
تسمح هذه الضوابط للمهندسين بموازنة الجودة والسرعة ضمن نفس نقطة النهاية (endpoint)، مما يحقق أفضل أداء لكل من المعالجة الدفعية (batch processing) والوكلاء في الوقت الفعلي.
الميزات الرئيسية التي تميز Qwen 3.5
يتضمن Qwen 3.5 اختراقات هندسية تؤثر مباشرة على قرارات النشر. يجمع العمود الفقري الهجين بين شبكات Gated Delta للتركيز ذي التعقيد الخطي مع توجيه MoE المتفرق. تحقق هذه البنية فك تشفير أسرع بـ 8.6 مرة عند سياق 32 ألف و 19 مرة عند 256 ألف مقارنة بـ Qwen3-Max، وتم قياس ذلك على نفس الأجهزة.
تقف المفردات التي تضم 250 ألف كلمة كمضاعف كفاءة صامت. تقوم بترميز الأحرف الصينية والرموز الرياضية ورموز التعليمات البرمجية بشكل أكثر إحكامًا من المفردات التي تضم 152 ألف كلمة في نماذج Qwen السابقة. يبلغ معدلو الضبط (fine-tuners) عن عدد أقل من الرموز بنسبة 15-25% على مجموعات البيانات التقنية، وهو ما يترجم إلى وفورات ملموسة في التكاليف على نطاق واسع.
تصل المعالجة متعددة الوسائط إلى جاهزية الإنتاج. يتعامل Qwen 3.5 مع:
- صور عالية الدقة تصل إلى 1344x1344 بكسل.
- مقاطع فيديو مدتها 60 ثانية بمعدل 8 إطارات في الثانية.
- لقطات شاشة لواجهة المستخدم مع اكتشاف العناصر بدقة البكسل.
يحقق مُشفِّر الرؤية، المدرب بشكل شامل (end-to-end)، 90.3 على MathVista و 85.0 على MMMU—متفوقًا على النماذج التي تتطلب معالجة مسبقة منفصلة.
يبرز الذكاء الوكيلي كميزة قوية لـ Qwen 3.5. يقوم النموذج بمهام "وكيلية بصرية" بشكل أصلي: يستقبل لقطة شاشة لسطح المكتب، يحدد عناصر واجهة المستخدم، يخطط لسير عمل متعدد الخطوات، ويولد إجراءات قابلة للتنفيذ. يوسع استدعاء الأدوات المدمج هذا ليشمل البحث على الويب، تنفيذ التعليمات البرمجية، وتنسيق API الخارجي. يحدد المهندسون الأدوات مرة واحدة في حمولة API، ويتعامل Qwen 3.5 مع الدورة الكاملة بشكل مستقل.
تحقق قدرات البرمجة والرياضيات أرقامًا قياسية جديدة. يسجل Qwen3.5-397B-A17B 83.6 على LiveCodeBench v6 (مستوى بشري في البرمجة التنافسية) و 91.3 على AIME26 (رياضيات الأولمبياد). يستخدمه المبرمجون لتوليد قواعد الأكواد الإنتاجية وإعادة هيكلتها وتصحيح الأخطاء فيها، وغالبًا ما يحل محل سير عمل مهندسين كبار بأكمله.
تُجعل خطوط أنابيب التكميم (quantization pipelines) النشر عمليًا. يتعامل FP8 مع الجزء الأكبر من العمليات الحسابية بينما يحمي BF16 الموجه والطبقات النهائية. يقوم المهندسون بتشغيل النموذج الكامل بحجم 397 مليار على 8 وحدات معالجة رسومية H100 بسرعة 45 رمزًا/ثانية—وهي أرقام كانت مستحيلة للنماذج الكثيفة المماثلة قبل بضعة أشهر فقط.
تزيل رخصة Apache 2.0 جميع الحواجز التجارية. يمكنك ضبط وتصفية وشحن مشتقات Qwen 3.5 دون حقوق ملكية أو قيود على الاستخدام.
معايير Qwen 3.5: السيطرة على المجال
توفر المقارنات المعيارية الأرقام الدقيقة التي تبرر التحول إلى Qwen 3.5. يتفوق النموذج على GPT-5.2 و Claude 4.5 Opus و Gemini-3 Pro عبر 80% من الفئات المقيمة بينما يكلف تشغيله 60% أقل.

تنتج هذه النتائج عن ثلاثة خيارات استراتيجية: التعلم المعزز غير المتزامن (asynchronous RL) على 20,000 بيئة متوازية، والتدريب المسبق الضخم متعدد اللغات، ودمج الرؤية بالدمج المبكر (early-fusion). تؤكد التقييمات المستقلة على لوحة صدارة Hugging Face Open LLM هذه المكاسب، مع دفع التعديلات الدقيقة المجتمعية للعديد من النتائج إلى أوائل التسعينات.

تُرسخ مقاييس التكلفة لكل رمز (token) الصفقة. يعالج Qwen3.5-Plus ثمانية أضعاف عبء العمل الذي عالجه سابقوه بتكلفة أقل بنسبة 60%. بالسعر الحالي، يكلف سياق المليون رمز حوالي 0.18 دولار—وهو أرخص من قهوة كبيرة.
غوص عميق في البنية التقنية لـ Qwen 3.5
تمثل بنية Qwen 3.5 تحفة فنية في التوسع الفعال. يستخدم موجه MoE المتفرق شبكة بوابة متعلمة تنشط بالضبط 17 مليار معلمة لكل رمز من إجمالي 397 مليار. يقلل هذا التنشيط الانتقائي ذاكرة التنشيط بنسبة 95% مع الحفاظ على قدرة النموذج الكاملة على التعبير.
تحل شبكات Gated Delta محل الانتباه القياسي للتسلسلات التي تزيد عن 32 ألف رمز. تحافظ آلية الانتباه الخطي على تعقيد الذاكرة الثابت، مما يتيح نافذة سياق بمليون رمز بدون أخطاء نفاد الذاكرة (OOM). يقيس المهندسون تسريعًا بمقدار 19 مرة عند سياق 256 ألف على نفس الأجهزة.
استهلك التدريب المسبق تريليونات الرموز من مصادر متباينة:
- 40% نصوص ورموز برمجية STEM عالية الجودة.
- 30% زحف ويب متعدد اللغات يغطي 201 لغة.
- 20% أزواج نص-رؤية اصطناعية تم إنشاؤها عبر التقطير الذاتي (self-distillation).
- 10% مسارات وكيلية من البيئات المحاكاة.
يُحقن الدمج المبكر (early fusion) 576 رمزًا للصورة لكل صورة بحجم 512x512 مباشرة في الطبقة الأولى من المحول (transformer). يتفوق هذا التصميم على بدائل الدمج المتأخر (late-fusion) بـ 12-18 نقطة في معايير الاستدلال المكاني.
يطبق ما بعد التدريب التعلم المعزز من التغذية الراجعة البشرية (RLHF) المدعوم بأساليب الفاعل-الناقد غير المتزامنة. يدير النظام 20,000 بيئة تنفيذ متوازية، مولدًا آثارًا وكيلية تعلم التخطيط متعدد الخطوات واستخدام الأدوات. ينتج عن ذلك تحسينات ملموسة في BFCL-V4 (72.9) و VITA-Bench (49.7).
تُسرع تحسينات البنية التحتية كل شيء. يقلل تدريب FP8 الشامل (end-to-end) ذاكرة الوصول العشوائي للفيديو (VRAM) بنسبة 50% ويعزز الإنتاجية بمقدار 10 أضعاف. يزيد فك التشفير التخميني (speculative decoding) باستخدام نموذج مسودة بأربعة رموز من تسريع الاستدلال بمقدار 2.3 مرة.

للنشر، يختار المهندسون من المكدسات المجربة في المعركة:
vLLM (موصى به للإنتاج)
vllm serve Qwen/Qwen3.5-397B-A17B \
--port 8000 \
--tensor-parallel-size 8 \
--max-model-len 1048576 \
--dtype auto \
--reasoning-parser qwen3 \
--enable-chunked-prefill
SGLang (الأفضل للبحث)
python -m sglang.launch_server \
--model-path Qwen/Qwen3.5-397B-A17B \
--port 8000 \
--tp-size 8 \
--context-length 1048576 \
--enable-multimodal
MLX-VLM (معالجات Apple Silicon)
from mlx_vlm import load, generate
model, processor = load("Qwen/Qwen3.5-397B-A17B-mlx")
output = generate(
model,
processor,
"Analyze this screenshot and suggest optimizations:",
image_path="ui.png",
max_tokens=2048
)
تدعم أطر الضبط الدقيق (fine-tuning frameworks) طرق المعلمات الكاملة (full-parameter)، و LoRA، و QLoRA. يحقق Unsloth تدريبًا أسرع بمرتين على طبقات MoE عن طريق تجميد الخبراء غير النشطين. يتكامل Llama-Factory بسلاسة مع قالب الدردشة الرسمي لـ Qwen3.5.
حالات الاستخدام العملي لـ Qwen 3.5
يعزز Qwen 3.5 سير العمل التي كانت مستحيلة قبل ستة أشهر. تقوم فرق البرمجيات بتغذية مستودعات كاملة في موجه واحد وتتلقى عمليات إعادة هيكلة جاهزة للإنتاج. يعالج سياق المليون رمز 400 ألف سطر من التعليمات البرمجية دون اقتطاع.
يقوم المحللون الماليون بتحميل مستندات SEC المكونة من 500 صفحة بتنسيق PDF. يستخرج Qwen 3.5 الجداول، ويشير إلى الملاحظات الهامشية، ويولد ملخصات تنفيذية في أقل من 30 ثانية.
تدمج أنظمة الرعاية الصحية Qwen 3.5 للتشخيص متعدد الوسائط. يقوم أخصائيو الأشعة بتحميل صور الأشعة السينية جنبًا إلى جنب مع تاريخ المريض؛ ويقوم النموذج بإخراج تشخيصات تفاضلية مع درجات ثقة وروابط للمراجع الداعمة.
تدرب مختبرات الروبوتات الوكلاء المتجسدين باستخدام Qwen 3.5 كمخطط عالي المستوى. يستقبل النموذج تغذية كاميرا RGB-D، ويولد أساسيات الحركة، ويتفاعل مع وحدات التحكم منخفضة المستوى عبر استدعاءات الأدوات.
تقوم منصات التجارة الإلكترونية بأتمتة إدارة كتالوج المنتجات. يحلل Qwen 3.5 صور الموردين، ويولد أوصافًا محسّنة لمحركات البحث (SEO) بـ 201 لغة، ويقترح حزم بيع متقاطع بناءً على التشابه البصري.
تشترك هذه التطبيقات في أساس واحد مشترك: وصول قوي وموثوق إلى واجهة برمجة التطبيقات (API).
خطوة بخطوة: كيفية الوصول إلى واجهة برمجة تطبيقات Qwen 3.5
يتطلب الوصول إلى واجهة برمجة تطبيقات Qwen 3.5 أربع خطوات بالضبط وفي أقل من خمس دقائق.
الخطوة 1: إنشاء حسابك على Alibaba Cloud
انتقل إلى modelstudio.console.alibabacloud.com واشترك باستخدام بريدك الإلكتروني الخاص بالشركة. قم بتنشيط Model Studio في منطقة ap-southeast-1 للحصول على أقل زمن وصول.
الخطوة 2: إنشاء مفاتيح API
في وحدة التحكم، انتقل إلى "API Keys" → "Create AccessKey". انسخ DASHSCOPE_API_KEY وقم بتخزينه في مدير أسرارك.
الخطوة 3: تكوين العميل المتوافق مع OpenAI
عنوان URL الأساسي هو https://dashscope.aliyuncs.com/compatible-mode/v1. استخدم أي OpenAI SDK:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1"
)
الخطوة 4: إجراء أول استدعاء لك
طلب نصي فقط:
response = client.chat.completions.create(
model="qwen3.5-plus",
messages=[{
"role": "user",
"content": "اكتب نقطة نهاية FastAPI جاهزة للإنتاج تستدعي Qwen 3.5 لمراجعة التعليمات البرمجية"
}],
temperature=0.3,
max_tokens=4096,
extra_body={"enable_thinking": True}
)
طلب الرؤية (مشفر Base64):
import base64
def image_to_base64(path):
with open(path, "rb") as f:
return base64.b64encode(f.read()).decode()
image_b64 = image_to_base64("invoice.png")
response = client.chat.completions.create(
model="qwen3.5-plus",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "استخرج جميع بنود الفاتورة هذه وأعدها بتنسيق JSON"},
{"type": "image_url", "image_url": {"url": f"data:image/png;base64,{image_b64}"}}
]
}]
)
مثال على استدعاء أداة:
tools = [
{
"type": "function",
"function": {
"name": "search_web",
"description": "ابحث في الويب عن المعلومات الحالية",
"parameters": {
"type": "object",
"properties": {"query": {"type": "string"}}
}
}
}
]
response = client.chat.completions.create(
model="qwen3.5-plus",
messages=[{"role": "user", "content": "ما هو أحدث معيار لـ Qwen 3.5 على SWE-bench؟"}],
tools=tools,
tool_choice="auto"
)
يدعم Qwen3.5-Plus البث (streaming)، واستدعاءات الأدوات المتوازية، والبحث على الويب عبر enable_search: true. للخدمة المحلية، قم بوكيل نقطة نهاية vLLM أو SGLang الخاصة بك من خلال نفس عميل OpenAI.
دمج Apidog لتسريع سير عمل واجهة برمجة تطبيقات Qwen 3.5
يحول Apidog تطوير واجهة برمجة تطبيقات Qwen 3.5 من مشروع عطلة نهاية أسبوع إلى نشر في نفس اليوم. قم بتنزيل Apidog مجانًا واستورد مواصفات Qwen 3.5 OpenAPI الرسمية مباشرة من Model Studio.

يقوم Apidog تلقائيًا بتحليل كل مخطط متعدد الوسائط، ويولد حمولات أمثلة لمدخلات الرؤية، وينشئ مجموعات اختبار تغطي 100% من المعلمات الموثقة. يحدد المهندسون تأكيدات مثل "يجب أن تحتوي الاستجابة على JSON صالح عند تمكين استدعاء الأداة" ويشغلونها مقابل نقاط نهاية Qwen3.5-Plus الحية.
يتيح لك منشئ التدفق المرئي إنشاء نماذج أولية لسلاسل الوكلاء: تحميل لقطة شاشة → اكتشاف عناصر واجهة المستخدم → توليد الإجراءات → تنفيذ الأداة. يسجل Apidog كل خطوة، ويولد ما يعادل cURL، ويصدر مجموعات Postman.
يكشف اختبار الأداء عن الاختناقات الحقيقية. يحاكي Apidog 1,000 طلب متزامن بطول سياق 1 مليون، ويقيس زمن الوصول P95 وإنتاجية الرموز (token throughput). توجه النتائج القرارات المتعلقة بحجم الدفعة (batch size)، ودرجة الحرارة (temperature)، ووضع التفكير (thinking mode).
يصبح التوثيق منتجًا ثانويًا. يولد Apidog مراجع API جميلة وتفاعلية كاملة بأمثلة خاصة بـ Qwen 3.5، ومقتطفات تعليمات برمجية بـ 12 لغة، وعروض فيديو مدمجة لاستدعاءات الرؤية.
يحدث التعاون بين الفرق في الوقت الفعلي. تتزامن التغييرات على المخططات فورًا عبر مساحات العمل، مما يمنع انحراف الإصدار الذي يدمر مشاريع واجهة برمجة التطبيقات.
يبلغ المهندسون الذين يعتمدون Apidog لـ Qwen 3.5 عن تقليص وقت التكامل من أسابيع إلى أيام.
تقنيات متقدمة لتحسين واجهة برمجة تطبيقات Qwen 3.5
تعمل المعالجة الدفعية (Batch processing) على زيادة القيمة. قم بتجميع 16 طلبًا في استدعاء API واحد باستخدام المعامل n ومعالجة الاستجابات بالتوازي.
تتبع هندسة الموجه (Prompt engineering) قالبًا منظمًا:
[SYSTEM]
You are Qwen 3.5-Plus, an expert software architect.
[USER]
{task}
[THOUGHT]
First, analyze the requirements.
Second, break down into components.
Third, provide implementation.
[RESPONSE]
تنفذ معالجة الأخطاء آلية التراجع الأسي (exponential backoff) مع التذبذب (jitter):
import time
import random
def call_qwen_with_retry(prompt, max_retries=5):
for attempt in range(max_retries):
try:
response = client.chat.completions.create(...)
return response
except Exception as e:
if attempt == max_retries - 1:
raise
sleep_time = (2 ** attempt) * 0.5 + random.uniform(0, 1)
time.sleep(sleep_time)
تستفيد خطوط أنابيب RAG من سياق المليون رمز مباشرة. استرجع 500 جزء، ادمجها، ودع Qwen 3.5 يُركب (يُنتج) دون طبقات تلخيص.
يقلل الاستدلال المحلي المكمم عبر GGUF التكاليف بشكل أكبر. يعمل Qwen3.5-397B-A17B ذو 4 بت بسرعة 28 رمزًا/ثانية على A100 واحد.
يُحاكي الخادم الوهمي لـ Apidog سلوك Qwen 3.5 أثناء CI/CD، ويلتقط تراجعات المخطط قبل أن تصل إلى الإنتاج.
تجنب الأخطاء الشائعة في Qwen 3.5
تُشغل حدود المعدل (rate limits) عندما ينسى المهندسون تطبيق قوائم الانتظار (queuing). تتبع الاستخدام باستخدام وحدة تحكم Alibaba وضع حدودًا مرنة عند 80% من الحصة.
تحدث أخطاء حمولة الرؤية عندما تتجاوز سلاسل base64 حجم 20 ميجابايت. قم دائمًا بتغيير حجم الصور إلى 1344x1344 وضغطها بجودة JPEG 85.
يحدث تجاوز السياق بصمت. راقب usage.completion_tokens وقم بتطبيق التجزئة التلقائية عند الاقتراب من 900 ألف رمز.
يفشل استدعاء الأداة عندما تنتهك مخططات JSON توقعات النموذج. تحقق من صحة كل تعريف أداة في محرر مخطط Apidog قبل النشر.
المهندسون الذين يتبعون هذه الأنماط يتجنبون 90% من حوادث الإنتاج.
الخاتمة
يعيد Qwen 3.5 تعريف ما يمكن للمهندسين تحقيقه باستخدام الذكاء الاصطناعي المتاح. توفر بنيته ومعاييره وواجهة برمجة تطبيقاته ذكاءً متعدد الوسائط بكفاءة غير مسبوقة.
قدم هذا الدليل خارطة الطريق التقنية الكاملة—من الغوص العميق في البنية إلى عينات التعليمات البرمجية الجاهزة للإنتاج. طبق هذه الأنماط اليوم وشاهد أنظمتك تتفوق على المنافسة.
يكمن الفرق بين الذكاء الاصطناعي الجيد والذكاء الاصطناعي التحويلي في الخيارات التقنية الصغيرة التي تتخذها الآن. Qwen 3.5 يكافئ الدقة.
ابدأ البناء.
زر
