يبحث المطورون باستمرار عن الذكاء الاصطناعي الرائد الذي يوازن بين الذكاء الفائق والتكلفة الأولية الصفرية. توفر نماذج Qwen3.5 ذلك تمامًا من خلال Ollama. تحدد هذه الوكلاء متعددي الوسائط المفتوحة المصدر، التي أصدرتها Alibaba، معايير جديدة في الاستنتاج والبرمجة والرؤية واستخدام الأدوات. يمكنك تشغيلها فورًا عبر علامات Ollama السحابية — لا توجد تنزيلات ضخمة، ولا يلزم وجود مجموعات وحدات معالجة رسوميات (GPU) للمؤسسات.
يمكنك الوصول الفوري إلى نموذج MoE هجين 397B-A17B يقوم بتنشيط 17 مليار معلمة فقط في كل تمريرة أمامية. تجمع البنية بين الانتباه الخطي لشبكة Gated DeltaNet وتوجيه Sparse Mixture-of-Experts، مما يوفر إنتاجية أسرع بـ 8.6 مرة من Qwen3-Max السابق عند سياق 32K و19 مرة عند 256K. تؤكد المعايير التفوق: MMLU-Pro 87.8، LiveCodeBench 83.6، MMMU 85.0، و Tool Decathlon 38.3. لذلك يمكنك التجربة مع وكلاء الرؤية-اللغة الأصليين ودعم 201 لغة على الطبقة المجانية من Ollama قبل التفكير في الترقيات المدفوعة.
يغطي هذا الدليل كل التفاصيل التقنية التي تحتاجها. ستقوم بتثبيت Ollama، وسحب العلامات الدقيقة، والتفاعل عبر سطر الأوامر (CLI) وواجهة برمجة التطبيقات (API)، ودمج Apidog للاختبار الدقيق، وبناء تطبيقات حقيقية، وتحسين الأداء، واستكشاف المشكلات الشائعة وإصلاحها. بحلول النهاية، ستنشر سير عمل مدعومًا بـ qwen3.5 ينافس عمالقة السحابة ولكنه يبقى ضمن حدود الاستخدام المجاني.
ما الذي يجعل Qwen3.5 قوة تقنية
Qwen3.5 يطور السلسلة من خلال التدريب المسبق على مجموعات بيانات متعددة اللغات، العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، والاستنتاج، مع تصفية أكثر صرامة. قام المهندسون بتوسيع التعلم المعزز عبر بيئات تضم مليون وكيل، مع إعطاء الأولوية للصعوبة والقابلية للتعميم على حساب المقاييس الضيقة. والنتيجة: تكافؤ عبر الأجيال مع نماذج تتجاوز 1 تريليون معلمة مع الحفاظ على الكفاءة.

النسخة الرئيسية — Qwen3.5-397B-A17B — تستخدم آلية انتباه هجينة. يعالج الانتباه الخطي عبر شبكات Gated Delta تسلسلات طويلة، بينما يوجه MoE المتناثر الرموز المميزة إلى خبراء متخصصين. تتوسع المفردات إلى 250 ألف رمز مميز، مما يعزز كفاءة الترميز بنسبة 10-60% عبر اللغات. يدمج التدريب المتعدد الوسائط بالدمج المبكر الأصلي الرموز النصية والمرئية من البداية، محققًا كفاءة تدريب بنسبة 100% مقارنة بخطوط الأنابيب النصية فقط.
على Ollama يمكنك الوصول إلى علامتين جاهزتين للاستخدام:
- qwen3.5:cloud – نصي فقط، سياق 256K، الأدوات وأنماط التفكير ممكّنة.
- qwen3.5:397b-cloud – دعم كامل للرؤية-اللغة، يعالج الصور والمستندات إلى جانب النص.
كلاهما يعرض التفكير (سلسلة التفكير)، والأدوات (البحث على الويب، مترجم الشفرة)، والسلوكيات الوكيلية بشكل جاهز. لذلك يمكنك التبديل بين الإجابات السريعة والتفكير العميق باستخدام معلمة واحدة.

المعايير تتحدث عن نفسها. في البرمجة، يسجل Qwen3.5 76.4 على SWE-bench Verified و 83.6 على LiveCodeBench v6. يصل الرياضيات إلى 91.3 على AIME26 و 94.8 على HMMT. تصل مهام الرؤية إلى 93.1 على OCRBench و 88.6 على MathVision. تتضمن مقاييس الوكيل 72.9 على BFCL-V4 و 86.7 على TAU2-Bench. يغطي التغطية متعددة اللغات 201 لغة بأعلى الدرجات على MMMLU (88.5) و WMT24++ (78.9). يمكنك الوصول إلى هذا الأداء من خلال أمر ollama run بسيط على الطبقة المجانية.
لماذا يوفر Ollama وصولاً مجانيًا إلى Qwen3.5
Ollama يلخص إدارة النموذج في ثنائي واحد. يمكنك تشغيل نفس الأوامر سواء كانت الأوزان موجودة على قرصك أو على البنية التحتية السحابية لـ Ollama. تمنح الخطة المجانية استخدامًا خفيفًا للنماذج السحابية — وهو مثالي للاستكشاف والنمذجة الأولية وأعباء العمل المعتدلة. لذلك تتجاوز الحجم الخام الكامل للنموذج 397B البالغ 807 جيجابايت وتبدأ في إدخال التوجيهات في غضون ثوانٍ.

تظل النماذج المحلية غير محدودة بمجرد تنزيلها، ولكن بالنسبة لـ qwen3.5، يتم توجيه العلامات الرسمية إلى Ollama Cloud. تتيح لك عمليات الاستيراد المجتمعية مثل frob/qwen3.5 (كميات GGUF) تشغيل إصدارات مقننة محليًا إذا كنت تمتلك ذاكرة وصول عشوائي (RAM) كافية (214 جيجابايت + لـ 4 بت MXFP4). تختار المسار الذي يتوافق مع أجهزتك ونمط استخدامك. يتولى Ollama التوجيه بشفافية.
بالإضافة إلى ذلك، يكشف Ollama عن واجهة برمجة تطبيقات REST متوافقة تمامًا مع OpenAI على المنفذ 11434. يمكنك دمج qwen3.5 في أي لغة أو إطار عمل دون تغيير رمز العميل. يجعل Apidog هذا التكامل مقاومًا للرصاص من خلال السماح لك بمحاكاة الاستجابات، والتحقق من المخططات، وإنشاء مجموعات الاختبار تلقائيًا.
متطلبات النظام والمتطلبات الأساسية
تفرض علامات السحابة متطلبات محلية شبه معدومة. تحتاج فقط إلى:
- ذاكرة وصول عشوائي (RAM) سعة 8 جيجابايت (يوصى بـ 16 جيجابايت)
- اتصال إنترنت مستقر (يحدث الاستدلال عن بُعد)
- Ollama 0.5.0 أو أحدث
بالنسبة لتشغيلات GGUF المحلية المجتمعية، عليك حساب احتياجات VRAM بعناية. تحتل كمية 4 بت MXFP4 من متغير 397B-A17B حوالي 214 جيجابايت من مساحة القرص وتحتاج إلى حوالي 256 جيجابايت من ذاكرة الوصول العشوائي للنظام مع تفريغ MoE للحصول على 25+ رمزًا في الثانية على أجهزة Mac المتطورة. تتناسب المتغيرات الكثيفة الأصغر من سلسلة Qwen السابقة (إذا تم نقلها) بشكل خطي. لذلك تبدأ بعلامات السحابة وتتدرج إلى الكميات المحلية فقط عندما تحتاج إلى عملية غير متصلة بالإنترنت أو إنتاجية أعلى.
يجب عليك أيضًا تثبيت Git ومحرر الشفرة. يعمل Apidog على أنظمة Windows و macOS و Linux — قم بتنزيل تطبيق سطح المكتب للحصول على أفضل أداء.
تثبيت Ollama عبر الأنظمة الأساسية
يمكنك تثبيت Ollama بأمر واحد على كل نظام تشغيل رئيسي.
macOS
brew install ollama
ثم قم بالتشغيل:
ollama serve
Windows
قم بتنزيل المثبت من ollama.com وقم بتشغيله. سيبدأ Ollama تلقائيًا. افتح PowerShell واكتب:
ollama serve
Linux
curl -fsSL https://ollama.com/install.sh | sh
ollama serve
يمكنك التحقق من التثبيت باستخدام:
ollama --version
تتوقع مخرجات تعرض أحدث إصدار. إذا فشلت الخدمة في البدء، فتحقق من توفر المنفذ 11434 وقواعد جدار الحماية. يمكنك الآن التحكم في بيئة تشغيل LLM كاملة.
سحب وتشغيل نماذج Qwen3.5
يمكنك سحب النموذج بأمر واحد. يقوم Ollama بتنزيل البيانات الوصفية فقط للعلامات السحابية ويوجه الاستدلال عن بُعد.
ollama pull qwen3.5:cloud
لقدرات الرؤية:
ollama pull qwen3.5:397b-cloud
يمكنك بدء جلسة تفاعلية:
ollama run qwen3.5:cloud
يظهر الموجه. اكتب:
Explain the hybrid MoE architecture of Qwen3.5 in technical detail.
يستجيب Qwen3.5 بتوضيحات دقيقة لشبكة Gated DeltaNet، وتوجيه الخبراء المتناثر، والتنبؤ متعدد الرموز. تخرج بالضغط على /bye.
للتحميل في الخلفية للاستخدام مع واجهة برمجة التطبيقات (API):
ollama serve
ثم في نافذة طرفية أخرى، أبقِ النموذج نشطًا باستخدام:
ollama run qwen3.5:cloud --keep-alive 24h
التفاعل عبر سطر الأوامر وملفات النماذج (Modelfiles)
يمكنك تخصيص السلوك باستخدام Modelfiles. أنشئ ملفًا باسم Modelfile:
FROM qwen3.5:cloud
SYSTEM """
You are an expert systems architect. Always respond with step-by-step reasoning, code examples, and performance calculations.
"""
PARAMETER temperature 0.7
PARAMETER num_ctx 32768
PARAMETER top_p 0.95
يمكنك إنشاء النموذج المخصص:
ollama create qwen3.5-architect -f Modelfile
ollama run qwen3.5-architect
أنت الآن تمتلك مساعدًا متخصصًا مصممًا للتوثيق الفني ومراجعات الهندسة المعمارية. يمكنك تكرار العملية لترميز، أو تحليل الرؤية، أو وكلاء الترجمة متعددة اللغات.
الاستفادة من Ollama REST API
يكشف Ollama عن نقاط نهاية قوية. يمكنك إرسال إكمالات الدردشة باستخدام:
curl http://localhost:11434/api/chat -d '{
"model": "qwen3.5:cloud",
"messages": [
{ "role": "system", "content": "You are a helpful coding assistant." },
{ "role": "user", "content": "Write a FastAPI endpoint that calls qwen3.5 for sentiment analysis." }
],
"stream": false,
"options": {
"temperature": 0.2,
"num_predict": 2048
}
}'
تتلقى استجابة JSON كاملة تحتوي على message.content و total_duration وعدد الرموز المميزة. يمكنك تمكين التدفق عن طريق تعيين "stream": true ومعالجة أحداث Server-Sent Events في الوقت الفعلي.
للتضمينات:
curl http://localhost:11434/api/embeddings -d '{
"model": "qwen3.5:cloud",
"prompt": "Technical documentation on hybrid MoE models"
}'
لذلك يمكنك بناء خطوط أنابيب RAG، والبحث الدلالي، وطبقات التصنيف حول qwen3.5.
الاختبار وتصحيح الأخطاء باستخدام Apidog
افتح Apidog وأنشئ مشروعًا جديدًا باسم "Ollama Qwen3.5". اضبط عنوان URL الأساسي على http://localhost:11434/api.

يمكنك إضافة نقطة النهاية /chat:
- الطريقة: POST
- مخطط نص الطلب: تحديد
model، مصفوفةmessages، كائنoptions - مخطط الاستجابة: التقاط
message،done، حقول التوقيت
يمكنك استيراد مواصفات Ollama OpenAPI الرسمية إذا كانت متاحة أو بناء المجموعات يدويًا. ينشئ Apidog تلقائيًا حالات الاختبار، ويتحقق من مخططات JSON، ويدعم متغيرات البيئة للتبديل بين qwen3.5:cloud وملفات Modelfiles المخصصة.
يمكنك إنشاء مجموعة "Vision Tasks" واختبار الإدخال متعدد الوسائط:
{
"model": "qwen3.5:397b-cloud",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Describe this diagram in detail." },
{ "type": "image_url", "image_url": { "url": "data:image/png;base64,..." } }
]
}
]
}
يعرض Apidog معاينة الصورة، ويرسل الطلب، ويسمح لك بفحص استخدام الرموز، وزمن الوصول، وآثار التفكير. يمكنك حفظ التأكيدات لوقت الاستجابة < 5 ثوانٍ ووجود مصطلحات تقنية. يمكنك تصدير المجموعة كوثائق Markdown أو مشاركتها مع فريقك.
لذلك أنت تزيل التخمين. يصبح كل معلمة، وكل حقل استجابة، وكل خطأ مرئيًا وقابلًا للتكرار. تتحول التحسينات الصغيرة في Apidog — مثل إضافة نصوص برمجية ما قبل الطلب لتسخين النموذج — إلى موثوقية على مستوى الإنتاج.
بناء تطبيقات حقيقية باستخدام Qwen3.5 و Ollama
يمكنك دمج qwen3.5 في تطبيقات Python باستخدام العميل الرسمي:
import ollama
from fastapi import FastAPI
app = FastAPI()
@app.post("/analyze")
async def analyze_code(request: dict):
response = ollama.chat(
model='qwen3.5:cloud',
messages=[{'role': 'user', 'content': request['code']}],
options={'temperature': 0.1}
)
return {"analysis": response['message']['content']}
يمكنك عرض نقطة النهاية هذه، وإضافة تحديد للمعدل، ومراقبة استهلاك الرموز المميزة عبر Apidog.
بالنسبة لـ Node.js، يمكنك استخدام حزمة ollama npm وتدفق الاستجابات إلى واجهات React الأمامية. يمكنك تنفيذ استدعاء الأدوات عن طريق تعريف دوال في الطلب وتحليل tool_calls من مخرجات النموذج. يدعم Qwen3.5 استخدام الأدوات التكيفي بشكل طبيعي، لذا يمكنك ربط البحث على الويب وتنفيذ الشفرة وتحليل الملفات في وكلاء مستقلين.
يمكنك وضع المكدس بأكمله في حاويات باستخدام Docker Compose:
services:
ollama:
image: ollama/ollama
ports:
- "11434:11434"
apidog-tests:
image: your-test-image
depends_on:
- ollama
لذلك أنت تنشر بيئات متسقة عبر التطوير، والتدريج، والإنتاج.
الميزات المتقدمة: استخدام الأدوات، الرؤية، والسياق الطويل
يمكنك تنشيط وضع التفكير من خلال تضمين enable_thinking: true في العملاء المتوافقين أو عن طريق المطالبة صراحةً. يخرج النموذج علامات <thinking> قبل الإجابات النهائية، مما يمنحك رؤية لسلسلة استدلاله.
بالنسبة للرؤية، يمكنك إرسال صور base64 أو عناوين URL. تعالج علامة 397b-cloud الرسوم البيانية، ولقطات الشاشة البرمجية، والمستندات بدقة 85.0 MMMU. لذلك يمكنك بناء خطوط أنابيب لفهم المستندات تستخرج الجداول والرسوم البيانية والملاحظات المكتوبة بخط اليد.
يصل التعامل مع السياقات الطويلة إلى 256K رمز مميز على Ollama. يمكنك تغذية قواعد بيانات كاملة أو أوراق بحث وطلب ملخصات، أو تحليل الفروقات، أو إعادة هيكلة معمارية. يمكنك مراقبة استخدام السياق مع حقل context في الاستجابات وتطبيق استراتيجيات النوافذ المتغيرة عندما تقترب من الحدود.
تحسين الأداء واستكشاف الأخطاء وإصلاحها
يمكنك إبقاء النماذج نشطة باستخدام --keep-alive. يمكنك تقليل زمن الوصول عن طريق تعيين num_predict أقل للمهام البسيطة وأعلى للتفكير المعقد.
المشكلات الشائعة والحلول:
- حد المعدل في الطبقة المجانية: يمكنك مراقبة الاستخدام في لوحة تحكم Ollama والتبديل إلى مطالبات أخف أو طلبات مجمعة.
- تم رفض الاتصال: يمكنك التأكد من أن
ollama serveقيد التشغيل وأن المنفذ 11434 يستمع. - استجابات بطيئة: يمكنك إضافة
options: { "num_gpu": 999 }لفرض أقصى تسريع. - أخطاء الرؤية: يمكنك التحقق من ترميز base64 وقيود حجم الصورة.
يمكنك تسجيل كل استدعاء لواجهة برمجة التطبيقات عبر Apidog لتحديد نقاط الاختناق بسرعة. لذلك يمكنك الحفاظ على وقت تشغيل عالٍ حتى على الخطة المجانية.
الخلاصة
أنت الآن تمتلك خارطة طريق تقنية كاملة لاستخدام نماذج qwen3.5 مجانًا مع Ollama. لقد قمت بتثبيت بيئة التشغيل، وسحبت العلامات السحابية، وأتقنت التفاعلات عبر سطر الأوامر (CLI) وواجهة برمجة التطبيقات (API)، وعززت الاختبار باستخدام Apidog، وبنيت تطبيقات إنتاجية، وحسّنت الأداء لأعباء العمل الحقيقية. كل خطوة تستفيد من الأوامر النشطة، والمعلمات الدقيقة، والنتائج القابلة للقياس.
تتراكم الإجراءات الصغيرة — تنزيل Apidog، أو إنشاء ملف نموذج واحد (Modelfile)، أو إضافة تأكيد واحد — لتتحول إلى إنتاجية تحويلية. يمكنك تجربة وكلاء متعددي الوسائط الرائدين اليوم دون الحاجة لبطاقات ائتمان أو تذاكر بنية تحتية. تزيل الطبقة المجانية من Ollama كل العوائق.
