شحنت علي بابا Qwen 3.7 Plus بعد أيام قليلة فقط من Qwen3.7-Max. باختصار: Plus هو Max مع عيون. إنه يحافظ على نفس سياق الـ1M توكن والعمود الفقري الوكيل، ويضيف مدخلات الصور والفيديو، ويصل بسعر يعادل سدس سعر Max تقريبًا. إذا كنت تتابع السلسلة، فإن دليلنا حول ماهية Qwen 3.7 يغطي الرائد النصي؛ هذا المنشور يتحدث عما تضيفه نسخة Plus الجديدة.
شيء واحد يجب الإشارة إليه مقدمًا، لأنه يغير من يجب أن يهتم: Qwen 3.7 Plus هو API فقط وخاص. لا توجد أوزان مفتوحة، مما يكسر عادة Qwen في المصادر المفتوحة. سنتناول ما يعنيه ذلك أدناه. بما أن Plus يُشحن فقط كواجهة برمجة تطبيقات (API)، ستقضي وقتك في استدعائه وتصحيح أخطائه؛ وهذا هو المكان الذي يأتي فيه Apidog، والذي سنتناوله في النهاية.
الإجابة المختصرة
Qwen 3.7 Plus هو الأخ متعدد الوسائط، ذو السعر الاقتصادي لـ Qwen3.7-Max. امنحه لقطة شاشة أو نموذج تصميم أو فيديو، وسيقوم بتحليلها كمدخل من الدرجة الأولى. إنه مصمم للوكلاء الذين يديرون الواجهات الرسومية: يمكنه النظر إلى لقطة شاشة لتطبيق وإرجاع إحداثيات بكسل دقيقة للنقر عليها.

بالنسبة للنصوص فقط، لا يزال Max يتفوق عليه قليلاً. أما بالنسبة لأي شيء يتضمن إشارة بصرية، فإن Plus هو الخيار الذي تريده، ويكلف جزءًا بسيطًا من سعر Max في كلتا الحالتين. الجانب السلبي الوحيد الحقيقي هو الأوزان المغلقة.
ما الجديد مقارنة بـ Qwen 3.7 Max
ثلاثة تغييرات مهمة.
يرى. Max هو نصي فقط. Plus يقبل النصوص والصور والفيديو. وهذا يفتح إدراك لقطات الشاشة، وقراءة المستندات وملفات PDF، وفهم الفيديو من نموذج واحد.
يؤسس الواجهات الرسومية (GUIs). يتم وضع Plus كوكيل تفاعلي متعدد الوسائط يتعامل مع أتمتة المتصفح، والملاحة في الواجهة الرسومية، وسير العمل الهجين بين الواجهة الرسومية وواجهة سطر الأوامر (GUI-plus-CLI). ينتج خطط عمل منظمة مثل "انقر على (x=487, y=232)"، وهو ما يجعل وكلاء استخدام الكمبيوتر يعملون بالفعل.
إنه رخيص. يعمل Plus في فئة اقتصادية أقل بكثير من Max.
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| طرق الإدخال | نص، صورة، فيديو | نص فقط |
| نافذة السياق | 1 مليون توكن (مشتركة مع الرؤية) | 1 مليون توكن |
| الإدخال / الإخراج لكل 1M | $0.40 / $1.60 | $2.50 / $7.50 |
| الإدخال المخزن مؤقتًا لكل 1M | $0.08 | $0.25 |
| تأسيس الواجهة الرسومية (ScreenSpot Pro) | 79.0 | لا يوجد |
| Terminal-Bench | 70.3 | 69.7 |
| الحد الأقصى للتشغيل الذاتي | 35 ساعة | 35 ساعة |
المعايير
تشير أرقام الإطلاق، المدعومة بـ مراجعات أولية عملية، إلى قصة متسقة: يتطابق Plus أو يتأخر قليلاً عن Max في النصوص، ثم يتقدم بمجرد دخول الرؤية إلى الصورة.

- ScreenSpot Pro: 79.0. هذا هو اختبار تأسيس الواجهة الرسومية (GUI)، قدرة النموذج على النظر إلى لقطة شاشة وإنتاج إحداثيات بكسل دقيقة. 79.0 هو مستوى رائد، ولا يمكن لـ Max تشغيله على الإطلاق.
- Terminal-Bench: 70.3. متقدم قليلاً على Max البالغ 69.7، حتى مع معلمات الرؤية المضافة.
- SWE-Bench Pro: حوالي 60%، وهو مستوى مساوٍ تقريبًا لـ Max البالغ 60.6%.
- MCP-Atlas: 76.4، تعادل مع Max في تنسيق استخدام الأدوات.
- LM Arena: يتأخر Plus قليلاً عن Max في النصوص (#15 مقابل #13) وفي البرمجة (#12 مقابل #10). للعمل النصي البحت، يحافظ Max على تفوق طفيف.
النمط واضح. اختر Plus عندما تحمل المهمة إشارة بصرية: لقطة شاشة، نموذج تصميم، مخطط بياني. للمقارنة المباشرة في جانب النصوص، فإن مقارنة Qwen 3.7 vs GPT-5.5 vs Opus 4.7 لدينا تغطي مكانة السلسلة مقارنة بالنماذج الرائدة الغربية. كما هو الحال دائمًا، تأتي أرقام المعايير من البائع والمراجعين الأوائل، لذا تعامل معها كتوجيه وليس كحقيقة مطلقة.
التسعير: الفئة الاقتصادية متعددة الوسائط
هنا يصبح Plus مثيرًا للاهتمام. بسعر 0.40 دولار للمدخل و 1.60 دولار للمخرج لكل مليون توكن، فهو أرخص بست مرات تقريبًا من Max في المدخل وأرخص بخمس مرات تقريبًا في المخرج. ينخفض سعر المدخل المخزن مؤقتًا إلى 0.08 دولار. تحصل على رؤية وسياق 1 مليون توكن بأقل مما تفرضه معظم النماذج النصية فقط.
تحذير واحد يستحق تضمينه في نموذج التكلفة الخاص بك: الصور والفيديو تتشاركان ميزانية الـ1M توكن هذه. يمكن للقطة شاشة عالية الدقة أن تستهلك آلاف التوكنات، وتتراكم إطارات الفيديو بسرعة، لذا يتقلص هامش النص الفعال مع نمو الحمل البصري. ضع ميزانية لذلك. للحصول على سياق أوسع حول سبب استمرار المعامل الصينية في خفض الأسعار، راجع تحليلنا لـ حرب أسعار نماذج اللغات الكبيرة الصينية 2026.
المحاذير: خاص وواجهة برمجة تطبيقات (API) فقط
بنى Qwen مكانته المؤسسية على الأوزان المفتوحة. تم شحن الكثير من سلسلة Qwen السابقة بموجب تراخيص Apache 2.0 أو تراخيص الاستخدام المفتوح، بحيث يمكن للفرق تنزيل النماذج وتعديلها وتشغيلها داخل مراكز بيانات معزولة. Qwen 3.7 Plus لا يفعل ذلك.
يتم تسليم Plus حصريًا كواجهة برمجة تطبيقات تجارية مُدارة من خلال Alibaba Cloud Model Studio. لا يمكنك تنزيل الأوزان، ولا يمكنك استضافتها ذاتيًا، ولا يمكنك تشغيلها دون اتصال بالإنترنت. بالنسبة للبيئات المنظمة أو المعزولة، هذا توقف حاسم. تم طرح فكرة نسخة Plus ذات الأوزان المفتوحة للربع الثالث من عام 2026، ولكنها غير مؤكدة، وقد تظل الفئة الخاصة مغلقة. إذا كانت الأوزان المفتوحة مطلبًا، فإن هذا النموذج ليس خيارك اليوم؛ فالمنافسون مثل Step 3.7 Flash يُشحنون بموجب Apache 2.0 ويخفضون سعره.
كيفية الوصول إلى Qwen 3.7 Plus
مساران:
- واجهة برمجة التطبيقات (API): استدعاؤها من خلال Alibaba Cloud Model Studio. نقطة النهاية متوافقة مع OpenAI، لذا تنتقل أنماط الطلبات من النموذج الأساسي؛ دليلنا حول كيفية استخدام واجهة برمجة تطبيقات Qwen 3.7 يوضح المصادقة والمكالمة الأولى، وتضيف أجزاء الصورة أو الفيديو إلى حمولة الرسالة لطلبات الوسائط المتعددة.
- الدردشة: جربها في المتصفح على chat.qwen.ai قبل كتابة أي رمز. إذا كنت ترغب في اختبار السلسلة دون فاتورة، فإن دليلنا Qwen 3.7 مجانًا يوضح الطرق المجانية.
تستخدم مكالمة الوسائط المتعددة الدنيا تنسيق رسالة OpenAI القياسي، مع إضافة جزء صورة جنبًا إلى جنب مع النص:
from openai import OpenAI
client = OpenAI(
api_key="YOUR_MODEL_STUDIO_KEY",
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Which button submits this form? Give pixel coordinates."},
{"type": "image_url", "image_url": {"url": "https://example.com/screenshot.png"}},
],
}],
)
print(resp.choices[0].message.content)
تحقق من وثائق Model Studio لمعرفة معرف النموذج الدقيق وعنوان URL الأساسي الإقليمي، حيث تختلف هذه بين نقاط النهاية الدولية والصينية.
من يجب أن يستخدمه
استخدم Qwen 3.7 Plus عندما يبدو عملك هكذا:
- وكلاء استخدام الكمبيوتر والواجهة الرسومية (GUI) الذين ينقرون عبر الواجهات الحقيقية من لقطات الشاشة.
- من لقطة الشاشة إلى الكود ومن النموذج الأولي إلى واجهة المستخدم (UI)، حيث يقرأ النموذج التصميم ويكتب الواجهة الأمامية.
- فهم المستندات وملفات PDF والفيديو بتكلفة منخفضة لكل توكن.
- تشغيل وكلاء طويل الأمد، يصل إلى سقف 35 ساعة مع آلاف المكالمات المتسلسلة للأدوات.
استمر في استخدام Max إذا كنت تقوم بالتحسين بشكل بحت لنتائج نص SWE-Bench Pro أو تحتاج إلى أسرع زمن استجابة نصي فقط، حيث يعمل بشكل أسرع قليلاً في المسارات الباردة. بالنسبة لمعظم أعباء العمل المختلطة، فإن الخيار الأرخص متعدد الوسائط هو الافتراضي المعقول. إذا كنت تقارن Plus بنماذج أخرى مفتوحة واقتصادية، فإن مقارنة MiniMax M3 vs DeepSeek V4 vs Qwen 3.7 لدينا هي خريطة مفيدة.
اختبار Qwen 3.7 Plus باستخدام Apidog
بما أن Plus هو API فقط، فأنت تعيش في API. الطلبات متعددة الوسائط معقدة: تقوم بترميز الصور، وإرفاق الفيديو، وقراءة خطط العمل المنظمة، غالبًا داخل حلقة استدعاء أداة تعمل لدقائق أو ساعات. تحتاج إلى رؤية بالضبط ما يرسله كل طلب وما يتم إرجاعه.
Apidog مصمم لذلك. أرسل طلبات Qwen 3.7 Plus مع حمولات الصور والفيديو، وافحص الاستجابات الأولية، وقم بإدارة مفاتيح Model Studio الخاصة بك عبر البيئات، وقم بمحاكاة نقطة النهاية بحيث يستمر تطبيقك في البناء بينما تقوم بضبط الأوامر. بالنسبة للجانب الوكيل، حيث يربط Plus استدعاءات الأدوات عبر سير عمل GUI-و-CLI، يظهر مصحح أخطاء وكيل الذكاء الاصطناعي من Apidog تسلسل الاستدعاء الكامل حتى تتمكن من العثور على مكان الخطأ في التشغيل.
قم بتنزيل Apidog لاختبار واجهة برمجة تطبيقات Qwen 3.7 Plus وتصحيح أخطائها ومحاكاتها قبل أن تصل إلى الإنتاج.
الأسئلة الشائعة
هل Qwen 3.7 Plus مفتوح المصدر؟ لا. إنه خاص ومتاح فقط كواجهة برمجة تطبيقات مُدارة من خلال Alibaba Cloud Model Studio. لا يمكنك تنزيل الأوزان أو استضافتها ذاتيًا. تم اقتراح نسخة مفتوحة الأوزان للربع الثالث من عام 2026 ولكنها غير مؤكدة.
Qwen 3.7 Plus أم Max، أيهما يجب أن أستخدم؟ استخدم Plus إذا كنت بحاجة إلى الرؤية (لقطات الشاشة، ملفات PDF، الفيديو) أو كنت تريد سعرًا أقل، والذي يغطي معظم أعباء العمل. استخدم Max إذا كنت تقوم بالتحسين لنتائج نص SWE-Bench Pro فقط أو كنت بحاجة إلى أسرع زمن استجابة نصي فقط.
كم تكلفة Qwen 3.7 Plus؟ 0.40 دولار لكل مليون توكن مدخل، 1.60 دولار لكل مليون توكن مخرج، و 0.08 دولار للمدخل المخزن مؤقتًا. هذا أرخص بست مرات تقريبًا من Qwen3.7-Max.
هل Qwen 3.7 Plus يتعامل مع الفيديو؟ نعم. إنه يقبل النصوص والصور والفيديو كمدخلات. تذكر أن توكنات الوسائط المرئية تتشارك ميزانية سياق الـ1M توكن، لذا فإن حمولات الوسائط الكبيرة تقلل من هامش النص الخاص بك.
ما هي نافذة السياق؟ 1 مليون توكن، موروثة من العمود الفقري لـ Max، مشتركة بين توكنات النص والصورة والفيديو.
كيف يمكنني الوصول إلى Qwen 3.7 Plus؟ من خلال واجهة برمجة تطبيقات Alibaba Cloud Model Studio، أو جربها في المتصفح على chat.qwen.ai.
الخلاصة
يأخذ Qwen 3.7 Plus النموذج الرائد الوكيل من علي بابا، ويزوده بالرؤية، ويخفض السعر إلى فئة اقتصادية. بالنسبة للمطورين الذين يشحنون وكلاء استخدام الكمبيوتر، أو البرمجة المعتمدة على لقطات الشاشة، أو فهم الفيديو، فهو أحد أرخص الخيارات متعددة الوسائط على مستوى الواجهة المتاحة. المقايضة التي تقبلها هي الأوزان المغلقة والاعتماد الكامل على سحابة علي بابا.
إذا كانت هذه المقايضة تناسبك، فإن الخطوة التالية هي واجهة برمجة التطبيقات نفسها. اختبرها، وصحح أخطاء مكالمات الوسائط المتعددة، وقم بمحاكاة الاستجابات في Apidog حتى يصمد ما تشحنه تحت حركة المرور الحقيقية.
