شحنت Alibaba نموذجين رائدين من خط Qwen 3.7 في غضون أسبوعين: Qwen3.7-Max، نموذج الاستدلال النصي فقط، وQwen3.7-Plus، النسخة متعددة الوسائط التي تضيف الرؤية وتكلف جزءًا بسيطًا من السعر. يتشاركان نفس سياق الـ 1M رمز ونفس سقف التشغيل المستقل الذي يبلغ 35 ساعة، لذا فإن الاختيار ليس واضحًا من ورقة المواصفات وحدها.
يقارن هذا الدليل بينهما جنبًا إلى جنب في المعايير، والسعر، والسرعة، وقرار الاستخدام اليومي. إذا كنت تريد الخلفية عن كل نموذج أولاً، فراجع نظرة عامة على Qwen 3.7 Plus ودليل ما هو Qwen 3.7 الأوسع. أيهما تختار، ستستدعيه عبر واجهة برمجة تطبيقات وستحتاج إلى اختبار الاستجابات؛ وهذا هو المكان الذي يأتي فيه Apidog، والذي سنتناوله في النهاية.
الجواب المختصر
اختر Plus افتراضيًا. فهو يطابق Max في استخدام الأدوات، ويتفوق عليه في المهام الطرفية، ويضيف مدخلات الصور والفيديو، ويكلف حوالي سدس السعر. بالنسبة لمعظم أعباء العمل، يتم اتخاذ هذا القرار بالفعل بناءً على السعر وحده.

اختر Max فقط عندما تكون الأمثل للنص فقط. فهو يحافظ على تقدم صغير في لوحات المتصدرين للنص الخالص ويعمل بشكل أسرع قليلاً في عمليات التشغيل الباردة للنص فقط. إذا كان عملك لا يمس لقطة شاشة أو صورة مستند أبدًا، فقد يكون هذا التفوق مهمًا. لكل شيء آخر، يفوز Plus.
الفرق الجوهري
Max هو النموذج الرائد للنص الخالص. إنه يستدل، ويكتب التعليمات البرمجية، ويدير سلاسل وكلاء طويلة، كل ذلك من خلال إدخال نصي. يأخذ Plus نفس البنية الأساسية ويضيف "عيونًا": فهو يقبل الصور والفيديو، ويؤسس واجهات المستخدم الرسومية بشكل جيد بما يكفي لإرجاع إحداثيات النقر الدقيقة من لقطة شاشة. ثم يتفوق على Max في السعر.

لذا فإن المقايضة محدودة. تتنازل عن ميزة طفيفة في جودة النص وزمن الاستجابة، وتكسب الرؤية بالإضافة إلى فاتورة أرخص بكثير.
المعايير
تخبرنا الأرقام قصة متسقة. يتخلف Plus عن Max بفارق طفيف في النص الخالص، ويتعادل في استخدام الأدوات، ويتقدم بمجرد دخول الرؤية.
| المعيار | Qwen 3.7 Plus | Qwen 3.7 Max |
|---|---|---|
| LM Arena (نص) | #15 | #13 |
| LM Arena (ترميز) | #12 | #10 |
| Vision Arena | #16 | غير قابل للتطبيق |
| SWE-Bench Pro | ~60% | 60.6% |
| Terminal-Bench (2.0 Terminus) | 70.3 | 69.7 |
| ScreenSpot Pro (تأسيس واجهة المستخدم الرسومية) | 79.0 | لا يوجد |
| MCP-Atlas (استخدام الأداة) | 76.4 | 76.4 |
تبرز ثلاثة أمور.
SWE-Bench Pro هو فعليًا تعادل. Plus يصل إلى حوالي 60% مقابل 60.6% لـ Max. في مهام البرمجيات الحقيقية، لا تكلف معلمات الرؤية Plus أي قدرة ترميزية ذات معنى. مقارنتنا بين Qwen 3.7 و GPT-5.5 و Opus 4.7 توضح مكان ذلك مقارنة بالنماذج الرائدة الغربية.
Plus يفوز بالفعل في Terminal-Bench، 70.3 مقابل 69.7. بالنسبة لعمل الوكلاء المكثف للصدفة، فإن النموذج الأرخص هو أيضًا الأقوى قليلاً.
تأسيس واجهة المستخدم الرسومية هو الفاصل الحقيقي. ScreenSpot Pro 79.0 هو على مستوى الحدود، ولا يمكن لـ Max تشغيله على الإطلاق. إذا كان وكيلك يجب أن ينظر إلى الشاشة، فإن أحد هذه النماذج فقط مؤهل. كما هو الحال دائمًا، تعامل مع أرقام معايير البائعين كاتجاه، وليس كإنجيل؛ يشرح موقع SWE-bench ما يقيسه كل مجموعة.
التسعير
هنا تكون الفجوة واسعة.
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| الإدخال / 1M رمز | $0.40 | $2.50 |
| الإخراج / 1M رمز | $1.60 | $7.50 |
| الإدخال المخزن مؤقتًا / 1M | $0.08 | $0.25 |
Plus أرخص بحوالي ست مرات في الإدخال وحوالي خمس مرات أرخص في الإخراج. بالنسبة للوكلاء ذوي الحجم الكبير أو التشغيل الطويل، تحدد هذه النسبة الميزانيات. النموذج الأرخص يقرأ الصور أيضًا، مما يجعل Max خيارًا صعبًا ما لم تكن بحاجة تحديدًا إلى ميزته النصية.
تحذير واحد لـ Plus: يتم ترميز الصور والفيديو ويشاركان ميزانية السياق البالغة 1M، لذا فإن عبء عمل كثيف لقطات الشاشة أو الفيديو ينفق أكثر لكل مكالمة مما يشير إليه معدل الرموز. قلل من حجم الصور وعيّن الفيديو بشكل مقتصد. تغطي ملاحظاتنا حول تقليل تكاليف رموز الوكيل وحرب أسعار LLM الصينية لعام 2026 الصورة الأوسع للتكاليف. تعيش الأسعار الرسمية على صفحة تسعير Model Studio.
المواصفات والسرعة
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| أنماط الإدخال | نص، صورة، فيديو | نص فقط |
| نافذة السياق | 1M (مشتركة مع الرؤية) | 1M |
| سقف التشغيل المستقل | 35 ساعة | 35 ساعة |
| زمن الاستجابة للنص فقط | خط الأساس | أسرع بنسبة ~7-15% على المسارات الباردة |
| الأوزان | مملوكة، API فقط | مملوكة، API فقط |
خط زمن الاستجابة هو ميزة Max الهادئة. في عمليات التشغيل الباردة للنص فقط، يستجيب بشكل أسرع بشكل ملحوظ، مما يتراكم في المنتجات الشبيهة بالدردشة حيث يكون وقت الاستجابة للرمز الأول مرئيًا للمستخدمين؛ تحليل مستقل يتتبع المقايضة بين السرعة والذكاء بالتفصيل. كلا النموذجين مغلقي الأوزان ويعملان فقط من خلال Alibaba Cloud Model Studio، لذا لا يوجد خيار إذا كنت بحاجة إلى استضافة ذاتية.
أيهما تختار
اختر Qwen 3.7 Plus إذا:
- يتضمن عملك صورًا أو لقطات شاشة أو ملفات PDF أو فيديو.
- تقوم ببناء وكلاء يستخدمون الكمبيوتر أو واجهات المستخدم الرسومية الذين يقرؤون الشاشة.
- السعر مهم، والذي بناءً على هذه الأرقام يعني دائمًا تقريبًا.
اختر Qwen 3.7 Max إذا:
- تقوم بضبط الأداء لنتائج SWE-Bench Pro النصية فقط.
- تحتاج إلى أسرع استجابة نصية في منتج حساس لزمن الاستجابة.
- لا ترسل أبدًا إدخالًا بصريًا وتريد كل نقطة من جودة النص.
بالنسبة لمعظم الفرق، Plus هو الخيار الافتراضي المعقول و Max هو المتخصص. فجوة التكلفة كبيرة بما يكفي لدرجة أنك سترغب في سبب ملموس لدفع ستة أضعاف المزيد مقابل نموذج نصي فقط.
لجعل ذلك ملموسًا، إليك كيفية تتطابق أعباء العمل الشائعة:
| عبء العمل | اختر | لماذا |
|---|---|---|
| وكيل ضمان الجودة لقطات الشاشة أو الانحدار البصري | Plus | يحتاج إلى تأسيس واجهة المستخدم الرسومية؛ Plus فقط يرى الشاشة |
| استخراج الفواتير أو الإيصالات أو ملفات PDF الممسوحة ضوئيًا | Plus | تتطلب صور المستندات إدخال رؤية |
| تصنيف النصوص عالي الحجم | Plus | نفس جودة النص، بجزء بسيط من التكلفة |
| روبوت الدردشة لدعم العملاء بزمن استجابة منخفض | Max | البدء البارد الأسرع للنص فقط مهم للمستخدمين |
| تشغيل ترميز مستقل طويل | أي منهما | يتعادلان في SWE-Bench Pro، لذا دع التكلفة تحدد |
يتكرر النمط: ما لم يكن عبء العمل نصيًا فقط وحساسًا لزمن الاستجابة، فإن النموذج متعدد الوسائط الأرخص هو الخيار الافتراضي الأكثر أمانًا.
اختبار كليهما باستخدام Apidog
يتشارك كلا النموذجين نفس نقطة نهاية Model Studio المتوافقة مع OpenAI، لذا فإن التبديل بينهما هو تغيير سطر واحد في معرف النموذج. وهذا يجعل مقارنتهما مباشرة سهلة: أرسل نفس المطالبة إلى qwen3.7-plus و qwen3.7-max، قم بمحاذاة الاستجابات، وانظر ما إذا كانت فجوة السعر تستحق ذلك لمهمتك.

Apidog مصمم لهذه الحلقة. أرسل الطلبات إلى كلا النموذجين، وافحص JSON الخام جنبًا إلى جنب، وخزّن مفتاح Model Studio الخاص بك لكل بيئة، وقم بمحاكاة نقاط النهاية حتى يستمر تطبيقك في البناء. لطلبات Plus متعددة الوسائط، يوضح دليل API الخاص بـ Qwen 3.7 Plus تنسيق حمولة الصورة والفيديو، ويغطي دليل API الأساسي لـ Qwen 3.7 مسار النص. عندما يقوم أي من النموذجين بربط استدعاءات الأدوات في تشغيل وكيل، يظهر مصحح أخطاء وكيل الذكاء الاصطناعي في Apidog التسلسل الكامل.
قم بتنزيل Apidog لاختبار ومقارنة كلا نموذجي Qwen 3.7 قبل توصيل أحدهما بالإنتاج.
الأسئلة الشائعة
هل Qwen 3.7 Plus أفضل من Max؟ لمعظم أعباء العمل، نعم، لأنه يضيف الرؤية ويكلف أقل بكثير بينما يطابق Max في الترميز واستخدام الأدوات. يحافظ Max على تقدم صغير في لوحات المتصدرين للنص الخالص وزمن الاستجابة للنص فقط.
ما مدى رخص Plus؟ أرخص بحوالي ست مرات في الإدخال (0.40 دولار مقابل 2.50 دولار لكل مليون رمز) وحوالي خمس مرات أرخص في الإخراج (1.60 دولار مقابل 7.50 دولار).
هل يتشاركان نفس نافذة السياق؟ نعم، كلاهما له نافذة سياق بحجم 1M رمز. في Plus، تستهلك الصور والفيديو الرموز من نفس الميزانية.
هل يمكن لـ Max معالجة الصور؟ لا. Max نصي فقط. إذا كنت بحاجة إلى إدخال صور أو فيديو، فأنت بحاجة إلى Plus.
هل أي منهما مفتوح المصدر؟ لا. كلاهما مملوك ويعمل فقط من خلال Alibaba Cloud Model Studio. لا يمكنك تنزيل الأوزان أو استضافتها ذاتيًا.
أيهما أسرع؟ Max أسرع بنسبة تتراوح بين 7 إلى 15% في المسارات الباردة للنص فقط. بالنسبة للعمل المختلط أو البصري، Plus هو الخيار الوحيد على أي حال.
الخلاصة
Qwen 3.7 Max و Plus لا يتنافسان حقًا على نفس المهمة. Max هو النموذج النصي النقي ذو ميزة سرعة وجودة رفيعة؛ Plus هو النموذج العام متعدد الوسائط الأرخص الذي يفوز في كل مكان تقريبًا حيث يكون السعر أو الرؤية مهمين. ابدأ بـ Plus، واستخدم Max فقط عندما يبرر عبء العمل النصي فقط السعر الإضافي. في كلتا الحالتين، اختبر واجهة برمجة التطبيقات في Apidog حتى يتصرف ما تشحنه بالطريقة التي تعد بها المعايير.
