أسعار Claude Opus 4.8: تحليل كامل للتكلفة

شرح أسعار Claude Opus 4.8: 5 دولارات/25 دولارًا للوضع القياسي و 10 دولارات/50 دولارًا للوضع السريع لكل مليون رمز، أمثلة عملية لحساب التكلفة، وكيفية التحكم في الجهد والتخزين المؤقت والوضع الدفعي تقلل التكاليف.

Ashley Innocent

Ashley Innocent

29 مايو 2026

أسعار Claude Opus 4.8: تحليل كامل للتكلفة

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

يكلف Claude Opus 4.8 مبلغ 5 دولارات لكل مليون رمز إدخال و25 دولارًا لكل مليون رمز إخراج في الوضع القياسي. هذا هو نفس سعر Opus 4.7، لذلك إذا كنت تضع ميزانية بالفعل لـ 4.7، فلن يتغير شيء عند الترقية. الجزء المثير للاهتمام هو كل ما يحيط بهذا الرقم الرئيسي: وضع أسرع، قرص إنفاق للرموز، التخزين المؤقت، وخصومات الدُفعات التي تحرك فاتورتك الحقيقية أكثر بكثير من السعر الأساسي.

يقدم هذا الدليل تفصيلاً لما تدفعه فعليًا، مع أمثلة عملية. للحصول على نظرة عامة على النموذج، انظر ما هو Claude Opus 4.8. للبدء في البناء، انظر دليل API.

بطاقة الأسعار

الوضع الإدخال (لكل مليون رمز) الإخراج (لكل مليون رمز) السرعة
قياسي 5 دولارات 25 دولارًا أساسي
سريع 10 دولارات 50 دولارًا إخراج أسرع 2.5 مرة

هناك شيئان بارزان. أولاً، تكلفة رموز الإخراج خمسة أضعاف تكلفة رموز الإدخال، لذا فإن طول استجابات Claude هو ما يحدد فاتورتك، وليس حجم مطالباتك. ثانيًا، الوضع السريع يضاعف السعر للحصول على إخراج أسرع 2.5 مرة. تلاحظ Anthropic أن الوضع السريع أرخص بثلاث مرات تقريبًا مما كان عليه الوضع المعادل في النماذج السابقة، لذا فإن العلاوة على السرعة قد انخفضت جيلاً بعد جيل.

يمكنك تأكيد الأسعار الحالية في وثائق تسعير Anthropic.

ما هو وضع السرعة السريع؟

الوضع القياسي هو الوضع الافتراضي والخيار الصحيح لمعظم أعباء العمل. يوجد الوضع السريع للحالات التي يكون فيها زمن الاستجابة هو المنتج: مساعدو البرمجة المباشرة، الوكلاء التفاعليون، أي شيء يراقب فيه المستخدم المؤشر. تدفع ضعف سعر الرمز المميز للحصول على إخراج يتدفق أسرع 2.5 مرة.

القرار بسيط. إذا كان إنسان ينتظر الاستجابة في الوقت الفعلي، فقد يكون الوضع السريع يستحق العناء. إذا كان العمل يتم في الخلفية، حلقة وكيل، مهمة دفعية، مهمة مجدولة، فابقَ على الوضع القياسي ووفر المال.

كيف يغير الجهد فاتورتك

هذه هي الرافعة التي يغفلها معظم الفرق. يتحكم معامل effort في Opus 4.8 في عدد الرموز التي ينفقها النموذج عبر الاستجابة بأكملها، بما في ذلك استدعاءات الأدوات. نظرًا لأن الإخراج هو النصف الأغلى، فإن تقليل الجهد في العمل الذي لا يتطلب تفكيرًا عميقًا يقلل التكلفة مباشرة.

المستويات الخمسة، من الأرخص إلى الأغلى من حيث الرموز:

قد تستخدم مهمة تصنيف بمستوى جهد low عُشر رموز الإخراج التي ستستخدمها بمستوى high. نفس النموذج، نفس السعر، جزء من الفاتورة. يغطي إرشادات الجهد من Anthropic المكان الذي يحافظ فيه كل مستوى على الجودة. الخلاصة: طابق الجهد بالمهمة بدلاً من الدفع مقابل high في كل مكان.

سيناريوهات التكلفة العملية

تستخدم جميع الأرقام التسعير القياسي (5 دولارات للإدخال، 25 دولارًا للإخراج لكل مليون رمز). وهي توضيحية؛ ستختلف أعداد الرموز الحقيقية الخاصة بك.

السيناريو 1: دور روبوت محادثة. 1,000 رمز إدخال، 500 رمز إخراج.

عند مستوى جهد low يتقلص الإخراج، مما يدفع تكلفة الدورة الواحدة إلى أقل من سنت.

السيناريو 2: مهمة برمجة وكيلة. 50,000 رمز إدخال من سياق المستودع، 8,000 رمز إخراج بمستوى xhigh.

إذا تكرر هذا السياق البالغ 50 ألفًا عبر المكالمات، فإن التخزين المؤقت للمطالبة يقلل تكلفة الإدخال إلى حوالي 0.025 دولارًا، مما يقلل الإجمالي إلى حوالي 0.23 دولارًا.

السيناريو 3: وظيفة دفعية ليلية. 1,000,000 رمز إدخال، 200,000 رمز إخراج، يتم تشغيلها عبر Batch API بخصم 50%.

للمقارنة مع النماذج الأرخص، انظر تفاصيل تسعير Gemini 3.5 Flash و تكلفة Xiaomi MiMo v2.5 API.

التخزين المؤقت للمطالبات: أكبر توفير فردي

إذا أرسلت نفس المطالبة النظامية، أو المستند، أو قاعدة التعليمات البرمجية في كل مكالمة، فأنت تدفع سعر الإدخال الكامل للرموز التي رآها النموذج بالفعل. التخزين المؤقت للمطالبات يحل هذه المشكلة. تتم محاسبة قراءات الإدخال المخزنة مؤقتًا بجزء من معدل الإدخال العادي، حوالي العُشر، بعد الكتابة الأولية للتخزين المؤقت.

وكلاء السياقات الطويلة يوفرون أكثر. مطالبة نظامية تحتوي على 50 ألف رمز يتم احتسابها بسعر كامل في كل مكالمة مكلفة؛ عند التخزين المؤقت، فإن الجزء المتكرر يكلف تقريبًا لا شيء. المكالمة الأولى تكتب التخزين المؤقت، وكل مكالمة لاحقة تقرأه بسعر رخيص.

Batch API والمخرجات الكبيرة

تقوم Batch API بتشغيل المهام بخصم عندما لا تحتاج إلى إجابة في الوقت الفعلي. أرسل مجموعة من الطلبات، واحصل على النتائج خلال نافذة الدفعة، وادفع أقل لكل رمز. كما أنها ترفع سقف الإخراج: يدعم Opus 4.8 ما يصل إلى 300 ألف رمز إخراج عبر Batch API مع رأس بيتا output-300k-2026-03-24، مقابل 128 ألفًا على نقطة النهاية المتزامنة.

استخدمها للتقييمات، والتجميع بالجملة، وتصنيف البيانات، وأي عملية لا يهم فيها تأخر بضع دقائق.

تسعير Opus عبر الأجيال

يحافظ Opus 4.8 على السعر. القصة هي مدى انخفاض السعر قبل جيلين:

النموذج الإدخال (لكل مليون) الإخراج (لكل مليون)
Opus 4.1 15 دولارًا 75 دولارًا
Opus 4.5 5 دولارات 25 دولارًا
Opus 4.6 5 دولارات 25 دولارًا
Opus 4.7 5 دولارات 25 دولارًا
Opus 4.8 5 دولارات 25 دولارًا

انخفض سعر Opus من 15 دولارًا/75 دولارًا إلى 5 دولارات/25 دولارًا في جيل 4.5 وظل كذلك منذ ذلك الحين، بينما يستمر النموذج وراء السعر في التحسن. تحصل على جودة 4.8 بسعر 4.5. للمقارنة المباشرة مع نماذج الشركات الرائدة الأخرى، انظر Opus 4.8 مقابل GPT-5.5 مقابل Gemini 3.5.

قائمة التحقق من تحسين التكلفة

قبل توسيع نطاق استخدام Opus 4.8، راجع هذه القائمة:

تتبع إنفاقك الحقيقي باستخدام Apidog

تختلف التكلفة المقدرة عن التكلفة الفعلية بسرعة بمجرد بدء الإنتاج، لأن الاستجابات الحقيقية تختلف في الطول وعدد استدعاءات الأدوات. الطريقة الأمثل للبقاء على اطلاع هي فحص كائن usage الذي تعيده كل استجابة من Messages API، والذي يبلغ عن أعداد رموز الإدخال والإخراج لكل مكالمة.

Apidog يجعل ذلك مرئيًا:

قم بتنزيل Apidog، ووجه طلبًا إلى نقطة نهاية Messages، وقم بتشغيل نفس المطالبة بمستويات low وhigh وxhigh. تخبرك أعداد الرموز بالضبط ما يكلفه كل مستوى جهد قبل الالتزام به في الإنتاج.

الأسئلة الشائعة

كم يكلف Claude Opus 4.8؟ 5 دولارات لكل مليون رمز إدخال و25 دولارًا لكل مليون رمز إخراج في الوضع القياسي. الوضع السريع يكلف 10 دولارات و50 دولارًا للحصول على إخراج أسرع 2.5 مرة.

هل Opus 4.8 أغلى من Opus 4.7؟ لا. أسعار الرموز هي نفسها، لذا فإن الترقية من 4.7 لا تغير فاتورتك.

ما الفرق بين تسعير الوضع القياسي ووضع السرعة السريع؟ يضاعف الوضع السريع سعر الرمز الواحد مقابل إخراج يتدفق أسرع بحوالي 2.5 مرة. استخدمه فقط عندما يكون زمن الاستجابة مهمًا لمستخدم ينتظر.

كيف يمكنني خفض تكاليف Opus 4.8؟ اخفض مستوى effort في المهام الأبسط، وقم بتخزين محتوى المطالبات المتكررة مؤقتًا، واجمع المهام غير العاجلة في دفعات، وحافظ على max_tokens ضيقًا. رموز الإخراج هي المحرك الرئيسي للتكلفة.

هل يوفر التخزين المؤقت للمطالبات المال حقًا؟ نعم. بعد المكالمة الأولى التي تكتب التخزين المؤقت، تتم قراءة الإدخال المتكرر بحوالي عُشر معدل الإدخال العادي. وكلاء السياقات الطويلة يوفرون أكثر.

كم عدد رموز الإخراج التي يمكن أن ينتجها Opus 4.8؟ ما يصل إلى 128 ألف رمز على Messages API المتزامنة، وما يصل إلى 300 ألف رمز عبر Batch API مع رأس بيتا output-300k-2026-03-24.

أين أرى استخدام الرموز لكل مكالمة؟ في كائن usage في كل استجابة من Messages API. أدوات مثل Apidog تعرضها حتى تتمكن من مقارنة التكلفة عبر مستويات الجهد.

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات