يكلف Claude Opus 4.8 مبلغ 5 دولارات لكل مليون رمز إدخال و25 دولارًا لكل مليون رمز إخراج في الوضع القياسي. هذا هو نفس سعر Opus 4.7، لذلك إذا كنت تضع ميزانية بالفعل لـ 4.7، فلن يتغير شيء عند الترقية. الجزء المثير للاهتمام هو كل ما يحيط بهذا الرقم الرئيسي: وضع أسرع، قرص إنفاق للرموز، التخزين المؤقت، وخصومات الدُفعات التي تحرك فاتورتك الحقيقية أكثر بكثير من السعر الأساسي.
يقدم هذا الدليل تفصيلاً لما تدفعه فعليًا، مع أمثلة عملية. للحصول على نظرة عامة على النموذج، انظر ما هو Claude Opus 4.8. للبدء في البناء، انظر دليل API.
بطاقة الأسعار
| الوضع | الإدخال (لكل مليون رمز) | الإخراج (لكل مليون رمز) | السرعة |
|---|---|---|---|
| قياسي | 5 دولارات | 25 دولارًا | أساسي |
| سريع | 10 دولارات | 50 دولارًا | إخراج أسرع 2.5 مرة |
هناك شيئان بارزان. أولاً، تكلفة رموز الإخراج خمسة أضعاف تكلفة رموز الإدخال، لذا فإن طول استجابات Claude هو ما يحدد فاتورتك، وليس حجم مطالباتك. ثانيًا، الوضع السريع يضاعف السعر للحصول على إخراج أسرع 2.5 مرة. تلاحظ Anthropic أن الوضع السريع أرخص بثلاث مرات تقريبًا مما كان عليه الوضع المعادل في النماذج السابقة، لذا فإن العلاوة على السرعة قد انخفضت جيلاً بعد جيل.
يمكنك تأكيد الأسعار الحالية في وثائق تسعير Anthropic.
ما هو وضع السرعة السريع؟
الوضع القياسي هو الوضع الافتراضي والخيار الصحيح لمعظم أعباء العمل. يوجد الوضع السريع للحالات التي يكون فيها زمن الاستجابة هو المنتج: مساعدو البرمجة المباشرة، الوكلاء التفاعليون، أي شيء يراقب فيه المستخدم المؤشر. تدفع ضعف سعر الرمز المميز للحصول على إخراج يتدفق أسرع 2.5 مرة.
القرار بسيط. إذا كان إنسان ينتظر الاستجابة في الوقت الفعلي، فقد يكون الوضع السريع يستحق العناء. إذا كان العمل يتم في الخلفية، حلقة وكيل، مهمة دفعية، مهمة مجدولة، فابقَ على الوضع القياسي ووفر المال.
كيف يغير الجهد فاتورتك
هذه هي الرافعة التي يغفلها معظم الفرق. يتحكم معامل effort في Opus 4.8 في عدد الرموز التي ينفقها النموذج عبر الاستجابة بأكملها، بما في ذلك استدعاءات الأدوات. نظرًا لأن الإخراج هو النصف الأغلى، فإن تقليل الجهد في العمل الذي لا يتطلب تفكيرًا عميقًا يقلل التكلفة مباشرة.
المستويات الخمسة، من الأرخص إلى الأغلى من حيث الرموز:
low: إجابات موجزة، أقل عدد من استدعاءات الأدوات، أقل إنفاقmedium: متوازنhigh: الافتراضي، شاملxhigh: تفكير عميق، المزيد من استدعاءات الأدوات، موصى به للبرمجةmax: لا توجد قيود، أعلى إنفاق
قد تستخدم مهمة تصنيف بمستوى جهد low عُشر رموز الإخراج التي ستستخدمها بمستوى high. نفس النموذج، نفس السعر، جزء من الفاتورة. يغطي إرشادات الجهد من Anthropic المكان الذي يحافظ فيه كل مستوى على الجودة. الخلاصة: طابق الجهد بالمهمة بدلاً من الدفع مقابل high في كل مكان.
سيناريوهات التكلفة العملية
تستخدم جميع الأرقام التسعير القياسي (5 دولارات للإدخال، 25 دولارًا للإخراج لكل مليون رمز). وهي توضيحية؛ ستختلف أعداد الرموز الحقيقية الخاصة بك.
السيناريو 1: دور روبوت محادثة. 1,000 رمز إدخال، 500 رمز إخراج.
- الإدخال: 1,000 / 1,000,000 x 5 دولارات = 0.005 دولار
- الإخراج: 500 / 1,000,000 x 25 دولارًا = 0.0125 دولار
- المجموع: حوالي 0.018 دولار لكل دورة
عند مستوى جهد low يتقلص الإخراج، مما يدفع تكلفة الدورة الواحدة إلى أقل من سنت.
السيناريو 2: مهمة برمجة وكيلة. 50,000 رمز إدخال من سياق المستودع، 8,000 رمز إخراج بمستوى xhigh.
- الإدخال: 50,000 / 1,000,000 x 5 دولارات = 0.25 دولار
- الإخراج: 8,000 / 1,000,000 x 25 دولارًا = 0.20 دولار
- المجموع: حوالي 0.45 دولار لكل مهمة
إذا تكرر هذا السياق البالغ 50 ألفًا عبر المكالمات، فإن التخزين المؤقت للمطالبة يقلل تكلفة الإدخال إلى حوالي 0.025 دولارًا، مما يقلل الإجمالي إلى حوالي 0.23 دولارًا.
السيناريو 3: وظيفة دفعية ليلية. 1,000,000 رمز إدخال، 200,000 رمز إخراج، يتم تشغيلها عبر Batch API بخصم 50%.
- الإدخال: 1,000,000 / 1,000,000 x 5 دولارات x 0.5 = 2.50 دولار
- الإخراج: 200,000 / 1,000,000 x 25 دولارًا x 0.5 = 2.50 دولار
- المجموع: حوالي 5.00 دولارات للدفعة بأكملها
للمقارنة مع النماذج الأرخص، انظر تفاصيل تسعير Gemini 3.5 Flash و تكلفة Xiaomi MiMo v2.5 API.
التخزين المؤقت للمطالبات: أكبر توفير فردي
إذا أرسلت نفس المطالبة النظامية، أو المستند، أو قاعدة التعليمات البرمجية في كل مكالمة، فأنت تدفع سعر الإدخال الكامل للرموز التي رآها النموذج بالفعل. التخزين المؤقت للمطالبات يحل هذه المشكلة. تتم محاسبة قراءات الإدخال المخزنة مؤقتًا بجزء من معدل الإدخال العادي، حوالي العُشر، بعد الكتابة الأولية للتخزين المؤقت.
وكلاء السياقات الطويلة يوفرون أكثر. مطالبة نظامية تحتوي على 50 ألف رمز يتم احتسابها بسعر كامل في كل مكالمة مكلفة؛ عند التخزين المؤقت، فإن الجزء المتكرر يكلف تقريبًا لا شيء. المكالمة الأولى تكتب التخزين المؤقت، وكل مكالمة لاحقة تقرأه بسعر رخيص.
Batch API والمخرجات الكبيرة
تقوم Batch API بتشغيل المهام بخصم عندما لا تحتاج إلى إجابة في الوقت الفعلي. أرسل مجموعة من الطلبات، واحصل على النتائج خلال نافذة الدفعة، وادفع أقل لكل رمز. كما أنها ترفع سقف الإخراج: يدعم Opus 4.8 ما يصل إلى 300 ألف رمز إخراج عبر Batch API مع رأس بيتا output-300k-2026-03-24، مقابل 128 ألفًا على نقطة النهاية المتزامنة.
استخدمها للتقييمات، والتجميع بالجملة، وتصنيف البيانات، وأي عملية لا يهم فيها تأخر بضع دقائق.
تسعير Opus عبر الأجيال
يحافظ Opus 4.8 على السعر. القصة هي مدى انخفاض السعر قبل جيلين:
| النموذج | الإدخال (لكل مليون) | الإخراج (لكل مليون) |
|---|---|---|
| Opus 4.1 | 15 دولارًا | 75 دولارًا |
| Opus 4.5 | 5 دولارات | 25 دولارًا |
| Opus 4.6 | 5 دولارات | 25 دولارًا |
| Opus 4.7 | 5 دولارات | 25 دولارًا |
| Opus 4.8 | 5 دولارات | 25 دولارًا |
انخفض سعر Opus من 15 دولارًا/75 دولارًا إلى 5 دولارات/25 دولارًا في جيل 4.5 وظل كذلك منذ ذلك الحين، بينما يستمر النموذج وراء السعر في التحسن. تحصل على جودة 4.8 بسعر 4.5. للمقارنة المباشرة مع نماذج الشركات الرائدة الأخرى، انظر Opus 4.8 مقابل GPT-5.5 مقابل Gemini 3.5.
قائمة التحقق من تحسين التكلفة
قبل توسيع نطاق استخدام Opus 4.8، راجع هذه القائمة:
- حدد الجهد لكل مهمة. لا تدفع سعر
highللتصنيف أوxhighللبحث. - اخزن السياق المتكرر مؤقتًا. يجب تخزين المطالبات النظامية، والمستندات، وقواعد التعليمات البرمجية مؤقتًا.
- قم بتجميع المهام غير العاجلة في دفعات. انقل التقييمات والمهام الكبيرة إلى Batch API.
- حدد
max_tokensبحكمة. يحدد هذا الحد الأقصى لتكلفة الإخراج في أسوأ الحالات لكل مكالمة. - ابقَ على الوضع القياسي ما لم يكن هناك إنسان ينتظر في الوقت الفعلي.
- راقب مستويات الاستخدام. ترتفع حدود المعدل والإنفاق معًا؛ تغيير حدود Claude Code الأسبوعية هو تذكير لتتبع الحصة.
تتبع إنفاقك الحقيقي باستخدام Apidog
تختلف التكلفة المقدرة عن التكلفة الفعلية بسرعة بمجرد بدء الإنتاج، لأن الاستجابات الحقيقية تختلف في الطول وعدد استدعاءات الأدوات. الطريقة الأمثل للبقاء على اطلاع هي فحص كائن usage الذي تعيده كل استجابة من Messages API، والذي يبلغ عن أعداد رموز الإدخال والإخراج لكل مكالمة.

Apidog يجعل ذلك مرئيًا:
- أرسل طلب Opus 4.8 حقيقي واقرأ كتلة
usageفي الاستجابة. - قارن عدد الرموز عبر مستويات
effortعلى نفس المطالبة لرؤية فرق التكلفة مباشرة. - احفظ الطلبات لكل عبء عمل وأعد تشغيلها مع تغير مطالباتك.
- قم بمحاكاة نقطة النهاية حتى تتمكن من البناء والاختبار دون إنفاق أي رمز.
قم بتنزيل Apidog، ووجه طلبًا إلى نقطة نهاية Messages، وقم بتشغيل نفس المطالبة بمستويات low وhigh وxhigh. تخبرك أعداد الرموز بالضبط ما يكلفه كل مستوى جهد قبل الالتزام به في الإنتاج.
الأسئلة الشائعة
كم يكلف Claude Opus 4.8؟ 5 دولارات لكل مليون رمز إدخال و25 دولارًا لكل مليون رمز إخراج في الوضع القياسي. الوضع السريع يكلف 10 دولارات و50 دولارًا للحصول على إخراج أسرع 2.5 مرة.
هل Opus 4.8 أغلى من Opus 4.7؟ لا. أسعار الرموز هي نفسها، لذا فإن الترقية من 4.7 لا تغير فاتورتك.
ما الفرق بين تسعير الوضع القياسي ووضع السرعة السريع؟ يضاعف الوضع السريع سعر الرمز الواحد مقابل إخراج يتدفق أسرع بحوالي 2.5 مرة. استخدمه فقط عندما يكون زمن الاستجابة مهمًا لمستخدم ينتظر.
كيف يمكنني خفض تكاليف Opus 4.8؟ اخفض مستوى effort في المهام الأبسط، وقم بتخزين محتوى المطالبات المتكررة مؤقتًا، واجمع المهام غير العاجلة في دفعات، وحافظ على max_tokens ضيقًا. رموز الإخراج هي المحرك الرئيسي للتكلفة.
هل يوفر التخزين المؤقت للمطالبات المال حقًا؟ نعم. بعد المكالمة الأولى التي تكتب التخزين المؤقت، تتم قراءة الإدخال المتكرر بحوالي عُشر معدل الإدخال العادي. وكلاء السياقات الطويلة يوفرون أكثر.
كم عدد رموز الإخراج التي يمكن أن ينتجها Opus 4.8؟ ما يصل إلى 128 ألف رمز على Messages API المتزامنة، وما يصل إلى 300 ألف رمز عبر Batch API مع رأس بيتا output-300k-2026-03-24.
أين أرى استخدام الرموز لكل مكالمة؟ في كائن usage في كل استجابة من Messages API. أدوات مثل Apidog تعرضها حتى تتمكن من مقارنة التكلفة عبر مستويات الجهد.
