ملخص سريع
تكلفة كلود سونيت 4.6 هي $3 لكل مليون رمز إدخال و$15 لكل مليون رمز إخراج—نفس سعر سونيت 4.5، مع تقديم أداء يقارب أداء أوبوس. مع التخزين المؤقت للموجهات، تنخفض تكلفة قراءات الذاكرة المؤقتة إلى $0.30/مليون رمز (توفير 90%). واجهة برمجة التطبيقات الدفعية (Batch API) تخفض التكاليف إلى النصف لتصبح $1.50/$7.50 لكل مليون رمز. نافذة السياق البالغة مليون رمز (نسخة تجريبية) تفعّل تسعير السياق الطويل بسعر $6/$22.50 لكل مليون رمز للطلبات التي تتجاوز 200 ألف رمز.
التسعير الأساسي لكلود سونيت 4.6
يحتفظ كلود سونيت 4.6 بنفس نقطة السعر لسابقه مع تقديم نتائج أفضل بشكل ملحوظ. إليك التسعير الأساسي بنظرة سريعة:
| مستوى التسعير | رموز الإدخال | رموز الإخراج |
|---|---|---|
| قياسي | $3.00 / مليون رمز | $15.00 / مليون رمز |
| واجهة برمجة تطبيقات الدفعات | $1.50 / مليون رمز | $7.50 / مليون رمز |
| كتابات التخزين المؤقت (5 دقائق) | $3.75 / مليون رمز | — |
| كتابات التخزين المؤقت (ساعة واحدة) | $6.00 / مليون رمز | — |
| قراءات التخزين المؤقت | $0.30 / مليون رمز | — |
| سياق طويل >200 ألف (قياسي) | $6.00 / مليون رمز | $22.50 / مليون رمز |
| سياق طويل >200 ألف (دفعي) | $3.00 / مليون رمز | $11.25 / مليون رمز |
مليون رمز = مليون رمز. جميع الأسعار بالدولار الأمريكي.
قصة القيمة هنا يصعب تجاهلها. فضل المختبرون الأوائل سونيت 4.6 على نموذج أوبوس 4.5 المميز السابق في 59% من المقارنات المباشرة — بتكلفة 60%.

بالنسبة لمعظم مهام البرمجة والتحليل والمهام الوكيلية، لم تعد بحاجة لدفع أسعار أوبوس للحصول على نتائج بمستوى أوبوس.
زر
تفصيل التسعير الكامل حسب الميزة
التسعير القياسي لواجهة برمجة التطبيقات
تنطبق الأسعار القياسية على جميع مكالمات API المتزامنة التي تتم عبر Anthropic API:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Summarize this document."}]
)
# Check exact token usage
print(f"Input tokens: {response.usage.input_tokens}")
print(f"Output tokens: {response.usage.output_tokens}")
# Calculate cost
input_cost = response.usage.input_tokens / 1_000_000 * 3.00
output_cost = response.usage.output_tokens / 1_000_000 * 15.00
print(f"Request cost: ${input_cost + output_cost:.6f}")
بالنسبة لمكالمة API النموذجية مع إدخال 500 رمز وإخراج 300 رمز، تبلغ التكلفة حوالي 0.0060 دولار. هذا أقل من سنت واحد لكل طلب بالأسعار القياسية.
تسعير التخزين المؤقت للموجهات
التخزين المؤقت للموجهات هو أهم رافعة لخفض التكلفة في سونيت 4.6. يخزن أجزاء من موجهك على جانب الخادم ويفرض رسومًا أقل بكثير عند وجود تطابق في الذاكرة المؤقتة (cache hits).
معدلات كتابة التخزين المؤقت:- تخزين مؤقت لمدة 5 دقائق: $3.75/مليون رمز (1.25× سعر الإدخال الأساسي) - تخزين مؤقت لمدة ساعة واحدة: $6.00/مليون رمز (2× سعر الإدخال الأساسي)
معدل قراءة التخزين المؤقت:- $0.30/مليون رمز — عُشر سعر الإدخال القياسي
إذا كان موجه نظامك 10,000 رمز وتعالج 1,000 طلب يوميًا: - بدون تخزين مؤقت: 10,000 × 1,000 × $3/مليون رمز = $30/يوم- مع التخزين المؤقت (كتابة مرة واحدة، قراءة 999 مرة): $3.75 + (999 × 0.30) × 10,000/مليون رمز ≈ $3.04/يوم
هذا يمثل تخفيضًا بنسبة 90% لموجه نظام ثابت وحده.
import anthropic
client = anthropic.Anthropic()
# Mark expensive static content for caching
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "You are a senior code reviewer specializing in Python, FastAPI, and distributed systems. Here are our coding standards and review guidelines: [large block of standards text]...",
"cache_control": {"type": "ephemeral"} # تخزين هذه الكتلة مؤقتاً
}
],
messages=[{"role": "user", "content": "Review this pull request: [PR content]"}]
)
# Check what came from cache vs fresh tokens
usage = response.usage
print(f"Cache write tokens: {usage.cache_creation_input_tokens}")
print(f"Cache read tokens: {usage.cache_read_input_tokens}")
print(f"Uncached tokens: {usage.input_tokens}")
متى تستخدم مدة التخزين المؤقت:- تخزين مؤقت لمدة 5 دقائق: المكالمات عالية التردد، حركة المرور المتقطعة، نوافذ المحادثة القصيرة - تخزين مؤقت لمدة ساعة واحدة: مسارات معالجة الخلفية، المهام الدفعية ذات الفجوات الأطول، حلقات الوكيل
تسعير واجهة برمجة التطبيقات الدفعية
تقدم واجهة برمجة التطبيقات الدفعية (Batch API) خصمًا ثابتًا بنسبة 50% على رموز الإدخال والإخراج مقابل المعالجة غير المتزامنة (النتائج متاحة خلال 24 ساعة، وعادة ما تكون أسرع بكثير).
| قياسي | واجهة برمجة تطبيقات الدفعات | |
|---|---|---|
| الإدخال | $3.00/مليون رمز | $1.50/مليون رمز |
| الإخراج | $15.00/مليون رمز | $7.50/مليون رمز |
أفضل حالات الاستخدام لواجهة برمجة التطبيقات الدفعية:- مسارات الإشراف على المحتوى - تصنيف المستندات على نطاق واسع - إثراء البيانات ليلاً - إنشاء التضمينات أو الملخصات لمجموعات البيانات الكبيرة - أي معالجة غير تفاعلية لا يهم فيها وقت الاستجابة
بتكلفة $1.50/$7.50 لكل مليون رمز، فإن معالجة مليون مستند، كل منها بـ 500 رمز إدخال و100 رمز إخراج، يكلف: - الإدخال: 500 مليون رمز × $1.50/مليون رمز = $750- الإخراج: 100 مليون رمز × $7.50/مليون رمز = $750- الإجمالي: $1,500 لمليون مستند (~$0.0015 لكل مستند)
واجهة برمجة التطبيقات الدفعية: خصم 50% لأعباء العمل غير الفورية
المعالجة الدفعية مباشرة: أرسل الطلبات، واحصل على النتائج بشكل غير متزامن بنصف السعر. المقايضة هي وقت الاستجابة (latency) — تصل النتائج خلال 24 ساعة، على الرغم من أنها عادة ما تكون أسرع بكثير.
import anthropic, time
client = anthropic.Anthropic()
def batch_classify(texts: list[str]) -> list[str]:
"""Classify a list of texts at Batch API rates.""" # تصنيف قائمة نصوص بأسعار واجهة برمجة تطبيقات الدفعات.
# Submit batch
requests = [
{
"custom_id": f"item-{i}",
"params": {
"model": "claude-sonnet-4-6",
"max_tokens": 20,
"messages": [{
"role": "user",
"content": f"Classify as POSITIVE, NEGATIVE, or NEUTRAL. Reply with one word only.\n\n{text}" # صنف كـ إيجابي، سلبي، أو محايد. أجب بكلمة واحدة فقط.
}]
}
}
for i, text in enumerate(texts)
]
batch = client.messages.batches.create(requests=requests)
# Poll until complete
while True:
status = client.messages.batches.retrieve(batch.id)
if status.processing_status == "ended":
break
time.sleep(60)
# Collect results in order
results = {}
for result in client.messages.batches.results(batch.id):
if result.result.type == "succeeded":
results[result.custom_id] = result.result.message.content[0].text.strip()
return [results.get(f"item-{i}", "ERROR") for i in range(len(texts))]
تسعير السياق الطويل (مليون رمز)
عند تمكين نافذة السياق البالغة مليون رمز عبر رأس النسخة التجريبية context-1m-2025-08-07، يتم فرض رسوم على الطلبات التي تتجاوز 200 ألف رمز إدخال بسعر أعلى.
جدول أسعار السياق الطويل
| رموز الإدخال | سعر الإدخال | سعر الإخراج |
|---|---|---|
| ≤ 200 ألف | $3.00/مليون رمز | $15.00/مليون رمز |
| > 200 ألف | $6.00/مليون رمز | $22.50/مليون رمز |
يستند حد الـ 200 ألف إلى إجمالي رموز الإدخال، والتي تشمل: - input_tokens (إدخال قياسي) - cache_creation_input_tokens (إذا تم استخدام التخزين المؤقت للموجهات) - cache_read_input_tokens (إذا تم استخدام التخزين المؤقت للموجهات)
إذا تجاوز الإجمالي 200 ألف، فسيتم فرض رسوم على جميع الرموز في ذلك الطلب بالسعر الأعلى.
السياق الطويل + واجهة برمجة التطبيقات الدفعية
خصم 50% لواجهة برمجة التطبيقات الدفعية يتراكم مع تسعير السياق الطويل:
| السيناريو | معدل الإدخال | معدل الإخراج |
|---|---|---|
| قياسي | $3.00/مليون رمز | $15.00/مليون رمز |
| سياق طويل (>200 ألف) | $6.00/مليون رمز | $22.50/مليون رمز |
| واجهة برمجة تطبيقات الدفعات | $1.50/مليون رمز | $7.50/مليون رمز |
| سياق طويل + دفعي | $3.00/مليون رمز | $11.25/مليون رمز |
تساعد معالجة المستندات الكبيرة بكميات كبيرة عبر واجهة برمجة التطبيقات الدفعية في الحفاظ على تكاليف السياق الطويل ضمن الحدود المعقولة.
تسعير الأدوات والميزات
تحمل العديد من الأدوات رسومًا منفصلة تتجاوز تكاليف الرموز.
أداة البحث عبر الويب
$10.00 لكل 1,000 عملية بحث
+ تكاليف الرموز القياسية للمحتوى الناتج عن البحث
تحتسب كل مكالمة بحث عبر الويب كاستخدام واحد بغض النظر عن عدد النتائج التي يتم إرجاعها. لا توجد رسوم إذا حدث خطأ في البحث.
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
betas=["code-execution-web-tools-2026-02-09"],
tools=[{"type": "web_search_20260209", "name": "web_search"}],
messages=[{"role": "user", "content": "What's the latest LLM benchmark news from this week?"}]
)
usage = response.usage
search_count = getattr(usage, 'server_tool_use', {})
print(f"Web searches used: {search_count.get('web_search_requests', 0)}") # عدد عمليات البحث عبر الويب المستخدمة:
# Each search: $0.01 # كل بحث: $0.01
أداة تنفيذ الأكواد
مجانية عند تجميعها مع البحث عبر الويب أو جلب الويب (باستخدام إصدارات الأداة web_search_20260209 أو web_fetch_20260209).
عند استخدامها بشكل مستقل: - 1,550 ساعة مجانية لكل مؤسسة شهريًا - $0.05 لكل ساعة لكل حاوية بعد الطبقة المجانية - وحدة الفوترة الدنيا: 5 دقائق
بالنسبة لمعظم أعباء عمل التطوير والاختبار، الطبقة المجانية كافية وزيادة.
أداة جلب الويب
لا توجد رسوم إضافية. أنت تدفع فقط تكاليف الرموز القياسية للمحتوى الذي يدخل المحادثة.
| الأداة | التكلفة الإضافية | ملاحظات |
|---|---|---|
| البحث عبر الويب | $10/1 ألف عملية بحث | رسوم لكل عملية بحث |
| جلب الويب | مجاني | تكاليف الرموز فقط |
| تنفيذ الأكواد (مع أدوات الويب) | مجاني | مجمع |
| تنفيذ الأكواد (مستقل) | $0.05/ساعة بعد 1,550 ساعة مجانية/شهريًا | لكل حاوية |
| تكاليف استخدام الحاسوب | ~735 رمز إدخال إضافي | لكل تعريف أداة |
| تكاليف محرر النصوص | ~700 رمز إدخال إضافي | لكل تعريف أداة |
تكاليف استخدام الحاسوب الإضافية
يضيف استخدام الحاسوب تكاليف رموز ثابتة: - إضافة موجه النظام: 466–499 رمزًا - رموز تعريف الأداة: 735 رمزًا لكل أداة (نماذج كلود 4.x)
بالنسبة لجلسة استخدام الحاسوب مع 100 دورة بـ 200 رمز/دورة بالإضافة إلى لقطات الشاشة: - تكاليف الأداة الإضافية: 735 رمزًا × $3/مليون رمز = $0.0022 (ضئيلة) - رموز لقطات الشاشة تعتمد على الدقة؛ خطط لـ ~2,000–5,000 رمز لكل لقطة شاشة
كلود سونيت 4.6 مقابل جميع النماذج: مقارنة كاملة
تسعير النماذج الحالية
| النموذج | الإدخال | الإخراج | قراءة الذاكرة المؤقتة | إدخال دفعي | إخراج دفعي |
|---|---|---|---|---|---|
| كلود سونيت 4.6 | $3.00 | $15.00 | $0.30 | $1.50 | $7.50 |
| كلود هايكو 4.5 | $1.00 | $5.00 | $0.10 | $0.50 | $2.50 |
| كلود أوبوس 4.6 | $5.00 | $25.00 | $0.50 | $2.50 | $12.50 |
| كلود أوبوس 4.5 | $5.00 | $25.00 | $0.50 | $2.50 | $12.50 |
| كلود أوبوس 4.1 | $15.00 | $75.00 | $1.50 | $7.50 | $37.50 |
جميع الأسعار بالدولار الأمريكي لكل مليون رمز.
سونيت 4.6 مقابل أوبوس 4.6: سؤال القيمة
| كلود سونيت 4.6 | كلود أوبوس 4.6 | |
|---|---|---|
| سعر الإدخال | $3/مليون رمز | $5/مليون رمز |
| سعر الإخراج | $15/مليون رمز | $25/مليون رمز |
| التكلفة النسبية | 1× | 1.67× |
| SWE-bench تم التحقق منه | 79.6% | ~80.8% |
| OSWorld (استخدام الحاسوب) | 72.5% | 72.7% |
| تفضيل المستخدم مقابل سونيت 4.5 | 70% | غير متوفر |
| تفضيل المستخدم مقابل أوبوس 4.5 | 59% | غير متوفر |
| نافذة سياق 1 مليون | نعم (تجريبي) | نعم (تجريبي) |
| تفكير تكيفي | نعم | نعم |
| الحد الأقصى للإخراج | 64 ألف رمز | 128 ألف رمز |
بالنسبة للغالبية العظمى من المهام—البرمجة، التحليل، معالجة المستندات، سير العمل الوكيلي—يتطابق سونيت 4.6 مع أداء أوبوس بنسبة 60% من السعر. يستحق أوبوس 4.6 السعر الإضافي عندما تحتاج إلى 128 ألف رمز إخراج أو أقصى قدر مطلق في مهام الاستدلال الجديدة.
سونيت 4.6 مقابل هايكو 4.5: متى تستخدم كل منهما
| حالة الاستخدام | سونيت 4.6 | هايكو 4.5 |
|---|---|---|
| توليد كود معقد | ✅ | ⚠️ |
| تصنيف بسيط | ⚠️ مبالغة | ✅ |
| تلخيص المستندات | ✅ | ✅ |
| مهام وكيلية متعددة الخطوات | ✅ | ❌ |
| حجم كبير وتعقيد منخفض | ❌ مكلف | ✅ |
| استدعاء الأدوات / استخدام الوظائف | ✅ | ✅ |
| سلاسل استدلال طويلة | ✅ | ❌ |
| تطبيقات حساسة لوقت الاستجابة | ✅ سريع | ✅ الأسرع |
النموذج الذكي: استخدم هايكو 4.5 للتوجيه والتصنيف والاستخراج البسيط؛ وجه المهام المعقدة إلى سونيت 4.6. يكلف هذا النهج الهجين عادة 60-80% أقل من سونيت 4.6 لكل شيء.
اختبار التكاليف باستخدام Apidog قبل الإطلاق المباشر
قبل النشر إلى الإنتاج، تريد معرفة التكلفة الدقيقة لكل طلب. يتيح لك عميل API المرئي من Apidog اختبار مكالمات كلود سونيت 4.6، وفحص الاستجابة الكاملة بما في ذلك الكائن usage، وتتبع عدد الرموز لكل طلب.

إعداد رؤية التكلفة في Apidog
- أنشئ طلب POST جديدًا إلى
https://api.anthropic.com/v1/messages - أضف الرؤوس:
x-api-key،anthropic-version: 2023-06-01،Content-Type: application/json - اضبط الجسم بنموذجك ورسائلك
- شغل الطلب — يعرض كائن
usageفي الاستجابة عدد الرموز الدقيق
{
"usage": {
"input_tokens": 523,
"cache_creation_input_tokens": 5000,
"cache_read_input_tokens": 0,
"output_tokens": 312
}
}
من هذه الأرقام، احسب التكلفة الفعلية: - الإدخال: 523 رمزًا × $3/مليون رمز = $0.00157 - كتابة التخزين المؤقت: 5,000 رمز × $3.75/مليون رمز = $0.01875 - الإخراج: 312 رمزًا × $15/مليون رمز = $0.00468 - إجمالي المكالمة الأولى: $0.025 (المكالمات اللاحقة مع تطابق في الذاكرة المؤقتة: ~$0.006)
يمكنك حفظ هذه الطلبات كمجموعة في Apidog، ومشاركتها مع فريقك، وتشغيل تقديرات التكلفة عبر اختلافات الموجهات المختلفة قبل وضع اللمسات الأخيرة على تصميم الإنتاج الخاص بك.
هل أنت مستعد للبدء في البناء؟ قم بتنزيل Apidog مجانًا لاختبار مكالمات Claude Sonnet 4.6 API بشكل مرئي، وفحص استخدام الرموز لكل طلب، وتحديد تكاليفك بدقة قبل النشر.
زر
