أسعار DeepSeek V4 API

نشرت DeepSeek تسعيرة V4 في نفس اليوم الذي صدرت فيه النماذج، 23 أبريل 2026، وقد أعادت الأرقام تحديد المعيار للذكاء الاصطناعي الرائد. تعمل V4-Flash بسعر 0.14 دولار لكل مليون رمز إدخال و 0.28 دولار لكل مليون رمز إخراج. وتعمل V4-Pro بسعر 1.74 دولار للإدخال و 3.48 دولار للإخراج. كلاهما يدعم نافذة سياق بحجم 1 مليون رمز وما يصل إلى 384 ألف رمز إخراج. وكلاهما يقدم أيضًا خصمًا كبيرًا على التكرار في الذاكرة المؤقتة (cache-hit) يخفض تكاليف الإدخال بنسبة 80% إلى 90% على المطالبات المتكررة.

يغطي هذا الدليل بطاقة الأسعار الكاملة، وكيف يغير التخزين المؤقت للسياق التكلفة الفعلية لكل استدعاء، ومقارنة صادقة مع GPT-5.5 و Claude Opus، وأربع طرق للحفاظ على الإنفاق متوقعًا داخل Apidog.

زر

للاطلاع على نظرة عامة على المنتج، راجع ما هو DeepSeek V4. وللاطلاع على دليل المطور، راجع كيفية استخدام DeepSeek V4 API. وللمسارات المجانية، راجع كيفية استخدام DeepSeek V4 مجانًا.

ملخص سريع

V4-Flash: 0.14 دولار / مليون إدخال (عدم تكرار في الذاكرة المؤقتة)، 0.028 دولار / مليون إدخال (تكرار في الذاكرة المؤقتة)، 0.28 دولار / مليون إخراج.
V4-Pro: 1.74 دولار / مليون إدخال (عدم تكرار في الذاكرة المؤقتة)، 0.145 دولار / مليون إدخال (تكرار في الذاكرة المؤقتة)، 3.48 دولار / مليون إخراج.
نافذة السياق: 1 مليون رمز إدخال، 384 ألف رمز إخراج، في كلا الإصدارين.
خصم التكرار في الذاكرة المؤقتة: حوالي خصم 80% على Flash، خصم 92% على Pro للمقدمات المتكررة.
سيتم إيقاف deepseek-chat و deepseek-reasoner في 24 يوليو 2026؛ وستتم محاسبتهما على V4-Flash.
عند أسعار عدم تكرار الذاكرة المؤقتة، V4-Pro أرخص بحوالي 2.9 مرة من GPT-5.5 في الإدخال وأرخص بحوالي 8.6 مرة في الإخراج.

بطاقة الأسعار الكاملة

النموذج	الإدخال (عدم تكرار في الذاكرة المؤقتة)	الإدخال (تكرار في الذاكرة المؤقتة)	الإخراج	السياق
`deepseek-v4-flash`	0.14 دولار / مليون	0.028 دولار / مليون	0.28 دولار / مليون	1 مليون / 384 ألف
`deepseek-v4-pro`	1.74 دولار / مليون	0.145 دولار / مليون	3.48 دولار / مليون	1 مليون / 384 ألف
`deepseek-chat` (سيتم إيقافه في 24-07-2026)	يتم احتسابه على أنه V4-Flash غير تفكيري	—	—	—
`deepseek-reasoner` (سيتم إيقافه في 24-07-2026)	يتم احتسابه على أنه V4-Flash تفكيري	—	—	—

هناك ثلاث تفاصيل تهم أكثر من الأرقام الخام.

أولاً، الأسعار هي نفسها سواء كنت في وضع التفكير أو الوضع غير التفكيري. يحدد معرف النموذج السعر؛ وضع التفكير يغير فقط عدد الرموز التي تستهلكها بهذا السعر.

ثانيًا، تسعيرة التكرار في الذاكرة المؤقتة تلقائية. يستفيد كل طلب بمقدمة متكررة مقابل نفس الحساب؛ لا تحتاج إلى الاشتراك أو إعداد أي شيء. يجب أن تكون المقدمات بطول 1,024 رمزًا على الأقل ويجب أن تتطابق حرفيًا.

ثالثًا، يتم الآن محاسبة معرفات deepseek-chat و deepseek-reasoner الأقدم كـ أسماء مستعارة لـ V4-Flash. إذا لم تكن قد قمت بالترحيل، فأنت تحصل بالفعل على جودة V4-Flash بأسعار V4-Flash؛ الموعد النهائي لإيقاف المعرفات هو 24 يوليو 2026.

التخزين المؤقت للسياق بعبارات بسيطة

التخزين المؤقت هو أكبر عامل لتخفيض التكلفة في DeepSeek V4. النمط بسيط: أي شيء يتكرر عبر الاستدعاءات، خاصة المطالبات الطويلة للنظام، مخططات أدوات الوكيل، وسياق RAG، تتم محاسبته بجزء بسيط من سعر الإدخال الكامل في الاستدعاء الثاني والاستدعاءات اللاحقة.

مثال ملموس. تقوم بتشغيل وكيل بمطالبة نظامية تتكون من 20,000 رمز لا تتغير أبدًا، ثم تطرح 100 سؤال مستخدم مختلف، كل منها 200 رمز.

بدون تخزين مؤقت:

الإدخال: 100 استدعاء × 20,200 رمز × 1.74 دولار / مليون = 3.52 دولار
الإخراج: 100 استدعاء × 500 رمز × 3.48 دولار / مليون = 0.17 دولار
الإجمالي: 3.69 دولار

مع التخزين المؤقت (الاستدعاء الأول يفشل في التكرار، الـ 99 اللاحقة تنجح):

إدخال الاستدعاء الأول: 20,200 × 1.74 دولار / مليون = 0.035 دولار
99 مقدمة متكررة في الذاكرة المؤقتة التالية: 99 × 20,000 × 0.145 دولار / مليون = 0.287 دولار
99 دور مستخدم غير متكرر في الذاكرة المؤقتة التالية: 99 × 200 × 1.74 دولار / مليون = 0.034 دولار
الإخراج: 100 × 500 × 3.48 دولار / مليون = 0.174 دولار
الإجمالي: 0.53 دولار

أرخص بحوالي 7 مرات على نفس حجم العمل. يكون تأثير التخزين المؤقت أكثر وضوحًا في V4-Flash، حيث يكون السعر الخام منخفضًا بالفعل.

كيف تقارن مع GPT-5.5 و Claude

المقارنة التي تهم معظم الفرق بالفعل:

النموذج	الإدخال (عادي)	الإدخال (مخزن مؤقتًا)	الإخراج	السياق
DeepSeek V4-Flash	0.14 دولار / مليون	0.028 دولار / مليون	0.28 دولار / مليون	1 مليون
DeepSeek V4-Pro	1.74 دولار / مليون	0.145 دولار / مليون	3.48 دولار / مليون	1 مليون
GPT-5.5	5 دولارات / مليون	1.25 دولار / مليون	30 دولارًا / مليون	1 مليون
GPT-5.5 Pro	30 دولارًا / مليون	—	180 دولارًا / مليون	1 مليون
Claude Opus 4.6	15 دولارًا / مليون	1.50 دولار / مليون	75 دولارًا / مليون	200 ألف

ثلاث قراءات لهذا الجدول.

بالنسبة لرموز الإخراج، V4-Pro أرخص بحوالي 8.6 مرة من GPT-5.5 وأرخص 21 مرة من Claude Opus 4.6. الإخراج هو حيث تستهلك معظم أعباء عمل الوكلاء ميزانيتها؛ وتزداد الفجوة.
بالنسبة للإدخال المخزن مؤقتًا، V4-Pro أرخص بحوالي 10 مرات من GPT-5.5 المخزن مؤقتًا وأرخص 10 مرات من Claude المخزن مؤقتًا. المطالبات النظامية الطويلة، ومخططات الأدوات، وسياق RAG المتكرر تتأثر بشدة هنا.
بالنسبة لنسبة المعيار الخام، V4-Pro يضاهي أو يتفوق على GPT-5.5 في LiveCodeBench (93.5 مقابل الطبقة العليا) و Codeforces (3206 مقابل 3168) بينما يكلف جزءًا صغيرًا. هذا هو جوهر عرض القيمة للأوزان المفتوحة. راجع ما هو DeepSeek V4 للاطلاع على جدول المعايير الكامل.

تحذيرات صادقة: لا يزال Claude يتفوق على V4-Pro في معايير استرجاع السياق الطويل، ولا يزال Gemini 3.1 Pro يتصدر MMLU-Pro. إذا كانت أعباء عملك تعتمد على استرجاع "الإبرة في كومة القش" عبر مليون رمز، فقد لا تعوض التوفيرات لكل رمز فجوة الجودة.

نمذجة التكلفة لأعباء العمل الشائعة

تغطي أربع أعباء عمل معظم حالات الاستخدام الإنتاجية. إليك ما تكلفه كل منها على V4-Pro (خط الأساس لعدم التكرار في الذاكرة المؤقتة؛ تزداد وفورات التكرار في الذاكرة المؤقتة فوق ذلك).

1. حلقة ترميز الوكيل (سياق 50 ألف، إخراج 2 ألف، 20 استدعاء لكل مهمة)

الإدخال: 50,000 × 20 × 1.74 دولار / مليون = 1.74 دولار
الإخراج: 2,000 × 20 × 3.48 دولار / مليون = 0.14 دولار
تكلفة المهمة الواحدة: حوالي 1.88 دولار

قارن ذلك بـ GPT-5.5 بتكلفة تقارب 6.20 دولار لكل مهمة بنفس الشكل.

2. أسئلة وأجوبة المستندات الطويلة (سياق 500 ألف، إخراج 1 ألف)

الإدخال: 500,000 × 1.74 دولار / مليون = 0.87 دولار
الإخراج: 1,000 × 3.48 دولار / مليون = 0.003 دولار
تكلفة الاستدعاء الواحد: حوالي 0.87 دولار

قارن ذلك بـ GPT-5.5 بتكلفة تقارب 2.53 دولار لكل استدعاء.

3. تصنيف عالي الحجم (سياق 2 ألف، إخراج 200، 10,000 استدعاء)

استخدم V4-Flash هنا؛ V4-Pro مبالغ فيه.

الإدخال: 2,000 × 10,000 × 0.14 دولار / مليون = 2.80 دولار
الإخراج: 200 × 10,000 × 0.28 دولار / مليون = 0.56 دولار
تكلفة التشغيل: حوالي 3.36 دولار

قارن ذلك بـ GPT-5.5 بتكلفة تقارب 110 دولارات لنفس التشغيل.

4. روبوت الدردشة ذو المطالبات المتكررة (مطالبة نظامية 10 آلاف، 500 رمز مستخدم، 1 آلاف إخراج، 1,000 جلسة)

إدخال الاستدعاء الأول: 10,500 × 1.74 دولار / مليون = 0.018 دولار
إدخال متكرر في الذاكرة المؤقتة: 999 × 10,000 × 0.145 دولار / مليون = 1.45 دولار
دورات مستخدم غير متكررة في الذاكرة المؤقتة: 999 × 500 × 1.74 دولار / مليون = 0.87 دولار
الإخراج: 1,000 × 1,000 × 3.48 دولار / مليون = 3.48 دولار
تكلفة تشغيل الجلسة: حوالي 5.82 دولار

قارن ذلك بـ GPT-5.5 مع التخزين المؤقت بتكلفة تقارب 26.35 دولارًا على نفس حجم العمل.

تكاليف خفية يجب الانتباه إليها

السعر المعلن ليس القصة بأكملها. أربعة بنود تكبد الفرق خسائر بعد الشهر الأول:

تضخم رموز وضع التفكير. يستهلك thinking_max رموز إخراج أكثر بمقدار 3 إلى 10 مرات من non-thinking على نفس المطالبة. تتم محاسبة رموز الاستدلال هذه بسعر الإخراج. ضع Think Max خلف علامة.
نمو السياق الصامت. غالبًا ما تعيد حلقات الوكيل تغذية المحادثة بأكملها إلى كل دورة. في سياقات 1 مليون رمز، يتضخم هذا بسرعة. قم بالتقليم أو التلخيص بقوة.
عواصف إعادة المحاولة. حلقة بها خطأ تعيد المحاولة عند كل استجابة 500 يمكن أن تضاعف فاتورتك في ساعة واحدة. أضف تراجعًا أسيًا وحدًا أقصى ثابتًا لإعادة المحاولة لكل طلب.
تقلب التطوير. تكرار المطالبة عبر curl يعيد تشغيل السياق الكامل في كل مرة. استخدام Apidog يقلل هذا إلى ما يقرب من الصفر لأن استبدال المتغيرات يجعل تعديلات المطالبة مجانية لإعادة المحاولة دون إعادة كتابة الحمولة الكاملة.

تتبع التكلفة في Apidog

سير العمل الذي تعتمده معظم الفرق بمجرد أن تصبح الفواتير حقيقية:

قم بتنزيل Apidog وقم بتخزين DEEPSEEK_API_KEY كمتغير سري لكل بيئة.
احفظ طلب POST واحدًا إلى https://api.deepseek.com/v1/chat/completions.
في لوحة الاستجابة، قم بتثبيت usage.prompt_tokens، و usage.completion_tokens، و usage.reasoning_tokens. يعرض كل استدعاء حساب التكلفة على نفس الشاشة مع الإخراج.
قم بتحديد model و thinking_mode كمعلمات حتى تتمكن من مقارنة A/B بين V4-Flash و V4-Pro، و Non-Think مقابل Think Max، دون تكرار الطلبات.
اعكس نفس المجموعة لـ GPT-5.5 (يوثق دليل API الخاص بـ GPT-5.5 المطابق الإعداد). نافذة واحدة، كلا المزودين، التكاليف مرئية.

يستوعب سير العمل هذا ما يقرب من 80% من مفاجآت التكلفة التي تظهر في فواتير نهاية الشهر.

أربع قواعد للحفاظ على الإنفاق متوقعًا

الإعداد الافتراضي هو V4-Flash. انتقل إلى V4-Pro فقط عندما تكون قد قست فجوة جودة تؤثر على الإيرادات.
الإعداد الافتراضي هو Non-Think. ارتقِ إلى Think High في المهام الصعبة. احجز Think Max للعمل الحرج من حيث الدقة.
حد أقصى لـ max_tokens. سقف الإخراج البالغ 384 ألفًا هو إجراء أمان، وليس هدفًا. معظم الإجابات الإنتاجية تتناسب مع 2 ألف.
أرسل بيانات الاستخدام عن بعد. سجل prompt_tokens، و completion_tokens، و reasoning_tokens في كل استدعاء. قم بالتنبيه عند حدوث ارتفاعات في رموز الاستدلال؛ فهي تشير إلى مطالبات انحرفت إلى نطاق Think Max عن طريق الخطأ.

الأسئلة الشائعة

هل هناك طبقة مجانية؟ لا توجد طبقة API مجانية الاستخدام، ولكن الحسابات الجديدة تتلقى أحيانًا رصيدًا تجريبيًا صغيرًا. للمسارات المجانية خارج API، راجع كيفية استخدام DeepSeek V4 مجانًا.

كيف تعمل تسعيرة التكرار في الذاكرة المؤقتة؟ تتم محاسبة المقدمات التي تتكون من 1,024 رمزًا أو أكثر وتتكرر عبر الطلبات داخل نفس الحساب بسعر التكرار في الذاكرة المؤقتة. يدفع الاستدعاء الأول سعر عدم التكرار في الذاكرة المؤقتة؛ وتدفع الاستدعاءات اللاحقة ذات المقدمة المتطابقة السعر المخفض. التخزين المؤقت تلقائي.

هل تكلف أوضاع التفكير أكثر؟ سعر الرمز الواحد هو نفسه. تستهلك أوضاع التفكير المزيد من الرموز لأن النموذج يكتب مسارات استدلالية. تتبع reasoning_tokens في كائن usage لقياس التكلفة الحقيقية.

هل التسعيرة مستقرة؟ يغير DeepSeek التسعيرة بشكل دوري. ظلت أسعار V3.2 سارية لمعظم عام 2025؛ ولا يوجد تاريخ نهاية منشور لتسعيرة V4. تحقق من صفحة التسعيرة المباشرة قبل وضع الميزانية.

هل تتم محاسبة V4-Pro و V4-Flash بنفس سعر الإخراج؟ لا. إخراج V4-Pro هو 3.48 دولار / مليون؛ وإخراج V4-Flash هو 0.28 دولار / مليون. نسبة 12.4x هي أكبر سبب واحد لتعيين V4-Flash كإعداد افتراضي.

هل نقطة نهاية تنسيق Anthropic تغير التسعيرة؟ لا. https://api.deepseek.com/anthropic تستخدم نفس أسعار نقطة نهاية تنسيق OpenAI. التنسيق لا يؤثر على الفوترة.