حول DeepSeek الخصم المؤقت الأكثر قوة في تسعير نماذج اللغة الكبيرة (LLM) لعام 2026 إلى الوضع الطبيعي الجديد. في 22 مايو، أعلن الفريق أن عرض DeepSeek-V4-Pro بخصم 75%، والذي كان من المقرر في الأصل أن ينتهي في 31 مايو 2026 الساعة 15:59 بالتوقيت العالمي المنسق (UTC)، لن يتراجع. يصبح السعر الترويجي هو سعر القائمة الدائم. ينخفض سعر الإدخال إلى 0.435 دولار لكل مليون رمز، والإخراج إلى 0.87 دولار، ومرات التخزين المؤقت (cache hits) إلى 0.003625 دولار. أدناه، نستعرض ما تغير، وما بقي كما هو، وما يجب على كل مطور واجهة برمجة تطبيقات (API) إعادة النظر فيه هذا الأسبوع.
باختصار
- أصبح تسعير DeepSeek-V4-Pro API دائمًا الآن بربع السعر الأصلي: 0.435 دولار/مليون رمز للإدخال، 0.87 دولار/مليون رمز للإخراج، 0.003625 دولار/مليون رمز لمرات التخزين المؤقت.
- الخصم الترويجي بنسبة 75% الذي كان من المقرر أن ينتهي في 31 مايو 2026 هو الآن السعر العادي. لا تراجع. لا انتهاء مفاجئ.
- V4-Pro أصبح الآن أرخص بنحو 34 مرة من GPT-5.5 على الإخراج بينما يقع ضمن حوالي 95% من أداء GPT-5.5 في معظم معايير البرمجة والاستدلال.
- سعر التخزين المؤقت (cache-hit) البالغ 0.003625 دولار/مليون رمز، وهو تخفيض بنسبة 90% فوق التخفيض الرئيسي، هو التفصيل الذي لم يتم تقديره بالشكل الكافي. أصبحت مطالبات النظام الطويلة الآن شبه مجانية في البادئة.
- إذا قمت بتسعير ميزات الذكاء الاصطناعي الخاصة بك بناءً على GPT-5.5 أو Claude Opus 4.7 في الربع الأخير، فقد تغيرت معادلة البناء هذا الأسبوع.
لماذا يهم هذا الآن
عادة ما يتحرك تسعير نماذج اللغة الكبيرة (LLM) في اتجاه واحد: إلى الأسفل، ببطء، مع هوامش سفلية. لكن DeepSeek تجاوز الهوامش السفلية. أجرى الفريق عرضًا ترويجيًا قويًا خلال مايو، وراقب تزايد حركة المطورين، وقرر تثبيت السعر بدلاً من السماح له بالارتداد. هذه إشارة هيكلية حول اتجاه اقتصاديات النماذج الحدودية الصينية، وليست مجرد حيلة لمرة واحدة.
إذا كنت تقوم بشحن أي منتج يستدعي نموذج لغة كبير (LLM) في مسار حرج (إكمال تلقائي، دردشة معززة بالاسترجاع، مراجعة التعليمات البرمجية، حلقات الوكلاء)، فإن الفرق بين 3.48 دولار و 0.87 دولار لكل مليون رمز إخراج سيظهر في فاتورتك هذا الشهر. إذا كنت تشحن 50 مليون رمز إخراج يوميًا، وهو حمل واقعي لأي وكيل لديه مستخدمون غير تافهين، فإن السعر الجديد يخفض فاتورة LLM الشهرية الخاصة بك من حوالي 5,200 دولار إلى 1,300 دولار. هذا يعادل توظيف مندوب مبيعات، أو توفير سنة من أرصدة وحدات معالجة الرسوميات (GPU).
هل تبني فوق DeepSeek؟ يتيح لك Apidog إنشاء واختبار ومراقبة استدعاءات API لـ V4-Pro في مساحة عمل واحدة، بما في ذلك التدفق، واستدعاءات الأدوات، والتحقق من صلاحية مخطط JSON. قم بتنزيل Apidog ويمكنك استنساخ الطلبات في هذه المقالة في أقل من دقيقة.
في بقية هذا المنشور، سترى ورقة الأسعار الجديدة الكاملة، مقارنة مباشرة مع GPT-5.5 و Claude Opus 4.7، وحسابات مرات التخزين المؤقت التي تفوتها معظم المقالات، وثلاثة سيناريوهات فواتير حقيقية، وإطار عمل قرار من خمس خطوات لتحديد ما إذا كان يجب الترحيل اليوم.
ما الذي تغير: فك شفرة الإعلان
إشعار تسعير DeepSeek الرسمي قصير، ولكن كل سطر يغير رقمًا. ثلاث حقائق تستحق الاستخلاص:
- الخصم بنسبة 75% دائم. كان من المفترض أن يعود العرض الترويجي الذي يستمر حتى 31 مايو 2026 الساعة 15:59 بالتوقيت العالمي المنسق إلى سعر القائمة الأصلي في الأول من يونيو. لن يحدث ذلك. سعر العرض الترويجي هو سعر القائمة الجديد، بأثر رجعي منذ الإطلاق وإلى أجل غير مسمى.
- التخفيض ينطبق على V4-Pro فقط. DeepSeek-V4-Flash، بسعر 0.14 دولار / 0.28 دولار لكل مليون رمز، كان رخيصًا بالفعل. ما انخفض هو V4-Pro، نموذج الفئة الحدودية. راجع ما هو DeepSeek V4 لمعرفة الفرق بين Flash و Pro.
- تم تخفيض تسعير مرات التخزين المؤقت (cache-hit) إلى 1/10 من سعر الإطلاق، اعتبارًا من 26 أبريل 2026 الساعة 12:15 بالتوقيت العالمي المنسق. هذا تغيير منفصل عن التخفيض الرئيسي بنسبة 75%، وكلاهما يتراكم. النتيجة: مرات التخزين المؤقت بسعر 0.003625 دولار/مليون رمز، وهو أدنى سعر تخزين مؤقت لنموذج حدودي من جهة أولى في السوق عام 2026.
بالقراءة المتأنية، يشير الإعلان إلى: DeepSeek على استعداد لاستيعاب الهامش الإجمالي على النموذج الرئيسي للحفاظ على اهتمام المطورين. تشير خطوة التخزين المؤقت إلى: إنهم يريدون منك بناء وكلاء وأدوات ذات سياق طويل على V4-Pro على وجه التحديد. كلا التحركين يشيران إلى نفس استراتيجية اللعب. الفوز بحمل عمل الاستدلال الآن، وتحقيق الدخل من المنصة لاحقًا.
ورقة الأسعار الدائمة الجديدة
التسعير لكل مليون رمز، بالدولار الأمريكي، ساري المفعول فورًا ودائمًا:
| نوع الرمز | القائمة القديمة | القائمة الدائمة الجديدة | التخفيض |
|---|---|---|---|
| الإدخال (عدم وجود تخزين مؤقت) | $1.74 | $0.435 | 75% |
| الإدخال (وجود تخزين مؤقت) | $0.0145 | $0.003625 | 75% |
| الإخراج | $3.48 | $0.87 | 75% |
بعض الاستنتاجات التي تخفيها الطاولة:
- انخفاض سعر الإخراج هو الذي يؤثر على فاتورتك بشدة، لأن رموز الإخراج تهيمن على أي حلقة وكيل حيث يقوم النموذج بالاستدلال أو كتابة التعليمات البرمجية.
- يبدو صف التخزين المؤقت ضئيلًا لأن الأرقام المطلقة ضئيلة. النسبة هي حيث تكمن التوفيرات. نسبة عدم وجود تخزين مؤقت إلى وجود تخزين مؤقت للإدخال هي حوالي 120:1. يدفع نظام مطالبات مصمم جيدًا يحقق التخزين المؤقت بنسبة 90% من الوقت تقريبًا لا شيء مقابل الإدخال، وهذا هو المفتاح لأي وكيل لديه هيكل ثابت.
- هذه الأسعار تنطبق على واجهة برمجة التطبيقات (API) فقط. يظل دردشة الويب الخاصة بـ DeepSeek مجانية للأفراد.
للحصول على سياق تاريخي أعمق حول مستويات تسعير V4 ومقايضات Flash-vs-Pro، راجع مرجعنا الثابت تسعير DeepSeek V4 API.
كيف يقارن V4-Pro الآن بـ GPT-5.5 و Claude Opus 4.7 و Gemini 3.5 Flash
المقارنة المثيرة للاهتمام ليست مع V4-Pro القديم. بل مع بقية الرف الحدودي.
| النموذج | الإدخال ($/مليون رمز) | الإخراج ($/مليون رمز) | SWE-bench Pro |
|---|---|---|---|
| DeepSeek-V4-Pro (الجديد) | $0.435 | $0.87 | 55.4% |
| GPT-5.5 | $5.00 | $30.00 | 58.6% |
| Claude Opus 4.7 | $3.00 | $15.00 | ~62% |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | ~48% |
| DeepSeek-V4-Flash | $0.14 | $0.28 | ~42% |
هناك رقمان يجب تذكرهما. بالنسبة لرموز الإخراج، البند الذي يزيد فاتورتك، فإن DeepSeek-V4-Pro أرخص بـ 34 مرة من GPT-5.5 و17 مرة أرخص من Claude Opus 4.7. أما بالنسبة للمعايير، فإن V4-Pro يقع ضمن 3 إلى 7 نقاط مئوية من GPT-5.5 في معظم التقييمات العامة للبرمجة والاستدلال، وفقًا لمقارنة DataCamp.
إذا كان حجم عملك يتحمل زمن الوصول ومقبول الجودة في تلك النطاق الضيق، فإن الترحيل هو مشكلة رياضية ذات إجابة واحدة. بالنسبة لأحجام العمل حيث تهم آخر 5 نقاط من نتيجة المعيار (موثوقية أداة الوكيل، التخطيط طويل الأمد، الرياضيات الصعبة)، لا يزال V4-Pro أرخص للاستخدام كنموذج مسودة خلف نمط فك التشفير التخميني أو النقدي.
للمراجعات المتعمقة وجهاً لوجه، راجع DeepSeek V4 مقابل Claude Opus 4.5 للبرمجة و GLM-5 مقابل DeepSeek V3 مقابل GPT-5: السرعة، التكلفة، ومقارنة عملية للمطورين.
زاوية التخزين المؤقت التي تفوتها معظم المقالات
الكل يستشهد برقم الإخراج البالغ 0.87 دولار. قليلون يشرحون ما يفعله سعر الإدخال البالغ 0.003625 دولار لمرات التخزين المؤقت بتصميم النظام.
تحدث مرات التخزين المؤقت لمطالبة DeepSeek عندما تكون بادئة طلبك مطابقة تمامًا بالبايت لطلب سابق حديث، ضمن نافذة زمنية تبلغ حوالي 30 دقيقة. بالنسبة لوكلاء الدردشة وخطوط أنابيب الاسترجاع، تكون البادئة عادةً هي مطالبة النظام الخاصة بك بالإضافة إلى تعريفات الأدوات بالإضافة إلى هياكل التعليمات. عادة ما تكون هذه 4,000 إلى 10,000 رمز لا تتغير بين الأدوار.
مثال ملموس. لنفترض أن مساعدك يستخدم مطالبة نظام مكونة من 6,000 رمز ويتعامل مع 100,000 جولة دردشة يوميًا، بمتوسط رسالة مستخدم تبلغ 200 رمز إدخال ومتوسط استجابة يبلغ 800 رمز إخراج.
- بدون مرات التخزين المؤقت: 100,000 جولة × 6,200 رمز إدخال × 0.435 دولار / 1,000,000 = 269.70 دولارًا يوميًا على الإدخال وحده.
- مع 90% من رموز مطالبة النظام هذه التي تضرب التخزين المؤقت: تدفع نفس 100,000 جولة 200 × 0.435 دولار بالإضافة إلى 6,000 × (0.9 × 0.003625 دولار + 0.1 × 0.435 دولار) لكل مليون رمز. وهذا يعادل حوالي 32 دولارًا في اليوم. تخفيض بنسبة 88% في تكلفة الإدخال.
هذا ليس خطأ تقريبيًا. إنه الفرق بين أن يكون النموذج بندًا مستدامًا في الميزانية وبندًا فاخرًا. للمزيد حول كيفية عمل التخزين المؤقت للبادئات عبر المزودين، يتعمق تحليلنا المتعمق للتخزين المؤقت للمطالبات في الآليات.
ثلاثة أنماط للحصول على مرات التخزين المؤقت في الوكلاء الحقيقيين:
- تثبيت البادئة. حافظ على مطالبة النظام، ومخططات الأدوات، وأمثلة اللقطات القليلة في كتلة واحدة في بداية كل طلب. لا تداخل النص الخاص بالجلسة في البادئة.
- فرز أو تجزئة السياق الديناميكي. إذا قمت بإلحاق أجزاء مسترجعة، فقم بفرزها بثبات أو تجزئة الطلب وتوجيه التجزئات المتطابقة إلى نفس العقدة. تؤدي التحولات الصغيرة في البصمة إلى قتل التخزين المؤقت.
- تشغيل مكالمة تسخين. عند بدء تشغيل الوكيل، أرسل طلبًا واحدًا مع البادئة الكاملة لوضعه في ذاكرة التخزين المؤقت للمزود قبل وصول حركة مرور المستخدمين.
ما يجب عليك فعله هذا الأسبوع
قرار الترحيل ليس ثنائيًا. يعتمد على نوع حمل عمل LLM الذي تديره. إطار عمل من خمس خطوات:
1. قياس نسبة الإخراج إلى الإدخال الحالية. إذا كنت تنفق 80% من ميزانية الرموز الخاصة بك على الإخراج (أي وكيل، أو مولد تعليمات برمجية، أو أداة محتوى)، فإن التوفيرات من V4-Pro كبيرة. إذا كنت تنفق 80% على الإدخال (RAG على المستندات الطويلة)، فإن التوفيرات أصغر ولكنها لا تزال حقيقية بمجرد حدوث مرات التخزين المؤقت.
2. قم بإجراء تقييم على 100 عينة على حمل عملك الحقيقي. لا تثق في المعايير العامة. اسحب 100 تتبع من حركة مرور الإنتاج الخاصة بك، وقم بتشغيلها مقابل V4-Pro والنموذج الحالي الخاص بك مع مطالبات متطابقة، وقم بالتقييم بواسطة حكمك الخاص. تجد معظم الفرق أن V4-Pro "جيد بما فيه الكفاية" لـ 70% إلى 85% من حركة مرورهم.
3. مطابقة الأنماط حسب المسار. وجه 70% إلى 85% إلى V4-Pro واحتفظ بالنموذج المتميز الخاص بك على الجزء الصعب. يحقق هذا التغيير الواحد أكثر من 70% من توفير التكاليف مع تدهور في الجودة شبه معدوم.
4. تثبيت بادئات التخزين المؤقت. قم بمراجعة مطالبات النظام الخاصة بك. أي شيء يتغير لكل طلب (الطوابع الزمنية، معرفات المستخدم، معرفات الجلسة) ينتمي إلى رسالة المستخدم، وليس مطالبة النظام. قم بتحريكه.
5. إعداد اختبارات الانحدار قبل الشحن. هنا يبرز دور Apidog. سجل الاستجابات الذهبية من نموذجك الحالي، ثم أعد تشغيل نفس الطلبات مقابل V4-Pro وقارن المخرجات. يلتقط التحقق من مخطط JSON الخاص بـ Apidog أي انحراف في أشكال استدعاء الأدوات قبل وصولها إلى الإنتاج. قم بتنزيل Apidog، وقم باستيراد مجموعتك المتوافقة مع OpenAI، وقم بتغيير عنوان URL الأساسي إلى https://api.deepseek.com، ويمكنك تشغيل اختبار دخان جنبًا إلى جنب في أقل من عشر دقائق.
للحصول على جولة عملية لشكل نقطة نهاية V4-Pro، راجع كيفية استخدام DeepSeek V4 API.
كيف يقارن V4-Pro بتخفيضات الأسعار الأخرى لعام 2026
DeepSeek ليس المختبر الوحيد الذي يخفض الأسعار. سوق LLM لعام 2026 يمر بمرحلة واضحة من ضغط الهامش:
- OpenAI O3 انخفض بنسبة 80% في وقت سابق من هذا العام. راجع تحليل تسعير O3 الخاص بنا للحصول على الحسابات.
- أعادت Kimi K2 تسعيرها بقوة للمنافسة مع فئة V3 من DeepSeek. يغطي تسعير Kimi K2 API التفاصيل.
- حافظت Anthropic Claude على تسعير Opus ولكنها قدمت فئات Haiku و Sonnet الأرخص. يستعرض التحليل الكامل لتكلفة Claude API مكان كل فئة.
تخفيض V4-Pro هو الأكثر قوة هذا العام لأنه يستهدف نطاق القدرات الحدودية، وليس الفئة الاقتصادية. لهذا السبب أعاد هذا الإعلان تحديد السوق ولم تفعل الآخرون.
تغيرت معادلة البناء
لم يقم DeepSeek بتخفيض السعر. لقد أعادوا رسم المنحنى. أصبحت القدرة الحدودية بسعر إخراج أقل من دولار هي الأساس الآن، وليست الاستثناء، وسيستجيب بقية السوق. إذا كنت تؤجل ميزة LLM لأسباب تتعلق بالتكلفة، فمن المحتمل أن تكون ميزانية 2026 التي حددتها في الربع الأخير مبالغًا فيها بأربع مرات.
ثلاث خطوات تالية:
- راجع أفضل ثلاثة أحمال عمل LLM لديك مقابل الإطار أعلاه واختر واحدًا لترحيله هذا الأسبوع.
- ثبت بادئات التخزين المؤقت الخاصة بك. هذا هو الفوز الرخيص بغض النظر عن النموذج الذي تستخدمه.
- قم بتوصيل مجموعة اختبار الانحدار Apidog حتى يستغرق التخفيض التالي في الأسعار، وسيكون هناك واحد، ساعات لتقييمه بدلاً من أسابيع.
تم إزالة علامة الترويج. لكن الخصم لم يُلغَ.
