تسعير GLM-5.2: تكلفة API، المدخلات المخزنة مؤقتًا، وفئات خطط ترميز GLM (2026)

GLM-5.2 هو الطريقة الرخيصة لتشغيل نموذج برمجة متطور. تقدمه Z.ai (Zhipu AI) بأوزان مفتوحة بموجب ترخيص MIT، مع نافذة سياق بحجم مليون رمز (1M-token)، وبطاقة أسعار API تقلل بشكل كبير من أسعار المختبرات الكبيرة المغلقة. هذه الصفحة هي الصفحة الأساسية للمعلومات المالية. ستحصل هنا على التكلفة الدقيقة لواجهة برمجة التطبيقات (API) لكل رمز، وكيف يعمل خصم الإدخال المخزن مؤقتًا، وأمثلة عملية بالدولار لجلسات البرمجة الحقيقية، ومستويات الاشتراك في خطة برمجة GLM (GLM Coding Plan)، وقراءة صريحة حول ما إذا كان GLM-5.2 أرخص من GPT-5.5 لطريقة عملك الفعلية.

ملاحظة قبل الأرقام: تتغير أسعار الذكاء الاصطناعي بسرعة، وتختلف بعض مستويات خطة برمجة GLM (GLM Coding Plan) بين المصادر الثانوية. حيثما لا يكون الرقم مؤكدًا، فقد تم الإشارة إليه. تعامل مع أي رقم معلم كتقدير وقم بتأكيد السعر المباشر على z.ai قبل تخصيص الميزانية.

زر

تكلفة واجهة برمجة تطبيقات GLM-5.2 (API) بنظرة سريعة

سعر واجهة برمجة التطبيقات (API) حسب الاستخدام هو أوضح نقطة للبدء، لأنه مؤكد من خلال القائمة العامة لـ OpenRouter.

العنصر	السعر	المصدر
رموز الإدخال	$1.40 / 1M	مؤكد (OpenRouter)
رموز الإخراج	$4.40 / 1M	مؤكد (OpenRouter)
المدخلات المخزنة مؤقتًا	~$0.26 / 1M	فنتشر بيت (تخصيص)

لذا، فإن التكلفة الرئيسية لـ GLM-5.2 لكل رمز هي 0.0000014 دولار لكل رمز إدخال و 0.0000044 دولار لكل رمز إخراج. يبلغ سعر الإخراج حوالي 3.1 ضعف سعر الإدخال، وهذا هو الشكل الطبيعي لنموذج الاستدلال: فالرموز التي يولدها (بما في ذلك تتبع تفكيره) تكلف أكثر من الرموز التي تغذيها به.

سعر الإدخال المخزن مؤقتًا الذي يبلغ حوالي 0.26 دولار لكل مليون رمز هو العامل الذي يغير كل شيء لأحمال عمل الوكلاء والمحادثة، وسيتم تغطيته في قسمه الخاص أدناه. يأتي هذا الرقم من تقارير VentureBeat بدلاً من بطاقة أسعار الطرف الأول، لذا يجب إسناده وفقًا لذلك.

لا يوجد مسار OpenRouter مجاني لـ glm-5.2. إذا رأيت ادعاءً بخلاف ذلك في مكان آخر، فهو خاطئ. يمكنك تشغيل الأوزان المفتوحة بنفسك على حساب أجهزتك الخاصة، وهذا نوع مختلف من "المجانية". لهذا المسار، راجع الدليل المصاحب حول كيفية استخدام GLM-5.2 مجانًا والمقال السابق حول تشغيل GLM-5 محليًا مجانًا.

كيف يعمل خصم المدخلات المخزنة مؤقتًا

التخزين المؤقت للموجهات هو أكبر عامل للتحكم في التكلفة ضمن قائمة أسعار GLM-5.2، ومعظم الناس يتجاهلونه.

إليك الآلية. عندما ترسل بادئة طويلة وثابتة بشكل متكرر (موجه نظام، تعريفات أداة وكيل برمجي، ملف كبير تستمر في الإشارة إليه)، يمكن للمزود تخزين البادئة المعالجة مؤقتًا. في المكالمة التالية، يتم احتساب الجزء المخزن مؤقتًا بسعر الإدخال المخزن مؤقتًا (حوالي 0.26 دولار / 1 مليون) بدلاً من سعر الإدخال الكامل (1.40 دولار / 1 مليون). هذا خصم يقارب 81% على الجزء المتكرر من موجهك.

حيث يؤتي هذا ثماره:

وكلاء البرمجة. ترسل أدوات مثل Claude Code و Cline و Cursor مقدمة ثابتة كبيرة (تعليمات، مخططات أدوات، سياق المستودع) في كل دورة. يؤدي تخزين هذه المقدمة مؤقتًا إلى خفض فاتورة الإدخال لكل دورة بشكل كبير. تفاصيل الإعداد موجودة في دليل GLM-5.2 مع Claude Code و Cline و Cursor.
RAG والأسئلة والأجوبة المستندة إلى المستندات. إذا طرحت العديد من الأسئلة على نفس المستند الطويل، فقم بتخزين المستند مؤقتًا مرة واحدة وادفع السعر الكامل فقط لكل سؤال قصير بالإضافة إلى الإجابة.
المحادثات الطويلة. تاريخ الدردشة المتزايد هو بادئة ثابتة متزايدة. يحافظ التخزين المؤقت على تكلفة "تذكر" المحادثة منخفضة.

قاعدتان عمليتان. أولاً، احتفظ بالمحتوى المعاد استخدامه في بداية الموجه والمحتوى المتغير في النهاية؛ تعتمد ذاكرات التخزين المؤقت على البادئة. ثانيًا، تنتهي صلاحية ذاكرات التخزين المؤقت، لذا ينطبق الخصم على المكالمات التي تتم في أوقات متقاربة، وليس على طلب تقوم به مرة كل ساعة.

تعطيل التفكير كعامل للتحكم في التكلفة

GLM-5.2 هو نموذج استدلال بمستويين لجهد التفكير، عالٍ (High) وأقصى (Max). توصي Z.ai باستخدام مستوى "أقصى" للبرمجة. لكن رموز التفكير هي رموز إخراج، والإخراج هو الجانب الأكثر تكلفة في الفاتورة بسعر 4.40 دولار لكل مليون رمز. المزيد من التفكير يعني المزيد من الرموز المولّدة، مما يعني فاتورة أكبر.

لديك أداة تحكم مباشرة لذلك. في واجهة برمجة التطبيقات (API) يمكنك تعطيل التفكير بالكامل:

{
  "model": "glm-5.2",
  "messages": [
    { "role": "user", "content": "Reformat this JSON and return it." }
  ],
  "thinking": { "type": "disabled" }
}

استخدم المستويات بتعمد:

التفكير معطل للأعمال الرخيصة والميكانيكية: التنسيق، الاستخراج، إعادة الكتابة البسيطة، التصنيف. تتجاوز تتبع الاستدلال وتدفع فقط مقابل إجابة قصيرة.
جهد عالٍ للبرمجة والتحليل اليومي حيث ترغب في استدلال جيد دون أقصى إنفاق للرموز.
جهد أقصى للبرمجة والرياضيات الصعبة وذات الأفق الطويل، حيث يكسب التفكير الإضافي تكلفته فعليًا في الدقة.

مطابقة مستوى الجهد مع المهمة هي الفارق بين فاتورة إخراج بقيمة 4.40 دولار وفاتورة بقيمة 1 دولار لنفس الموجه. المرجع الكامل للمعاملات، بما في ذلك reasoning_effort والبث، موجود في دليل واجهة برمجة تطبيقات GLM-5.2، ويغطي الدليل التفصيلي لواجهة برمجة تطبيقات GLM-5 السابق نفس الشكل المتوافق مع OpenAI إذا كنت تقوم بالترحيل.

أمثلة تكلفة عملية

معدلات الرموز المجردة لا تعني الكثير حتى تقوم بتطبيقها على عمل حقيقي. إليك ثلاث جلسات، مسعّرة بالمعدلات المؤكدة.

المثال الأول: جلسة برمجة واحدة بحجم 100 ألف رمز. لنفترض أنك تدير مهمة برمجة عاملة تقرأ 100 ألف رمز من السياق (مستودعك، تعليمات، محتويات الملف) وتولد 20 ألف رمز من التعليمات البرمجية والاستدلال.

الإدخال: 100,000 × 1.40 دولار / 1,000,000 = 0.140 دولار
الإخراج: 20,000 × 4.40 دولار / 1,000,000 = 0.088 دولار
المجموع: ~0.23 دولار

المثال الثاني: نفس الجلسة مع التخزين المؤقت. لنفترض الآن أن 80 ألفًا من أصل 100 ألف رمز إدخال هي بادئة ثابتة (موجه نظام، تعريفات أدوات، ملفات غير متغيرة) يتم تقديمها من الذاكرة المؤقتة، و 20 ألفًا هي جديدة.

المدخلات المخزنة مؤقتًا: 80,000 × 0.26 دولار / 1,000,000 = 0.021 دولار
المدخلات الجديدة: 20,000 × 1.40 دولار / 1,000,000 = 0.028 دولار
الإخراج: 20,000 × 4.40 دولار / 1,000,000 = 0.088 دولار
المجموع: ~0.14 دولار

خفض التخزين المؤقت للبادئة الثابتة تكلفة الجلسة بنسبة 40% تقريبًا، وتزداد التوفيرات كلما زادت الأدوار التي تقوم بها في نفس السياق.

المثال الثالث: مساعد دردشة يقوم بالاستخراج مع تعطيل التفكير. يقوم روبوت دعم بمعالجة 500 رسالة يوميًا. ترسل كل مكالمة 2000 رمز إدخال وتُرجع 300 رمز إخراج، مع تعطيل التفكير.

الإدخال: 500 × 2,000 × 1.40 دولار / 1,000,000 = 1.40 دولار
الإخراج: 500 × 300 × 4.40 دولار / 1,000,000 = 0.66 دولار
المجموع: ~2.06 دولار / يوميًا، حوالي 62 دولارًا شهريًا لحمل عمل يتضمن 500 مكالمة يوميًا.

هذه تقديرات للأسعار المعلنة. فاتورتك الحقيقية تعتمد على مقدار التفكير الذي تسمح به ومقدار مدخلاتك التي تصل إلى الذاكرة المؤقتة.

مستويات خطة برمجة GLM

إذا كنت تستخدم وكيل برمجة طوال اليوم، فإن مسار الاشتراك يكون عادة أرخص من مكالمات واجهة برمجة التطبيقات (API) المدفوعة حسب الاستخدام. تبيع Z.ai خطة برمجة GLM (GLM Coding Plan) بمستويات محددة (Lite، Pro، Max، بالإضافة إلى Team)، ويمكن الوصول إليها من Claude Code والأدوات المماثلة عبر نقطة نهاية متوافقة مع Anthropic.

مفتاح الخطة هو بيانات اعتماد مختلفة عن مفتاح API القياسي. لربط GLM-5.2 بـ Claude Code، تقوم بتوجيهه إلى نقطة نهاية البرمجة وتحديد البديل ذي السياق 1M عبر لاحقة النموذج [1m]:

export ANTHROPIC_BASE_URL="https://api.z.ai/api/coding/paas/v4"
export ANTHROPIC_API_KEY="your-glm-coding-plan-key"
export ANTHROPIC_DEFAULT_SONNET_MODEL="glm-5.2[1m]"
export ANTHROPIC_DEFAULT_OPUS_MODEL="glm-5.2[1m]"
export CLAUDE_CODE_AUTO_COMPACT_WINDOW=1000000
export API_TIMEOUT_MS=3000000

قيمة API_TIMEOUT_MS مهمة. بدون مهلة طويلة، يمكن لـ Claude Code إنهاء المكالمات الطويلة ذات السياق الكبير قبل أن ينتهي GLM-5.2. تُظهر بعض المصادر عنوان URL الأساسي للبرمجة على أنه open.z.ai/api/paas/v4 بدلاً من ذلك، لذا تحقق من المضيف الدقيق مباشرةً. يتوفر الإعداد الكامل للوكيل، بما في ذلك Cline و Cursor، في دليل وكلاء برمجة GLM-5.2، ويغطي مقال GLM-5.1 مع Claude Code السابق نفس النمط للجيل السابق.

هل GLM-5.2 أرخص من GPT-5.5؟

نعم، في واجهة برمجة التطبيقات (API) المدفوعة حسب الاستخدام، وبهامش كبير. يأتي أوضح تأطير من VentureBeat، التي أفادت بأن GLM-5.2 "يتفوق على GPT-5.5 في البرمجة ذات الأفق الطويل بحوالي 1/6 التكلفة." هذا الادعاء هو لـ VentureBeat، وليس قياسًا من Apidog، وهو يجمع أداء المعيار مع السعر، لذا اقرأه كبيان قيمة توجيهي بدلاً من نسبة لكل رمز.

على مستوى بطاقة الأسعار، إليك المقارنة عالية المستوى. يسجل GLM-5.2 بسعر 1.40 دولار للإدخال / 4.40 دولار للإخراج لكل مليون رمز. تتجاوز النماذج المتطورة المغلقة من OpenAI و Anthropic و Google هذا السعر بشكل عام لمستوياتها العليا في الاستدلال، وهذا هو السبب في استمرار ظهور تأطير "جزء من التكلفة". للحصول على تفصيل للسرعة والتكلفة المعتمد على الأرقام عبر النماذج، راجع GLM-5 مقابل DeepSeek مقابل GPT-5 من حيث السرعة والتكلفة والمقارنة الأوسع GLM-5.1 مقابل Claude و GPT و Gemini و DeepSeek.

مقارنة الاشتراكات أكثر دقة. يقع مستوى خطة برمجة GLM (GLM Coding Plan) الكثيفة بتكلفة تقديرية تبلغ حوالي 80 دولارًا شهريًا في نفس نطاق أغلى اشتراكات البرمجة ذات المقعد الواحد من البائعين الآخرين، لذا تصبح العوامل الحاسمة هي جودة النموذج في مهامك وكيفية قياس الخطط للاستخدام. يتم تناول مسألة مقارنة الخطط (خطة GLM مقابل Claude Code و Codex و Cursor و MiniMax Plan) بالتفصيل في Claude Code مقابل Codex مقابل Cursor مقابل MiniMax Plan مقابل GLM Plan.

تحذير واحد بشأن المعايير: نتائج الإطلاق التي تدفع عرض القيمة (SWE-bench Pro 62.1، Terminal-Bench 2.1 بنسبة 81.0، MCP-Atlas 77.0) هي نتائج Z.ai المنشورة. المجموعة الكاملة مفصلة في الغوص العميق في معايير GLM-5.2، والمواجهة المباشرة ضد المختبرات المغلقة موجودة في GLM-5.2 مقابل GPT-5.5 و Claude Opus و Gemini.

أي مسار تسعير يجب أن تختار؟

دليل سريع لاتخاذ القرار:

الاستخدام المتقطع أو منخفض الحجم: واجهة برمجة تطبيقات (API) مدفوعة حسب الاستخدام. أنت تدفع فقط مقابل ما تستخدمه، والأسعار منخفضة بما يكفي للحفاظ على الاستخدام الخفيف رخيصًا.
البرمجة طوال اليوم في وكيل: مستوى من خطة برمجة GLM (GLM Coding Plan). التكلفة الشهرية المتوقعة تتفوق على الفواتير المدفوعة حسب الاستخدام بمجرد أن تقوم بمئات المكالمات يوميًا. تحقق من سعر المستوى أولاً.
الخصوصية، عدم الاتصال بالإنترنت، أو التكلفة الحدية الصفرية: استضف الأوزان المفتوحة بنفسك. لا توجد فاتورة لكل رمز على الإطلاق، فقط قوة الحوسبة الخاصة بك. ابدأ بـ تشغيل GLM-5 محليًا مجانًا أو GLM-5 مجانًا باستخدام Ollama.

أياً كان المسار الذي تختاره، فإن عاملي التحكم في التكلفة يبقيان كما هما: تخزين بادئاتك الثابتة مؤقتًا، وتخفيض جهد التفكير للعمل الذي لا يتطلبه.

اختبار تكاليف GLM-5.2 قبل الالتزام

قبل اختيار خطة، من المفيد معرفة تكلفة موجهاتك الحقيقية والوقت الذي تستغرقه. يمكنك توجيه أي عميل متوافق مع OpenAI إلى نقطة نهاية GLM-5.2 ومراقبة استخدام الرموز لكل مكالمة. Apidog مفيد هنا: إنه منصة API متكاملة لتصميم واختبار وتوثيق واجهات برمجة التطبيقات، بحيث يمكنك إرسال طلبات إلى https://api.z.ai/api/paas/v4/chat/completions، وفحص الاستجابة وعدد الرموز، وحفظ المكالمات كمجموعة قابلة لإعادة الاستخدام أثناء مقارنة مستويات التفكير وسلوك التخزين المؤقت. قم بتنزيل Apidog إذا كنت ترغب في قياس بطاقة الأسعار مقابل حركة المرور الخاصة بك بدلاً من الثقة بمثال عملي.

زر

باختصار: سعر واجهة برمجة التطبيقات (API) المؤكد لـ GLM-5.2 البالغ 1.40 دولار للإدخال و 4.40 دولار للإخراج هو الرقم الأساسي الذي يجب الاعتماد عليه. قم بتخزين بادئاتك مؤقتًا، وإدارة جهد التفكير، وتحقق من سعر أي مستوى من خطة البرمجة مباشرة قبل الالتزام.