GPT-5.4: الدليل الشامل لأقوى نموذج من OpenAI

Ashley Innocent

Ashley Innocent

6 مارس 2026

GPT-5.4: الدليل الشامل لأقوى نموذج من OpenAI

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

الخلاصة / إجابة سريعة

GPT-5.4 هو النموذج الحدودي الأكثر تقدمًا من OpenAI للعمل الاحترافي، وقد تم إصداره في 5 مارس 2026. يجمع هذا النموذج بين قدرات البرمجة الرائدة في الصناعة من GPT-5.3-Codex مع قدرات محسّنة في الاستدلال، واستخدام الكمبيوتر، وتكامل الأدوات. يحقق النموذج معدل فوز بنسبة 83% في مهام العمل المعرفي، و75% في معايير استخدام الكمبيوتر، ويستخدم عددًا أقل بكثير من الرموز مقارنة بـ GPT-5.2. متاح عبر واجهة برمجة التطبيقات (API) بسعر 2.50 دولار لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج، مع إصدار Pro (30 دولارًا/180 دولارًا) للمهام المعقدة.

مقدمة

لقد رفعت OpenAI للتو معيار العمل الاحترافي المدعوم بالذكاء الاصطناعي. في 5 مارس 2026، أصدرت نموذج GPT-5.4، وهو نموذج يحقق معدلات فوز بنسبة 83% ضد المحترفين في الصناعة في مهام العمل المعرفي الواقعية، بينما يستخدم عددًا أقل بكثير من الرموز مقارنة بسابقه.

إذا كنت قد عملت مع نماذج الذكاء الاصطناعي التي تختلق الحقائق، أو تكافح مع سير العمل المعقدة، أو تستهلك الرموز في المهام البسيطة، فإن GPT-5.4 يعالج هذه المشكلات مباشرة. فهو أقل عرضة بنسبة 33% لارتكاب أخطاء واقعية ويكمل مهام استخدام الكمبيوتر 3 مرات أسرع من النماذج السابقة.

💡
بالنسبة للمطورين الذين يقومون ببناء تطبيقات مدعومة بالذكاء الاصطناعي، يصبح اختبار وتوثيق تكامل واجهة برمجة التطبيقات (API) أمرًا بالغ الأهمية. تساعد أدوات مثل Apidog في تصميم وتصحيح واختبار نقاط نهاية واجهة برمجة التطبيقات سواء كنت تقوم بدمج GPT-5.4 أو بناء خدماتك الخاصة. تجمع منصة Apidog الموحدة بين تصميم واجهة برمجة التطبيقات وتصحيح الأخطاء والاختبار والمحاكاة في واجهة واحدة، مما يبسط سير عمل التطوير للفرق التي تدمج نماذج الذكاء الاصطناعي في تطبيقاتها.
زر

يحلل هذا الدليل ما يفعله GPT-5.4 بالفعل، وكيف يقارن بالإصدارات السابقة، وما إذا كانت مكاسب الأداء تبرر تكاليف الرموز الأعلى. ستحصل على بيانات معيارية محددة، ومقارنات أداء حقيقية، وإرشادات واضحة حول أي من متغيرات GPT-5.4 يناسب حالة استخدامك.

ما ستتعلمه:

ما هو GPT-5.4؟

يمثل GPT-5.4 أول نموذج للأغراض العامة من OpenAI مزودًا بقدرات استخدام الكمبيوتر الأصلية. يدمج تميز البرمجة لـ GPT-5.3-Codex مع الاستدلال المحسن، والإدراك البصري، وتكامل الأدوات في نموذج حدودي واحد.

نموذج GPT-5.4 من OpenAI - قدرات الاستخدام المعرفي والكمبيوتر

يستهدف النموذج ثلاثة سيناريوهات مهنية أساسية:

العمل المعرفي - إنشاء جداول بيانات، وعروض تقديمية، ومستندات، وتحليلات عبر 44 مهنة. يتطابق GPT-5.4 أو يتجاوز أداء المحترفين في الصناعة في 83% من المقارنات على GDPval، مرتفعًا من 70.9% لـ GPT-5.2.

استخدام الكمبيوتر والوكلاء - تشغيل أجهزة الكمبيوتر عبر أوامر الماوس/لوحة المفاتيح، وأتمتة المتصفح، وسير العمل متعدد الخطوات عبر التطبيقات. يحقق معدل نجاح بنسبة 75% على OSWorld-Verified، متجاوزًا الأداء البشري بنسبة 72.4%.

البرمجة والتطوير - كتابة التعليمات البرمجية وتصحيحها وتكرارها بأداء فائق على SWE-Bench Pro (57.7%) مع دعم نوافذ سياق تصل إلى مليون رمز لأسس التعليمات البرمجية المعقدة.

يأتي GPT-5.4 في نسختين:

التحسينات الرئيسية على GPT-5.2

GPT-5.4 ليس تحديثًا تدريجيًا. حققت OpenAI مكاسب كبيرة في أربعة مجالات حاسمة.

1. دقة الحقائق وتقليل الهلوسة

انخفضت الادعاءات الكاذبة بنسبة 33% على مستوى الادعاء الفردي. تحتوي الردود الكاملة على أخطاء أقل بنسبة 18% بشكل عام. هذا مهم عندما تقوم بإنشاء مستندات قانونية، أو نماذج مالية، أو وثائق فنية حيث يمكن لحقيقة واحدة مخترعة أن تعرقل مشروعًا بأكمله.

2. كفاءة الرموز

يستخدم GPT-5.4 عددًا أقل بكثير من الرموز لحل المشكلات مقارنة بـ GPT-5.2. في سير العمل الكثيفة الاستخدام للأدوات مع معايير MCP Atlas، انخفض استخدام الرموز بنسبة 47% مع الحفاظ على الدقة. بالنسبة لمستخدمي واجهة برمجة التطبيقات ذات الحجم الكبير، يعوض هذا الكسب في الكفاءة ارتفاع سعر الرموز.

3. قدرات استخدام الكمبيوتر

تتطلب النماذج السابقة نماذج متخصصة منفصلة لاستخدام الكمبيوتر. يتعامل GPT-5.4 مع هذا بشكل أصلي:

4. البحث عن الأدوات وتكاملها

يلغي البحث عن الأدوات الحاجة إلى تحميل آلاف تعريفات الأدوات في كل طلب. يبحث النموذج عن تعريفات الأدوات عند الطلب، مما يقلل من تكاليف الرموز الأولية ويمكّن العمل مع بيئات تحتوي على عشرات الآلاف من الأدوات.

في معيار Toolathlon، يحقق GPT-5.4 دقة بنسبة 54.6% مقارنة بـ 45.7% لـ GPT-5.2، مع الحاجة إلى عدد أقل من مخرجات الأدوات (وكيل زمن الاستجابة).

معايير أداء GPT-5.4

تُظهر البيانات المعيارية المجالات التي يتفوق فيها GPT-5.4 والمجالات التي تظل فيها النماذج السابقة تنافسية.

العمل المعرفي (GDPval)

النموذج

معدل الفوز مقابل المحترفين

GPT-5.4

83.0%

GPT-5.4 Pro

82.0%

GPT-5.2 Pro

74.1%

GPT-5.2

70.9%

يختبر GDPval العمل المعرفي المحدد جيدًا عبر 44 مهنة من أفضل 9 صناعات تساهم في الناتج المحلي الإجمالي الأمريكي. تشمل المهام العروض التقديمية للمبيعات، وجداول بيانات المحاسبة، وجداول رعاية الطوارئ، ورسوم بيانية للتصنيع، ومقاطع فيديو قصيرة.

إنشاء جداول البيانات والمستندات

في مهام نمذجة المصرفية الاستثمارية الداخلية:

لتقييم العروض التقديمية، فضل المقيمون البشريون مخرجات GPT-5.4 بنسبة 68% من الوقت بسبب الجماليات الأقوى، والتنوع البصري الأكبر، والاستخدام الأكثر فعالية لتوليد الصور.

أداء البرمجة (SWE-Bench Pro)

النموذج

الدقة

زمن الاستجابة المقدر

GPT-5.4

57.7%

~1000 ثانية

GPT-5.3-Codex

56.8%

~1200 ثانية

GPT-5.2

55.6%

~1500 ثانية

مقارنة أداء البرمجة لـ GPT-5.4 و GPT-5.3-Codex و GPT-5.2

يتطابق GPT-5.4 أو يتجاوز أداء GPT-5.3-Codex على SWE-Bench Pro مع تقديم زمن استجابة أقل عبر جهود الاستدلال. يوفر وضع /fast في Codex سرعة رمز أسرع بمقدار 1.5 مرة مع GPT-5.4.

استخدام الكمبيوتر (OSWorld-Verified)

يقيس OSWorld-Verified النجاح في التنقل في بيئات سطح المكتب من خلال لقطات الشاشة وإجراءات لوحة المفاتيح/الماوس:

يختبر هذا المعيار سير عمل سطح المكتب الحقيقية: إدارة البريد الإلكتروني والتقويم، وإدخال البيانات بكميات كبيرة، وعمليات الملفات، والمهام عبر التطبيقات.

تصفح الويب (BrowseComp)

يختبر BrowseComp البحث المستمر عبر الويب للعثور على معلومات يصعب تحديد موقعها:

يعكس التحسين المطلق بنسبة 17% على GPT-5.2 تجميعًا أفضل للمعلومات من مصادر متعددة واستراتيجيات بحث أكثر استمرارية.

الفهم البصري

MMMU Pro (بدون أدوات) - يختبر الفهم البصري والاستدلال:

OmniDocBench - دقة تحليل المستندات (خطأ أقل = أفضل):

قدرات استخدام الكمبيوتر والرؤية

تستدعي قدرات GPT-5.4 في استخدام الكمبيوتر فحصًا مفصلاً. هذا هو أول نموذج من OpenAI للأغراض العامة يمكنه تشغيل أجهزة الكمبيوتر بشكل أصلي.

كيف يعمل استخدام الكمبيوتر

يفسر النموذج لقطات الشاشة لواجهات المتصفح أو سطح المكتب ويستجيب بما يلي:

  1. النقر القائم على الإحداثيات على عناصر واجهة المستخدم
  2. إدخال لوحة المفاتيح لإدخال النص
  3. أوامر Playwright لأتمتة المتصفح
  4. حركات الماوس وعمليات السحب

يقوم المطورون بتكوين السلوك من خلال رسائل النظام، وضبط سياسات الأمان ومتطلبات التأكيد بناءً على تحمل المخاطر.

مثال على استخدام الكمبيوتر في العالم الحقيقي

اختبرت Mainstay نموذج GPT-5.4 عبر حوالي 30,000 بوابة خاصة بجمعيات الملاك والضرائب العقارية:

يتنقل النموذج في واجهات البوابة، ويستخرج البيانات من تنسيقات واجهة المستخدم المتنوعة، ويتعامل مع تدفقات المصادقة، ويدير الحالات الهامشية مثل صور التحقق (captchas) أو النماذج متعددة الخطوات.

تعزيز الإدراك البصري

قدم GPT-5.4 مستوى تفاصيل إدخال الصورة الأصلية يدعم:

يدعم مستوى التفاصيل العالي ما يصل إلى 2.56 مليون بكسل إجماليًا أو 2048 بكسل كحد أقصى للأبعاد. أظهر اختبار المستخدمين الأوائل لواجهة برمجة التطبيقات مكاسب قوية في القدرة على التحديد، وفهم الصور، ودقة النقر باستخدام إعدادات التفاصيل الأصلية أو العالية.

تحسينات تحليل المستندات

يترجم الإدراك البصري الأفضل إلى التعامل مع المستندات. يقوم GPT-5.4 بتحليل:

يعكس التحسين بنسبة 22% في OmniDocBench (من 0.140 إلى 0.109 معدل خطأ) هذه القدرة.

ميزات البرمجة والتطوير

يرث GPT-5.4 تميز GPT-5.3-Codex في البرمجة مع إضافة استخدام الكمبيوتر لسير عمل التطوير المتكامل.

تطوير الواجهة الأمامية

وجدت التقييمات الداخلية أن GPT-5.4 يتفوق في مهام الواجهة الأمامية المعقدة بنتائج جمالية ووظيفية أفضل بشكل ملحوظ من النماذج السابقة. توضح مهارة Playwright Interactive التجريبية في Codex ذلك:

مثال: محاكاة مدينة الملاهي أنتج موجه واحد محاكاة مدينة ملاهي متساوية القياس مع:

قام النموذج ببناء اللعبة، ثم استخدم Playwright لأتمتة اختبارات اللعب، والتحقق من التنسيب، والتنقل، وردود فعل الضيوف، واستقرار واجهة المستخدم عبر جولات متعددة.

الوضع السريع للمطورين

يدعم GPT-5.4 في Codex وضع /fast الذي يوفر سرعة رمز أسرع بما يصل إلى 1.5 مرة. يصل مطورو واجهة برمجة التطبيقات إلى سرعات مكافئة من خلال المعالجة ذات الأولوية. هذا يحافظ على نفس الذكاء مع تقليل وقت التكرار أثناء تصحيح الأخطاء والتطوير.

دعم نافذة السياق

يتضمن GPT-5.4 Codex دعم نافذة سياق تجريبية تصل إلى مليون رمز. يمكنك تكوينها عبر:

يتم احتساب الطلبات التي تتجاوز نافذة السياق القياسية البالغة 272 ألف رمز ضمن حدود الاستخدام بمعدل ضعف المعدل الطبيعي. وهذا يتيح تحليل قواعد البيانات الكاملة، أو مجموعات المستندات الكبيرة، أو المشاريع متعددة الملفات في طلب واحد.

Apidog لتوثيق واجهة برمجة التطبيقات:وثائق واجهة برمجة التطبيقات
تصوير مرئي لبيئة عمل المطور، يسلط الضوء على أدوات تكامل API مثل Apidog في سير عمل GPT-5.4

تكامل الأدوات والبحث

يمثل البحث عن الأدوات تحولًا أساسيًا في كيفية تفاعل النماذج مع الأدوات الخارجية وخوادم MCP.

كيف يعمل البحث عن الأدوات

النهج السابق: يتم تحميل جميع تعريفات الأدوات في كل طلب مقدمًا. بالنسبة للأنظمة التي تحتوي على العديد من الأدوات، أضاف هذا آلاف إلى عشرات الآلاف من الرموز، مما زاد التكاليف وأبطأ الاستجابات.

نهج البحث عن الأدوات: يتلقى النموذج قائمة خفيفة الوزن بالأدوات المتاحة. عند الحاجة، يبحث عن تعريفات أدوات محددة ويضيفها إلى المحادثة في تلك اللحظة.

مثال على توفير الرموز

اختبر معيار MCP Atlas الخاص بـ Scale 250 مهمة مع تمكين جميع خوادم MCP الـ 36:

مقارنة استخدام الرموز مع وبدون البحث عن الأدوات

تحليل الرموز بدون البحث عن الأدوات:

يلغي البحث عن الأدوات التكلفة الأولية مع الحفاظ على كفاءة التخزين المؤقت.

أداء MCP Atlas

على معيار MCP Atlas (250 مهمة، 36 خادم MCP):

يعمل النموذج مع أنظمة بيئية أكبر للأدوات دون التضحية بالدقة أو إغراق نوافذ السياق.

استدعاء الأدوات بواسطة الوكيل

يختبر معيار Toolathlon سير عمل الأدوات متعدد الخطوات (قراءة رسائل البريد الإلكتروني، استخراج المرفقات، تحميل الملفات، التقييم، تسجيل النتائج):

أداء استدعاء الأدوات للوكيل: GPT-5.4 مقابل GPT-5.2

تعكس مخرجات الأدوات (الانتظار لاستجابات الأدوات) زمن الاستجابة بشكل أفضل من عدد استدعاءات الأدوات لأنها تلتقط فوائد التوازي. يكمل GPT-5.4 المهام في عدد أقل من الجولات.

GPT-5.4 مقابل GPT-5.3-Codex مقابل GPT-5.2

يعتمد الاختيار بين النماذج على متطلباتك المحددة.

متى تستخدم GPT-5.4

متى يظل GPT-5.3-Codex تنافسيًا

متى يكون GPT-5.2 كافيًا

مقارنة الأسعار

النموذج

سعر الإدخال

الإدخال المخزن مؤقتًا

سعر الإخراج

GPT-5.2

$1.75/مليون

$0.175/مليون

$14/مليون

GPT-5.4

$2.50/مليون

$0.25/مليون

$15/مليون

GPT-5.2 Pro

$21/مليون

-

$168/مليون

GPT-5.4 Pro

$30/مليون

-

$180/مليون

يتوفر تسعير الدفعات والمرونة بنسبة 50% من الأسعار القياسية. المعالجة ذات الأولوية بنسبة 200% من الأسعار القياسية.

خيارات التوفر والوصول

تم طرح GPT-5.4 تدريجياً اعتباراً من 5 مارس 2026 عبر ChatGPT و Codex و API.

الوصول إلى ChatGPT

GPT-5.4 Thinking متاح لـ:

GPT-5.4 Pro متاح لـ:

الوصول القديم: يظل GPT-5.2 Thinking متاحًا لمدة ثلاثة أشهر ضمن قسم النماذج القديمة، وسيتم إيقافه في 5 يونيو 2026.

الشركات والتعليم: الوصول المبكر متاح عبر إعدادات المسؤول.

الوصول إلى Codex

GPT-5.4 هو النموذج الافتراضي في Codex مع:

الوصول إلى واجهة برمجة التطبيقات (API)

أسماء النماذج:

نوافذ السياق:

التسعير:

الجدول الزمني لإيقاف الدعم

سيتم إيقاف دعم GPT-5.2 Thinking في 5 يونيو 2026. قم بترحيل سير العمل قبل هذا التاريخ لتجنب الانقطاع.

الخاتمة

يقدم GPT-5.4 تحسينات قابلة للقياس عبر مهام العمل المعرفي، واستخدام الكمبيوتر، والبرمجة. معدل الفوز بنسبة 83% في GDPval، و75% في OSWorld-Verified، و57.7% دقة في SWE-Bench Pro، يؤسس له كأحدث ما توصلت إليه التقنيات في سير عمل الذكاء الاصطناعي الاحترافية.

بالنسبة للمطورين الذين يدمجون GPT-5.4 في تطبيقاتهم، فإن امتلاك أدوات قوية لاختبار وتصحيح واجهة برمجة التطبيقات (API) يصبح ضروريًا. يبسط Apidog عملية التكامل بقدرات تصميم وتصحيح واختبار وتوثيق واجهة برمجة التطبيقات الموحدة. سواء كنت تبني وكلاء ذكاء اصطناعي، أو تقوم بأتمتة سير العمل، أو تنشئ ميزات موجهة للعملاء مدعومة بـ GPT-5.4، يساعد Apidog على ضمان عمل تكاملات واجهة برمجة التطبيقات الخاصة بك بشكل صحيح من اليوم الأول.

زر

النقاط الرئيسية:

متى تتبنى:

متى تنتظر:

يمثل GPT-5.4 نموذج الاستدلال الأكثر كفاءة من OpenAI حتى الآن. إن الجمع بين تقليل الهلوسة، وتحسين كفاءة الرموز، وقدرات استخدام الكمبيوتر الأصلية يبرر ارتفاع سعر الرموز للتطبيقات الاحترافية.

الأسئلة الشائعة

ما الفرق بين GPT-5.4 و GPT-5.2؟

يحقق GPT-5.4 معدل فوز بنسبة 83% في العمل المعرفي مقابل 70.9% لـ GPT-5.2، ويستخدم عددًا أقل بكثير من الرموز، ولديه قدرات استخدام الكمبيوتر الأصلية، ويقلل من الأخطاء الواقعية بنسبة 33%. الأسعار أعلى (2.50 دولار/15 دولارًا مقابل 1.75 دولارًا/14 دولارًا) ولكن التكاليف الإجمالية قد تكون أقل بسبب مكاسب الكفاءة.

كم تبلغ تكلفة واجهة برمجة التطبيقات لـ GPT-5.4؟

يكلف GPT-5.4 2.50 دولار لكل مليون رمز إدخال، 0.25 دولار لكل مليون رمز إدخال مخزن مؤقتًا، و15 دولارًا لكل مليون رمز إخراج. يكلف GPT-5.4 Pro 30 دولارًا/مليون إدخال و180 دولارًا/مليون إخراج. تقدم أسعار الدفعات والمرونة خصومات بنسبة 50%.

هل لدى GPT-5.4 حد لنافذة السياق؟

نافذة السياق القياسية هي 272 ألف رمز. يتوفر دعم نافذة سياق تجريبية تصل إلى مليون رمز في Codex عن طريق تكوين معلمتي model_context_window و model_auto_compact_token_limit. تُحتسب الطلبات التي تتجاوز 272 ألفًا بمعدل استخدام ضعف.

ماذا يستخدم GPT-5.4 Pro؟

يستهدف GPT-5.4 Pro أقصى أداء في مهام الاستدلال المعقدة. يحقق درجات أعلى في المعايير مثل BrowseComp (89.3% مقابل 82.7%) و GDPval (82.0% مقابل 83.0% قياسي) ولكنه يكلف 12 مرة أكثر (30 دولارًا/180 دولارًا مقابل 2.50 دولارًا/15 دولارًا).

متى تم إصدار GPT-5.4؟

تم إصدار GPT-5.4 في 5 مارس 2026، ويتم طرحه تدريجيًا عبر ChatGPT و Codex و API. يظل GPT-5.2 Thinking متاحًا حتى 5 يونيو 2026 للترحيل.

هل يمكن لـ GPT-5.4 استخدام أجهزة الكمبيوتر والمتصفحات؟

نعم. GPT-5.4 هو أول نموذج للأغراض العامة من OpenAI مزود بقدرات استخدام الكمبيوتر الأصلية. يصدر أوامر الماوس/لوحة المفاتيح، ويؤتمت المتصفحات عبر Playwright، ويتنقل في بيئات سطح المكتب من خلال تفسير لقطات الشاشة.

ما هو البحث عن الأدوات في GPT-5.4؟

يتيح البحث عن الأدوات للنموذج البحث عن تعريفات الأدوات عند الطلب بدلاً من تحميل جميع التعريفات مقدمًا. هذا يقلل من استخدام الرموز بنسبة 47% في سير العمل الكثيفة الاستخدام للأدوات ويتيح العمل مع أنظمة بيئية تحتوي على عشرات الآلاف من الأدوات.

كيف يقارن GPT-5.4 بـ GPT-5.3-Codex في البرمجة؟

يتطابق GPT-5.4 أو يتجاوز أداء GPT-5.3-Codex على SWE-Bench Pro (57.7% مقابل 56.8%) مع توفير زمن استجابة أقل وإضافة قدرات استخدام الكمبيوتر. إنه الخيار الموصى به لسير عمل التطوير الجديد.

هل GPT-5.4 متاح في ChatGPT؟

نعم. GPT-5.4 Thinking متاح لمشتركي Plus و Team و Pro. يتوفر GPT-5.4 Pro لخطط Pro و Enterprise. يظل GPT-5.2 Thinking متاحًا ضمن النماذج القديمة حتى 5 يونيو 2026.

ما هي اعتبارات السلامة لـ GPT-5.4؟

يُعامل GPT-5.4 على أنه ذو قدرة إلكترونية عالية بموجب إطار عمل OpenAI للاستعداد. تشمل الحماية توسيع مكدس السلامة الإلكترونية، وأنظمة المراقبة، وضوابط الوصول الموثوقة، والحظر غير المتزامن للطلبات ذات المخاطر العالية على أسطح الاحتفاظ بالبيانات الصفرية. قد تحدث بعض الإيجابيات الكاذبة مع تحسن المصنفات.

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات

GPT-5.4: الدليل الشامل لأقوى نموذج من OpenAI