في 13 مايو، تم الإعلان عن نموذج جديد لـ ChatGPT يسمى GPT-4o. مقارنةً بالنماذج السابقة، يتمتع GPT-4o بوقت استجابة أسرع بمعدل الضعف من النماذج السابقة ويمكنه فهم النصوص والصور والصوتيات والفيديو. في هذه المقالة، سنقدم شرحاً شاملاً للمعلومات الأساسية حول نموذج GPT-4o الأحدث من OpenAI وسنقدم كيفية دمج واجهة برمجة التطبيقات GPT-4o في خدماتك الخاصة.
Apidog هو أيضًا أداة مجانية تمامًا، لذا ابدأ بالنقر على الزر أدناه! 👇👇👇
ما هو GPT-4o؟
GPT-4o هو أحدث نموذج ذكاء اصطناعي أعلن عنه OpenAI في 13 مايو. الحرف "o" في "4o" يرمز إلى "omni"، مما يعني "شامل". على عكس التفاعلات السابقة المعتمدة على النص والصورة مع ChatGPT، يسمح لك GPT-4o بالتفاعل مع النموذج باستخدام مزيج من النصوص والصوت والصور والفيديو.

لمزيد من التفاصيل، قم بزيارة الموقع الرسمي: https://openai.com/index/hello-gpt-4o/
الميزات الرئيسية لـ GPT-4o
فما هي الميزات التي يتمتع بها أحدث نموذج من OpenAI، GPT-4o، مقارنةً بالنماذج السابقة؟
وقت استجابة أسرع بمعدل الضعف
وفقًا لـ OpenAI، هناك ثلاث خطوات مطلوبة لكي يقوم GPT-4 بإجراء محادثة مع البشر:
- تحويل الكلام إلى نص
- توليد نص الاستجابة
- تحويل النص إلى كلام
في النماذج السابقة، كان متوسط التأخير في هذه العملية 2.8 ثانية لـ GPT-3.5 و5.4 ثانية لـ GPT-4. ومع ذلك، فإن GPT-4o الحالي يمكنه الاستجابة في غضون 232 ميلي ثانية، بمتوسط وقت استجابة يبلغ 320 ميلي ثانية، وهو تقريبًا نفس سرعة ردود الفعل البشرية. بمعنى آخر، يمكن أن يمكن استخدام نموذج GPT-4o الأحدث من التفاعل مع الذكاء الاصطناعي في الوقت الحقيقي تقريبًا.
يفهم نغمة الصوت
لم تتمكن نماذج GPT السابقة من التعرف على نغمة صوت المتحدث أو الضوضاء الخلفية، مما أدى إلى فقدان بعض المعلومات في المحادثات. ومع ذلك، مع إدخال GPT-4o، يمكنه الآن فهم رموز الصوت الخاصة بالمتحدث، أو مشاعره، مما يجعله أكثر شبهًا بالإنسان.

تقليل عدد الرموز للعديد من اللغات
بالإضافة إلى ذلك، قام GPT-4o بضغط عدد الرموز المستخدمة لـ 20 لغة، مثل اليابانية. باستخدام اليابانية كمثال، يعني ذلك أنه عند استخدام ChatGPT باللغة اليابانية، سيستخدم عدد أقل من الرموز.
- في التفاعل "مرحبًا، اسمي GPT-4o. أنا نوع جديد من نموذج اللغة. سعيد بلقائك"، انخفض عدد الرموز المستخدمة من 37 إلى 26، أي بزيادة قدرها 1.4 مرة.


معلومات هامة أخرى من إعلان GPT-4o
بالإضافة إلى ميزات نموذج GPT-4o نفسه، تم تسليط الضوء أيضًا على المعلومات التالية في إعلان GPT-4o:
تقريبًا جميع الخدمات مجانية
ستكون الخدمات المدفوعة السابقة مثل GPTs وGPT Store وGPT-4 متاحة مجانًا بعد إعلان GPT-4o.
تطبيق سطح المكتب متوفر
بينما كان ChatGPT متوفرًا عبر الإنترنت فقط حتى الآن، تم الإعلان عن تطبيق سطح مكتب جديد لنظام macOS في إعلان نموذج GPT-4o. من المتوقع أيضًا إصدار تطبيق لنظام Windows في النصف الثاني من هذا العام.
فهم تفاصيل GPT-4o
إذا كنت ترغب في معرفة المعلومات التفصيلية حول نموذج الذكاء الاصطناعي الجديد من OpenAI - GPT-4o، يمكنك مشاهدة تسجيل الفيديو الخاص بمؤتمره الصحفي أدناه.
كيفية الوصول إلى واجهة برمجة تطبيقات GPT-4o؟
عند تطوير تطبيقات الويب، من المريح جدًا استخدام واجهات برمجة التطبيقات لدمج وظائف الذكاء الاصطناعي في خدماتك الخاصة. مع إعلان نموذج GPT-4o، ستحتاج إلى استخدام واجهة برمجة التطبيقات GPT-4o لتقديم قدرات نموذج GPT-4o المميزة في خدماتك الخاصة. لذا، هل واجهة برمجة التطبيقات GPT-4o متاحة للاستخدام؟ كم تكلف؟ دعونا نلقي نظرة فاحصة على هذه الأسئلة.
هل واجهة برمجة التطبيقات GPT-4o متاحة للاستخدام؟
وفقًا لأحدث المعلومات من OpenAI، فإن واجهة برمجة التطبيقات لنموذج GPT-4o متاحة بالفعل كنموذج نص ورؤية في واجهة برمجة تطبيقات يكمل المحادثات، وواجهة برمجة التطبيقات المساعدة، وواجهة برمجة التطبيقات الدفعية.

تحديثات واجهة برمجة التطبيقات GPT-4o
مقارنةً بالنماذج السابقة لواجهات برمجة التطبيقات لـ ChatGPT، تعتبر واجهة برمجة التطبيقات GPT-4o أفضل في المجالات التالية:
- ذكاء أعلى: توفر أداءً بمستوى GPT-4 Turbo في النصوص والقدرات الاستدلالية والترميز، وتحدد معايير جديدة عالية في القدرات متعددة اللغات والصوتيات والبصرية.
- سرعة استجابة أسرع بمعدل الضعف: تم مضاعفة سرعة توليد الرموز مقارنةً بـ GPT-4 Turbo.
- سعر أقل بنسبة 50%: أقل تكلفة بنسبة 50% من GPT-4 Turbo لكل من الرموز المدخلة والمخرجات.
- حد أعلى لمعدل السعة بمعدل 5 مرات: حد الأعمال أعلى بخمس مرات مقارنةً بـ GPT-4 Turbo، يصل إلى 10 ملايين رمز في الدقيقة.
- تحسين القدرات البصرية: تحسنت القدرات البصرية لمعظم المهام.
- تحسين قدرات اللغات غير الإنجليزية: تحسين معالجة اللغات غير الإنجليزية واستخدام مُقسّم جديد لتقسيم النصوص غير الإنجليزية بشكل أكثر كفاءة.
تسعير واجهة برمجة التطبيقات GPT-4o
فكم تكلف استخدام نموذج واجهة برمجة التطبيقات GPT-4o الأحدث؟ وفقًا للموقع الرسمي لواجهة برمجة التطبيقات من OpenAI، فإن GPT-4o أسرع وأكثر اقتصادية من GPT-4 Turbo، مع تقديم قدرات بصرية أقوى. هذا النموذج لديه محتوى 128K ويغطي المعرفة حتى أكتوبر 2023. بالإضافة إلى ذلك، فهو أقل تكلفة بنسبة 50% من GPT-4 Turbo. الخطة التسعيرية المحددة هي كما يلي:
وفقًا لـ صفحة تسعير واجهة برمجة التطبيقات من OpenAI، فإن تكلفة/تسعير GPT-4o كما يلي:
- إدخال نص: 5 دولارات/ 1 مليون رمز
- إخراج نص: 15 دولارًا/ 1 مليون رمز
وستُحسب تكلفة معالجة الرؤية (توليد الصور) بناءً على عرض وارتفاع الصورة. على سبيل المثال، فإن تكلفة معالجة صورة ارتفاعها 150 بكسل وعرضها 150 بكسل هي 0.001275 دولار. يمكن للمستخدمين تعديل دقة الصورة بحرية، ويتم احتساب السعر بناءً على عدد البكسلات.

لذا، سواء كان الإدخال أو الإخراج أو توليد الصور، فإن تكلفة استخدام واجهة برمجة التطبيقات GPT-4o هي نصف تكلفة GPT-4 Turbo.
ملاحظات هامة عند استخدام واجهة برمجة التطبيقات GPT-4o
عند استخدام واجهة برمجة التطبيقات GPT-4o أو محاولة الانتقال من نماذج أخرى إلى واجهة برمجة التطبيقات GPT-4o، تحتاج إلى الانتباه إلى النقاط التالية:
- يمكن لواجهة برمجة التطبيقات GPT-4o فهم الفيديو بدون صوت من خلال القدرة على الإدراك. على وجه التحديد، تحتاج إلى تحويل الفيديو إلى إطارات (2-4 إطارات في الثانية، سواء تم أخذ عينات بشكل موحد أو باستخدام خوارزمية اختيار الإطار الرئيسي)، ثم إدخال تلك الإطارات في النموذج.
- اعتبارًا من 14 مايو 2024، لا تدعم واجهة برمجة التطبيقات GPT-4o حتى الآن وضع الصوت. ومع ذلك، تتوقع OpenAI توفير وضع الصوت للمت testers الموثوق بهم خلال الأسابيع القليلة المقبلة.
- اعتبارًا من 14 مايو 2024، لا تدعم واجهة برمجة التطبيقات GPT-4o توليد الصور لفترة من الوقت، لذا إذا كنت بحاجة إلى توليد صور، يُنصح باستخدام واجهة برمجة التطبيقات DALL-E 3.
- توصي OpenAI جميع المستخدمين الذين يستخدمون حاليًا GPT-4 أو GPT-4 Turbo بالتفكير في الانتقال إلى GPT-4o. ليس بالضرورة أن يكون GPT-4o أكثر قدرة من GPT-4 أو GPT-4 Turbo في جميع الحالات، لذا تقترح OpenAI مقارنة المخرجات وتجربة GPT-4o لتقييم قدراته قبل التفكير في الانتقال.
اختبر وأدِر واجهة برمجة التطبيقات GPT-4o بسهولة مع Apidog
عند استخدام واجهة برمجة التطبيقات GPT-4o، تصبح مهام مثل اختبار واجهة برمجة التطبيقات والإدارة أساسية.
عند استخدام أداة إدارة واجهات برمجة التطبيقات الأكثر ملاءمة - Apidog، يمكنك التعامل مع أي واجهة برمجة تطبيقات بشكل أكثر ملاءمة وكفاءة. نظرًا لأن واجهة برمجة التطبيقات GPT-4o متاحة بالفعل، يمكنك الوصول إلى API Hub على Apidog والوصول بسهولة إلى مشروع واجهة برمجة التطبيقات من OpenAI. بعد ذلك، يمكنك استنساخ مشروع واجهة برمجة التطبيقات GPT-4o إلى مشروعك، واستخدامه واختبار واجهة برمجة التطبيقات GPT-4o، وإدارته بشكل مريح مع Apidog.

بالإضافة إلى ذلك، يدعم Apidog أحداث الخادم المرسلة (SSE)، مما يجعل من السهل دفق واجهة برمجة التطبيقات GPT-4o! لمزيد من التفاصيل، تحقق من هذه المقالة:

شرط استخدام واجهة برمجة التطبيقات GPT-4o: مفتاح واجهة برمجة التطبيقات من OpenAI
لبدء استخدام واجهة برمجة التطبيقات GPT-4o، تحتاج أولاً إلى الحصول على رمز واجهة برمجة التطبيقات من OpenAI. دعونا نتبع الدليل أدناه للحصول على مفتاح واجهة برمجة التطبيقات من OpenAI الخاص بك.
1. التسجيل للحصول على حساب OpenAI
لبدء استخدام واجهة برمجة التطبيقات GPT-4o، تحتاج أولاً إلى إنشاء حساب على OpenAI. قم بالوصول إلى الموقع الرسمي لـ OpenAI وانقر على زر "ابدأ" في الزاوية اليمنى العليا لإنشاء حساب.

2. الحصول على مفتاح واجهة برمجة التطبيقات من OpenAI
بعد إنشاء حسابك على OpenAI، تحتاج إلى الحصول على مفتاح واجهة برمجة التطبيقات للمصادقة، وهو شرط لاستخدام واجهة برمجة التطبيقات GPT-4o. اتبع هذه الخطوات للحصول على مفتاح واجهة برمجة التطبيقات الخاص بك:
الخطوة 1: انتقل إلى صفحة مفاتيح واجهة برمجة التطبيقات على OpenAI وقم بتسجيل الدخول باستخدام حسابك (أو لإنشاء حساب جديد إذا لم يكن لديك واحد).
الخطوة 2: انقر على زر "إنشاء مفتاح سري جديد" لتوليد مفتاح واجهة برمجة التطبيقات جديد.

بعد توليد مفتاح واجهة برمجة التطبيقات، سيتم عرضه على الشاشة على الفور. ومع ذلك، لن تتمكن من عرض مفتاح واجهة برمجة التطبيقات مرة أخرى، لذا يُنصح بتدوينه وتخزينه بشكل آمن.
اختبار وإدارة واجهة برمجة التطبيقات GPT-4o مع Apidog
Apidog هو أداة رائعة لسهولة استخدام واجهة برمجة التطبيقات GPT-4o. Apidog لديه مشروع واجهة برمجة التطبيقات من OpenAI يغطي جميع واجهات برمجة التطبيقات المقدمة من OpenAI. إذا كنت ترغب في التحقق من واجهات برمجة التطبيقات المقدمة من OpenAI، قم بالوصول إلى الصفحة التالية:

حاليًا، تتوفر واجهة برمجة التطبيقات GPT-4o فقط في واجهة برمجة التطبيقات المكملة للمحادثات، وواجهة برمجة التطبيقات المساعدة، وواجهة برمجة التطبيقات الدفعية، لذا اختر كل واحدة من القائمة اليسرى لمشروع واجهة برمجة التطبيقات من OpenAI لبدء استخدام واجهة برمجة التطبيقات GPT-4o.

خطوة بخطوة: استخدام واجهة برمجة التطبيقات GPT-4o مع Apidog
عند الوصول إلى مشروع واجهة برمجة التطبيقات من OpenAI على Apidog، يمكنك بسهولة اختبار واجهات برمجة التطبيقات من OpenAI باتباع هذه الخطوات. دعنا نمر بكيفية استخدام GPT-4o مع واجهة برmجة التطبيقات المكملة للمحادثات.
الخطوة 1: الوصول إلى مشروع واجهة برمجة التطبيقات من OpenAI على Apidog، اختر نقطة نهاية واجهة برمجة التطبيقات المكملة للمحادثات من القائمة اليسرى، وعلى شاشة الطلب الجديدة، أدخل طريقة HTTP ورابط النهاية وفقًا لمواصفات ChatGPT. ثم، في علامة "Body"، اكتب الرسالة التي ترغب في إرسالها إلى ChatGPT بتنسيق JSON.
ملاحظة: لاستخدام GPT-4o، حدد النموذج كـ "gpt-4o" من خلال تضمين "model":"gpt-4o".

الخطوة 2: انتقل إلى علامة "Header"، أضف معلمة المصادقة لتوثيق الاتصال مع واجهة برمجة التطبيقات ChatGPT، أدخل مفتاح واجهة برمجة التطبيقات الذي حصلت عليه، وانقر على زر "Send".

ملاحظة: في Apidog، يمكنك تخزين مفتاح واجهة برمجة التطبيقات الخاص بك كـ متغير بيئة. يعني تخزين مفتاح واجهة برمجة التطبيقات من OpenAI كمتغير بيئة أنك تستطيع الإشارة مباشرة إلى المتغير البيئي لاحقًا دون الحاجة إلى إعادة إدخال مفتاح واجهة برمجة التطبيقات عدة مرات، مما يجعله مريحًا.

ملخص
في هذه المقالة، قدمنا شرحًا تفصيليًا عن أحدث نموذج لـ OpenAI، GPT-4o. يتمتع GPT-4o بوقت استجابة أسرع بمعدل الضعف مقارنة بالنماذج السابقة ويمكنه فهم النصوص والصور والصوتيات والفيديو. بالإضافة إلى ذلك، تم تقليل عدد الرموز المستخدمة للغة اليابانية، مما يحسن الأداء من حيث التكلفة.
واجهة برمجة التطبيقات GPT-4o متاحة في واجهة برمجة التطبيقات المكملة للمحادثات وواجهة برمجة التطبيقات المساعدة وواجهة برمجة التطبيقات الدفعية، مع ميزات مثل ذكاء أعلى، سرعة استجابة أسرع بمعدل الضعف، تسعير أقل بنسبة 50%، حد أعلى لمعدل السعة يصل إلى 5 مرات، تحسين القدرات البصرية، وتحسين قدرات اللغات غير الإنجليزية مقارنةً بالواجهات السابقة لنموذج ChatGPT.
لستخدام واجهة برمجة التطبيقات GPT-4o، تحتاج أولاً إلى إنشاء حساب على OpenAI والحصول على مفتاح واجهة برمجة التطبيقات. ثم، مع Apidog، يمكنك بسهولة اختبار وإدارة واجهة برمجة التطبيقات GPT-4o. لدى Apidog مشروع لواجهة برمجة التطبيقات من OpenAI يغطي مواصفات واجهة برمجة التطبيقات GPT-4o، ويمكنك تخزين مفتاح واجهة برمجة التطبيقات الخاص بك كمتغير بيئة لتجنب إعادة إدخاله.
في المستقبل، سيتم إضافة دعم الصوت إلى واجهة برمجة التطبيقات GPT-4o. من خلال الاستفادة من الميزات الممتازة لـ GPT-4o ودمجها في خدماتك، يمكنك تقديم تجربة ذكاء اصطناعي أفضل بكثير.
