دولفين غما: نموذج لغوي كبير، ولكن للدلافين

@apidog

@apidog

29 نوفمبر 2025

دولفين غما: نموذج لغوي كبير، ولكن للدلافين

Apidog للمؤسسات

نشر محلي

SSO & RBAC

متوافق مع SOC 2

استكشاف Apidog Enterprise

لقد أحدث انتشار نماذج اللغة الكبيرة (LLMs) ثورة في معالجة اللغة الطبيعية، ومع ذلك فإن الميل إلى إنتاج محتوى غير موضوعي أو "هلوسة" لا يزال عقبة رئيسية أمام النشر الموثوق. غالبًا ما تمزج نماذج LLM القياسية بين معرفتها الواسعة، ولكنها غير واضحة، مع السياق المقدم من المستخدمين، مما يؤدي إلى مخرجات يصعب التحقق منها. لمعالجة ذلك، قدمت Google DolphinGemma، نسخة متخصصة ضمن عائلة نماذج Gemma المفتوحة، مصممة بدقة لـ التوليد القائم على الحقائق مع الاستشهاد الصريح. يوفر هذا المقال استكشافًا تقنيًا لهيكل DolphinGemma المحتمل، وطرق التدريب، ومعايير التقييم، وموقعه ضمن مشهد الذكاء الاصطناعي الموثوق.

💡
هل تريد أداة رائعة لاختبار واجهة برمجة التطبيقات تنتج وثائق واجهة برمجة التطبيقات جميلة؟

هل تحتاج إلى منصة متكاملة، شاملة لفريق المطورين لديك للعمل معًا بكفاءة قصوى ؟

تقدم Apidog جميع مطالبك، وتستبدل Postman بسعر أكثر ملاءمة بكثير!
زر

الهندسة الأساسية: تراث جيمّا

تبني DolphinGemma على الهيكل المعتمد لنماذج Gemma من Google. تستفيد Gemma نفسها من معماريات Transformer التي تعتمد على فك الترميز فقط، والتي تم الترويج لها من قبل نماذج مثل GPT.

من المتوقع أن تشمل الخصائص الرئيسية التي ورثتها DolphinGemma:

  1. كتل Transformer: تتكون من طبقات انتباه ذاتي متعدد الرأس وشبكات تغذية أمامية، مما يمكن النموذج من تقييم أهمية الرموز المختلفة في تسلسل الإدخال. تستخدم Gemma انتباه متعدد الاستعلام لكي يكون الاستنتاج أسرع ويقلل الحمل في الذاكرة، وهو ما يكون مفيدًا بشكل خاص للنماذج الكبيرة.
  2. أحجام المعلمات: من المتوقع أن تتوافق تنويعات DolphinGemma مع أحجام Gemma الصادرة، وخاصة 2B (حوالي 2.5 مليار معلمة) و7B/8B (حوالي 8.5 مليار معلمة فعالة). تمثل هذه الأحجام مقايضة مدروسة، حيث تقدم قدرات كبيرة بينما تظل قابلة للنشر على وحدات معالجة رسومات بمستوى المستهلك (مثل سلسلة NVIDIA RTX) ووحدات المعالجة المركزية، أو مستضافة بكفاءة في بيئات سحابية (مثل Google Cloud Vertex AI، Kaggle).
  3. المفردات وترميز الرموز: تستخدم مُركب جمل (SentencePiece) مُدرب على مجموعة نصية كبيرة، يُحتمل أن يكون بنفس حجم المفردات 256k المستخدم لنموذج Gemma. يسمح ذلك بترميز فعال لنصوص متنوعة وأكواد.
  4. وظائف التفعيل: تستخدم وظائف تفعيل حديثة مثل GeGLU (وحدات الخطية المغلقة مع تفعيل GELU) لتحسين ديناميكيات التدريب والأداء.
  5. التطبيع: تستخدم RMSNorm (تطبيع الجذور التربيعية للمتوسط) بدلاً من تطبيع الطبقة القياسي من أجل الكفاءة الحسابية دون التضحية بالأداء.
  6. ترميز المواقع الدوارة (RoPE): تطبق المعلومات الموضعية مباشرة داخل آلية الانتباه، مما يوفر معالجة أفضل لطول التسلسل وقدرات استقراء محتملة محسنة مقارنة بالترميز الموضعية المطلقة أو المتعلمة.

توفر هذه الأساس نموذجًا قادرًا وفعالًا نسبيًا يبنى عليه قدرات DolphinGemma المتخصصة.

التحدي الفني: التغلب على هيمنة المعلمات

غالبًا ما تُظهر نماذج LLM القياسية، حتى عندما تتوفر على سياق عبر التوليد المعزز بالاسترجاع (RAG)، ظاهرة "تسرب المعرفة". حيث تشفر المعلمات الداخلية كميات هائلة من المعرفة العالمية المكتسبة خلال التدريب المسبق. خلال عملية التوليد، تتأثر توقعات النموذج للرمز التالي بكل من السياق المقدّم (المستندات المسترجعة) وهذه المعرفة الداخلية للمعلمات. يمكن أن يؤدي ذلك إلى:

الهدف الفني الأساسي لـ DolphinGemma هو تحيز العملية التوليدية بقوة نحو السياق المقدم وتوليد الاستشهادات الصريحة بالمصادر.

حل DolphinGemma: التعديل المتخصص الدقيق

تحقق DolphinGemma سلوكها القائم على الحقائق ليس من خلال تجديد الهيكل (من المحتمل وجود تغييرات ضئيلة، إن وجدت، على كتل Transformer الأساسية) ولكن من خلال التعديل الدقيق الموجه (SFT) ومن المحتمل أن تحتوي على مراحل من التعلم المعزز الموجه بشكل خاص نحو الاستناد والاقتران بالمصادر.

  1. هدف التعديل الدقيق: يتحول الهدف الأساسي للتدريب من اتباع التعليمات العامة أو القدرات الحوارية (مثل تنويعات Gemma-IT) إلى: بالنظر إلى استعلام Q ومجموعة المستندات المصدر {D1، D2، ...، Dn}، إنتاج إجابة A تكون متسقة موضوعيًا فقط مع المعلومات الموجودة في {Di} وتستند إلى روابط ربط المقاطع في A بالعودة إلى محددات Di المحددة.
  2. مجموعة بيانات التعديل الدقيق: يتطلب ذلك مجموعة بيانات متخصصة مختلفة عن مجموعات بيانات ضبط التعليمات التقليدية. من المحتمل أن تحتوي هذه المجموعة على أمثلة من الشكل:
  1. طريقة التدريب:

معايير التقييم والأداء

يتطلب تقييم DolphinGemma معايير تتجاوز درجات توليد اللغة القياسية (مثل BLEU أو ROUGE) التي تقيس في المقام الأول الطلاقة وتداخل النماذج. تشمل أبعاد التقييم الرئيسية:

  1. التأسيس/الأمانة:
  1. جودة الاقتباس:
  1. الطلاقة والملاءمة: لا تزال يمكن استخدام المعايير القياسية مثل ROUGE لضمان أن الناتج قابل للقراءة وملائم للاستعلام، على الرغم من أنه ثانوي بالنسبة للتأسيس.
  2. المعايير المرجعية: من المحتمل أن يتم التقييم على نسخ معدلة من مجموعات بيانات الأسئلة والأجوبة (الأسئلة الطبيعية، أسئلة الويب، TriviaQA) حيث يجب أن تُشتق الإجابات فقط من المقتطفات المقدمة، ومن المحتمل أن يتم التقييم على معايير مصممة خصيصًا لاختبار التأسيس والاستشهاد في ظروف معارضة (مثل المعلومات المتعارضة في المصادر).

الاعتبارات الفنية والمقايضات

الانفتاح والتوافر

جانب رئيسي من عائلة Gemma هو طبيعتها المفتوحة. عادة ما تطلق Google:

يتيح ذلك للباحثين والمطورين نشر و تعديل والبناء على DolphinGemma مباشرة. قد يكون التوافر عبر منصات مثل Kaggle و Hugging Face و Vertex AI Model Garden.

الخاتمة: هندسة الثقة في نماذج اللغة

تمثل DolphinGemma جهدًا هندسيًا كبيرًا لتزويد LLMs بقدرات موثوقة للتحقق والاستشهاد. من خلال الاستفادة من هيكل Gemma الفعال وتطبيق تعديل خاص على نطاق واسع مع التركيز على الالتزام بالسياق ونسبة المصادر، تتجاوز التوجيه العام لـ RAG. على الرغم من اعتمادها على جودة الاسترجاع ومواجهتها تحديات في التعامل مع صراعات المصادر، تقدم DolphinGemma نهجًا فنيًا قويًا لتخفيف الهلوسات وبناء أنظمة ذكاء اصطناعي أكثر موثوقية. يعد توافرها كنموذج مفتوح وعدًا بتسريع البحث والتطوير في تطبيقات الذكاء الاصطناعي المستندة إلى الحقائق، مما يوفر عنصرًا حيويًا للأنظمة التي تعتبر الدقة وقابلية التحقق أمورًا لا تقبل المساومة.

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات

دولفين غما: نموذج لغوي كبير، ولكن للدلافين