ملخص: أطلقت Google نموذج Gemma 4 في أبريل 2026، وهي عائلة مكونة من أربعة نماذج مفتوحة المصدر مرخصة تحت Apache 2.0، وتتفوق هذه النماذج على نماذج أكبر منها 20 مرة في حجمها على معايير الأداء القياسية. يمكنك استدعاء واجهة برمجة تطبيقات Gemma 4 عبر Google AI Studio أو Vertex AI، أو تشغيلها محليًا باستخدام Ollama و vLLM. قم بإقرانها بـ Smart Mock من Apidog لإنشاء استجابات API واقعية تلقائيًا من مخططات OpenAPI الخاصة بك دون كتابة أي قاعدة محاكاة واحدة.
مقدمة
معظم نماذج الذكاء الاصطناعي مفتوحة المصدر تجعلك تختار بين: القدرة الخام أو سهولة النشر. فإما أن تحصل على نموذج كبير جدًا لا يمكن تشغيله على جهاز الكمبيوتر المحمول الخاص بك، أو نموذج صغير لا يمكنه التعامل مع الاستدلال متعدد الخطوات. Gemma 4 يكسر هذه المقايضة.
Gemma 4 هي أقوى عائلة نماذج مفتوحة من Google DeepMind حتى الآن. يحتل نموذج 31B Dense المرتبة الثالثة بين جميع النماذج المفتوحة على لوحة صدارة Arena AI، متفوقًا على منافسيه الأكبر منه بـ 20 مرة. ويحتل نموذج 26B Mixture of Experts (MoE) المرتبة السادسة. وكلاهما يعمل على وحدة معالجة رسوميات (GPU) واحدة بحجم 80 جيجابايت. أما نماذج E2B و E4B خفيفة الوزن فتعمل بالكامل دون اتصال بالإنترنت على الهواتف والأجهزة الطرفية.
بالنسبة لمطوري واجهات برمجة التطبيقات (API)، هذا الأمر يهم أكثر مما يبدو. يدعم Gemma 4 بشكل أصلي استدعاء الوظائف، وإخراج JSON المنظم، ونوافذ سياق تصل إلى 256 ألف. وهذا يجعله خيارًا عمليًا لبناء أدوات API المدعومة بالذكاء الاصطناعي، بدءًا من إنشاء بيانات الاختبار وصولاً إلى كتابة المحاكاة وتحليل استجابات API.
ما هو Gemma 4 وما الجديد فيه؟
Gemma 4 هو الجيل الرابع من نماذج اللغة المفتوحة من Google DeepMind. يأتي اسم "Gemma" من الكلمة اللاتينية التي تعني الأحجار الكريمة. بدأت السلسلة في أوائل عام 2024، ومنذ الإطلاق، قام المطورون بتنزيل نماذج Gemma أكثر من 400 مليون مرة. وقد أنشأ المجتمع أكثر من 100,000 نسخة، مشكلين ما تسميه Google "Gemmaverse".

تم إطلاق Gemma 4 بموجب ترخيص Apache 2.0، وهو تغيير مهم عن الأجيال السابقة التي استخدمت سياسة استخدام مخصصة. هذا يعني أنه يمكنك استخدام وتعديل وتوزيع Gemma 4 تجاريًا دون قيود. وهذا تحول ذو مغزى للمؤسسات والشركات الناشئة التي تحتاج إلى تحكم كامل في بنيتها التحتية للذكاء الاصطناعي.
التحسين الرئيسي في Gemma 4 هو ما تسميه Google "الذكاء لكل معلمة". يوفر نموذج 31B Dense قدرات رائدة بتكلفة حاسوبية أقل بكثير من نماذج مثل GPT-4 أو Claude 3 Sonnet. في لوحة صدارة Arena AI للنصوص (اعتبارًا من أبريل 2026)، يتفوق Gemma 4 31B على نماذج بأكثر من 600 مليار معلمة.

إليك ما هو جديد حقًا مقارنة بـ Gemma 3:
إدخال متعدد الوسائط أصلي. جميع نماذج Gemma 4 الأربعة تعالج الصور والفيديو بشكل أصلي. تضيف نماذج E2B و E4B الطرفية إدخالًا صوتيًا أصليًا للتعرف على الكلام. لم يكن هذا جزءًا من قدرة Gemma 3 الأساسية.
نوافذ سياق أطول. تدعم نماذج E2B و E4B 128 ألف رمز (token). تمتد نماذج 26B و 31B إلى 256 ألف رمز. وهذا يكفي لتمرير مستودع كود كامل في مطالبة واحدة.
دعم سير عمل الوكيل (Agentic workflow). يتضمن Gemma 4 استدعاء وظائف أصلي، ووضع إخراج JSON منظم، وتعليمات النظام. هذه الميزات الثلاث معًا تجعل من العملي بناء وكلاء يمكنهم استدعاء واجهات برمجة التطبيقات الخارجية، وتحليل الاستجابات، وتسلسل الإجراءات معًا.
الاستدلال المتقدم. يظهر نموذج 31B تحسينات كبيرة في معايير الرياضيات واتباع التعليمات متعددة الخطوات مقارنة بـ Gemma 3. هذا مهم لتوليد اختبارات API، حيث تحتاج إلى أن يفهم النموذج العلاقات بين نقاط النهاية ومخططات البيانات.
دعم أكثر من 140 لغة. تم تدريب Gemma 4 بشكل أصلي على أكثر من 140 لغة، ولم يتم تعديله من الإنجليزية. هذا يجعله قابلاً للاستخدام لمنتجات API العالمية فورًا.
ترخيص Apache 2.0. كما ذكرنا، هذا يزيل الغموض القانوني للاستخدام التجاري. أنت تمتلك نماذجك، بياناتك، ونشاطات النشر الخاصة بك.
إصدارات نموذج Gemma 4 وقدراته
أصدرت Google Gemma 4 بأربعة أحجام، يستهدف كل منها مستوى معين من الأجهزة:
| النموذج | المعلمات | المعلمات النشطة (للاستدلال) | السياق | الأفضل لـ |
|---|---|---|---|---|
| E2B | 2B فعال | ~2B | 128 ألف | الجوال، إنترنت الأشياء، الأجهزة الطرفية غير المتصلة |
| E4B | 4B فعال | ~4B | 128 ألف | الهواتف، Raspberry Pi، Jetson Orin |
| 26B MoE | إجمالي 26B | ~3.8B نشطة | 256 ألف | مهام الخادم الحساسة للزمن |
| 31B Dense | 31B | 31B | 256 ألف | أعلى جودة، بحث، ضبط دقيق |
تستخدم نماذج E2B و E4B بنية Mixture of Experts (MoE) التي تنشط جزءًا فقط من إجمالي المعلمات لكل رمز. وهذا يحافظ على عمر البطارية وذاكرة الوصول العشوائي (RAM) في الأجهزة محدودة الموارد. وقد قامت Google ببنائها بالتعاون مع Qualcomm و MediaTek، وتعمل بالكامل دون اتصال بالإنترنت على نظام Android عبر معاينة AICore Developer.
ينشط نموذج 26B MoE فقط 3.8 مليار معلمة أثناء الاستدلال على الرغم من وجود إجمالي 26 مليار معلمة. إنه الخيار الأسرع للنشر من جانب الخادم حيث تريد زمن انتقال منخفض دون التضحية بالكثير من الجودة.
نموذج 31B Dense هو الرائد في الجودة. إنه الخيار الذي تختاره للضبط الدقيق للمهام الخاصة بالمجال، أو لأي حالة استخدام تكون فيها جودة الإخراج أهم من السرعة. يتم شحن جميع الإصدارات الأربعة في أشكال مُضبطة بالتعليمات (IT) وأساسية.
بالنسبة لحالات استخدام واجهة برمجة التطبيقات (API)، يحقق 26B MoE أفضل توازن بين السرعة والجودة. ويعتبر 31B Dense هو الخيار الصحيح عندما تحتاج إلى إخراج JSON منظم لاستجابات API المعقدة أو عندما تقوم بإنشاء سيناريوهات اختبار بمنطق متعدد الخطوات.
تدعم جميع النماذج استدعاء الوظائف ووضع إخراج JSON، وهما القدرتان اللتان ستستخدمهما غالبًا عند بناء أدوات واجهة برمجة التطبيقات باستخدام Gemma 4.
إعداد واجهة برمجة تطبيقات Gemma 4: خطوة بخطوة
لديك ثلاثة مسارات رئيسية لاستدعاء Gemma 4: Google AI Studio (الأسرع)، Vertex AI (للمؤسسات)، أو النشر المحلي باستخدام Ollama أو vLLM. إليك كيفية إعداد كل منها.
الخيار 1: Google AI Studio (موصى به للنماذج الأولية)
انتقل إلى Google AI Studio وأنشئ حسابًا مجانيًا. من هناك، قم بإنشاء مفتاح API.
ثبّت حزمة SDK الخاصة بالذكاء الاصطناعي التوليدي من Google:
pip install google-genai
قم بإجراء أول استدعاء لك:
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemma-4-31b-it")
response = model.generate_content(
"Generate a JSON object for a user account with id, email, and created_at fields."
)
print(response.text)
للحصول على إخراج JSON منظم، استخدم المعلمة response_mime_type:
import google.generativeai as genai
import json
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel(
"gemma-4-31b-it",
generation_config={"response_mime_type": "application/json"}
)
prompt = """
Generate 3 sample user objects for an e-commerce API.
Each user should have: id (integer), email (string), username (string),
created_at (ISO 8601 timestamp), and subscription_tier (free|pro|enterprise).
Return as a JSON array.
"""
response = model.generate_content(prompt)
users = json.loads(response.text)
print(json.dumps(users, indent=2))
الخيار 2: النشر المحلي باستخدام Ollama
يتيح لك Ollama تشغيل Gemma 4 بالكامل على جهازك. قم بتثبيت Ollama من ollama.com، ثم اسحب النموذج:
ollama pull gemma4
شغل خادم النموذج:
ollama serve
استدعِها باستخدام تنسيق واجهة برمجة التطبيقات المتوافقة مع OpenAI:
import requests
import json
response = requests.post(
"http://localhost:11434/api/chat",
json={
"model": "gemma4",
"messages": [
{
"role": "user",
"content": "Generate a valid JSON response for a REST API /products endpoint. Include id, name, price, and stock fields."
}
],
"stream": False
}
)
result = response.json()
print(result["message"]["content"])
الخيار 3: استدعاء الوظائف لتنسيق واجهة برمجة التطبيقات
يدعم Gemma 4 استدعاء الوظائف الأصلي. يتيح لك ذلك تحديد الأدوات التي يمكن للنموذج استدعائها أثناء المحادثة:
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
# Define a tool that Gemma can call
tools = [
{
"function_declarations": [
{
"name": "get_api_schema",
"description": "Retrieve the OpenAPI schema for a given endpoint path",
"parameters": {
"type": "object",
"properties": {
"endpoint_path": {
"type": "string",
"description": "The API endpoint path, e.g. /users/{id}"
},
"method": {
"type": "string",
"enum": ["GET", "POST", "PUT", "DELETE", "PATCH"]
}
},
"required": ["endpoint_path", "method"]
}
}
]
}
]
model = genai.GenerativeModel("gemma-4-31b-it", tools=tools)
response = model.generate_content(
"I need to test the GET /users/{id} endpoint. What schema should the response follow?"
)
# Check if the model wants to call a function
if response.candidates[0].content.parts[0].function_call:
fc = response.candidates[0].content.parts[0].function_call
print(f"Model called function: {fc.name}")
print(f"With args: {dict(fc.args)}")
نمط استدعاء الوظائف هذا هو ما يجعل Gemma 4 مفيدًا لبناء خطوط أنابيب اختبار API ذاتية التحكم.
بناء نماذج API وهمية مدعومة بالذكاء الاصطناعي باستخدام Gemma 4
أحد التطبيقات الأكثر عملية لـ Gemma 4 لمطوري واجهات برمجة التطبيقات هو توليد بيانات وهمية. عندما تقوم ببناء واجهة أمامية قبل وجود الواجهة الخلفية، أو اختبار حالات الحواف التي يصعب تشغيلها في الإنتاج، فإنك تحتاج إلى استجابات وهمية واقعية.
إليك كيفية استخدام Gemma 4 لتوليد بيانات وهمية من مخطط OpenAPI:
import google.generativeai as genai
import json
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel(
"gemma-4-31b-it",
generation_config={"response_mime_type": "application/json"}
)
# Your OpenAPI schema for the response
schema = {
"type": "object",
"properties": {
"id": {"type": "integer"},
"order_number": {"type": "string", "pattern": "^ORD-[0-9]{6}$"},
"status": {"type": "string", "enum": ["pending", "shipped", "delivered", "cancelled"]},
"total": {"type": "number", "minimum": 0},
"items": {
"type": "array",
"items": {
"type": "object",
"properties": {
"product_id": {"type": "integer"},
"quantity": {"type": "integer", "minimum": 1},
"unit_price": {"type": "number"}
}
}
},
"created_at": {"type": "string", "format": "date-time"}
}
}
prompt = f"""
Generate 5 realistic mock responses for an order management API.
Each response must conform exactly to this JSON Schema:
{json.dumps(schema, indent=2)}
Make the data realistic: use realistic prices, product IDs, and varied statuses.
Return as a JSON array of 5 order objects.
"""
response = model.generate_content(prompt)
mock_orders = json.loads(response.text)
print(json.dumps(mock_orders, indent=2))
النقطة الأساسية هنا هي أن Gemma 4 يفهم قيود مخطط JSON. إنه يحترم قيم التعداد، وأنماط السلاسل النصية، والنطاقات الرقمية. تحصل على بيانات وهمية تتطابق حقًا مع عقد واجهة برمجة التطبيقات الخاصة بك، وليس سلاسل عشوائية.
يمكنك توسيع هذا النمط لإنشاء بيانات وهمية لأي نقطة نهاية لواجهة برمجة التطبيقات. قم بتغذية مخطط الاستجابة من مواصفات OpenAPI الخاصة بك، وسيقوم Gemma 4 بإنتاج بيانات اختبار متوافقة مع المخطط.
للمحاكاة الأكثر تقدمًا، ادمج Gemma 4 مع منطق الاستجابة الشرطية. إذا كان الطلب يحتوي على معرف مستخدم معين، أعد استجابة خطأ. وإلا أعد بيانات نجاح. هذا هو المكان الذي تساعد فيه نافذة سياق Gemma 4 التي تبلغ 256 ألفًا: يمكنك تضمين مواصفات OpenAPI الكاملة في المطالبة وتطلب منها إنشاء استجابات وهمية لنقاط نهاية متعددة في وقت واحد.
أحد سير العمل العملي: قم بتصدير مجموعة Apidog الخاصة بك كمواصفات OpenAPI، والصقها في مطالبة، واطلب من Gemma 4 إنشاء 10 حالات اختبار واقعية لكل نقطة نهاية. ستحصل على مجموعة بيانات وهمية كاملة في ثوانٍ بدلاً من ساعات.
اختبار استجابات واجهة برمجة تطبيقات Gemma 4 باستخدام Apidog
بمجرد أن تقوم Gemma 4 بتوليد البيانات أو تعمل كجزء من مسار واجهة برمجة التطبيقات الخاص بك، تحتاج إلى التحقق من أن الاستجابات تتطابق مع مخططك. هذا هو المكان الذي تتناسب فيه ميزة سيناريوهات الاختبار في Apidog.

إليك سير العمل المحدد:
الخطوة 1: استيراد نقطة نهاية واجهة برمجة تطبيقات Gemma 4 الخاصة بك إلى Apidog.
في Apidog، انتقل إلى مشروعك وأنشئ نقطة نهاية جديدة. اضبط عنوان URL على أي واجهة برمجة تطبيقات (API) قمت بإنشائها حول Gemma 4 (أو وجهها مباشرة إلى نقطة نهاية Google AI Studio). حدد مخطط الاستجابة المتوقع في واجهة Apidog.
الخطوة 2: استخدم Smart Mock لإنشاء نماذج أولية للاستجابات المتوقعة.
قبل تشغيل الاختبارات المباشرة ضد Gemma 4، استخدم Smart Mock من Apidog لإنشاء استجابات أساسية من مخططك. يقرأ Smart Mock مواصفات استجابتك وينتج بيانات واقعية بناءً على أسماء و أنواع الخصائص. يحصل حقل يسمى email تلقائيًا على عنوان بريد إلكتروني صالح. يحصل حقل يسمى created_at على طابع زمني منسق بشكل صحيح.

يستخدم Smart Mock ثلاث طبقات أولوية: قيم الحقول الوهمية المخصصة أولاً، ثم مطابقة اسم الخاصية (حيث يستنتج نوع البيانات من أسماء الحقول)، ثم القيم الافتراضية لمخطط JSON. يعني هذا التسلسل الهرمي أنه يمكنك تجاوز حقول معينة بينما تترك المحرك يتعامل مع البقية.
الخطوة 3: إنشاء سيناريو اختبار لخط أنابيب Gemma 4 الخاص بك.
انتقل إلى وحدة الاختبارات في Apidog وأنشئ سيناريو اختبار جديدًا. أضف استدعاء واجهة برمجة تطبيقات Gemma 4 كخطوة أولى. ثم أضف خطوات التحقق من صحة الاستجابة.
يتيح لك وضع تنسيق سيناريو الاختبار في Apidog ربط طلبات متعددة. لاختبار تكامل واجهة برمجة تطبيقات Gemma 4، قد يبدو السيناريو الخاص بك كما يلي:
- استدعِ نقطة نهاية المصادقة الخاصة بك للحصول على رمز مميز
- أرسل مطالبة إلى Gemma 4 مع رمز المصادقة
- استخرج JSON الذي تم إنشاؤه من نص الاستجابة
- تحقق من صحة JSON المستخرج مقابل تأكيدات مخططك
- مرر البيانات التي تم التحقق من صحتها إلى نقطة نهاية POST لاحقة
الخطوة 4: إعداد التأكيدات.
في خطوة التأكيد، يمكنك التحقق من رموز الحالة ورؤوس الاستجابة وحقول JSON. لاستجابات Gemma 4، ستقوم عادةً بالتأكيد على أن حقل candidates[0].content.parts[0].text موجود وأن محتواه المحلل يتطابق مع المخطط المتوقع.
استخدم معالج "استخراج المتغير" (Extract Variable) في Apidog لسحب إخراج Gemma 4 إلى متغير. ثم استخدم هذا المتغير في خطوات الطلب اللاحقة. يتيح لك هذا ربط البيانات التي تم إنشاؤها بواسطة Gemma 4 من خلال سير عمل اختبار متعدد الخطوات.
الخطوة 5: التشغيل مع الاختبار المعتمد على البيانات.
يدعم Apidog ملفات بيانات اختبار CSV و JSON. يمكنك تحديد 50 اختلافًا مختلفًا في المطالبة في ملف CSV، واستيرادها إلى سيناريو الاختبار الخاص بك، وتشغيل جميع الاختلافات الـ 50 بنقرة واحدة. هذه هي الطريقة التي تختبر بها أن تكامل Gemma 4 يتعامل مع المدخلات المتنوعة بشكل صحيح.
يستغرق سير العمل الكامل من تعريف المخطط إلى تنفيذ الاختبار حوالي 15 دقيقة للإعداد. بعد ذلك، يمكنك تشغيله في كل عملية التزام عبر Apidog CLI في خط أنابيب CI/CD الخاص بك.
حالات الاستخدام في العالم الحقيقي
توليد بيانات اختبار واجهة برمجة التطبيقات. تقضي فرق ضمان الجودة وقتًا طويلاً في كتابة تجهيزات الاختبار. باستخدام وضع إخراج JSON لـ Gemma 4 ومخطط OpenAPI الخاص بك، يمكنك توليد مئات من سجلات الاختبار الواقعية في دقائق. قم بتغذية المخطط، وحدد حالات الحواف التي تريد تغطيتها، ودع النموذج ينتج البيانات.
محاكاة API الذكية. تُعيد المحاكاة التقليدية بيانات ثابتة. مع Gemma 4 خلف خادم المحاكاة الخاص بك، يمكنك إرجاع استجابات مناسبة للسياق. يمكن لمحاكاة واجهة برمجة تطبيقات البحث عن المنتجات أن تُعيد مجموعات منتجات مختلفة بناءً على استعلام البحث، حتى بدون برمجة كل حالة بشكل صلب.
توليد وثائق API. تتيح لك نافذة سياق Gemma 4 التي تبلغ 256 ألفًا إدخال قاعدة بياناتك البرمجية بأكملها في مطالبة. اطلب منها توليد وثائق OpenAPI لنقاط النهاية غير الموثقة. يدعم استدعاء الوظائف بناء وكيل يقرأ ملفات المسارات الخاصة بك ويكتب مواصفات API تلقائيًا.
التحقق من صحة مخطط الاستجابة. عند استهلاك واجهات برمجة تطبيقات (APIs) خارجية، تريد التحقق من أن الاستجابات تتطابق مع توقعاتك. استخدم Gemma 4 لتحليل استجابات واجهات برمجة التطبيقات والإبلاغ عن انتهاكات المخطط. يمكنه اكتشاف الحقول المفقودة، والأنواع غير الصحيحة، والتعدادات غير المتسقة بشكل أفضل من مدقق مخطط JSON البسيط.
كتابة اختبارات الانحدار الآلية. امنح Gemma 4 مواصفات واجهة برمجة التطبيقات الخاصة بك وقائمة بتقارير الأخطاء. اطلب منها كتابة حالات اختبار كان من شأنها اكتشاف كل خطأ. نظرًا لأنها تفهم علاقات المخطط، يمكنها كتابة اختبارات غير تافهة تتحقق من انتقالات الحالة واعتماديات الحقول.
Gemma 4 مقابل نماذج مفتوحة أخرى لاستخدام API
كيف يقارن Gemma 4 بالنماذج المفتوحة الأخرى عندما يكون هدفك هو بناء أدوات واجهة برمجة التطبيقات (API)؟
| النموذج | المعلمات | السياق | إخراج JSON | استدعاء الوظائف | الترخيص |
|---|---|---|---|---|---|
| Gemma 4 31B | 31B | 256 ألف | أصلي | أصلي | Apache 2.0 |
| Gemma 4 26B MoE | 26B (3.8B نشطة) | 256 ألف | أصلي | أصلي | Apache 2.0 |
| Llama 3.3 70B | 70B | 128 ألف | عبر المطالبة | عبر المطالبة | Llama Community |
| Mistral 7B | 7B | 32 ألف | عبر المطالبة | محدود | Apache 2.0 |
| Qwen 2.5 72B | 72B | 128 ألف | أصلي | أصلي | Apache 2.0 |
بالنسبة لحالات استخدام واجهة برمجة التطبيقات (API)، فإن الميزات الحاسمة هي وضع إخراج JSON الأصلي، ودعم استدعاء الوظائف، وطول السياق. Gemma 4 31B و 26B كلاهما يمتلك هذه الميزات الثلاث.
Llama 3.3 70B هو المنافس الرئيسي. إنه نموذج قوي، ولكنه يتطلب ضعف قوة الحوسبة لـ Gemma 4 31B لتشغيله. في لوحة صدارة Arena AI، يحتل Gemma 4 31B مرتبة أعلى من Llama 3.3 70B على الرغم من كونه نصف الحجم. إذا كنت تقوم بالاستدلال على نطاق واسع، فإن هذا الاختلاف في متطلبات وحدة معالجة الرسوميات (GPU) يترجم مباشرة إلى تكلفة البنية التحتية.
Mistral 7B أصغر وأسرع بكثير، لكن نافذة سياقه البالغة 32 ألف تحد من فائدته لمواصفات واجهة برمجة التطبيقات الكبيرة. كما أنه يفتقر إلى وضع JSON الأصلي واستدعاء الوظائف الموثوق به.
Qwen 2.5 72B هو بديل قادر، خاصة للتطبيقات متعددة اللغات. ميزاته الخاصة بأدوات واجهة برمجة التطبيقات قابلة للمقارنة مع Gemma 4، لكنها تتطلب أجهزة أكثر بكثير.
ترخيص Apache 2.0 على Gemma 4 هو ميزة غير مقدرة حقًا. يستخدم Llama ترخيص Llama Community، الذي يحتوي على قيود على بعض الاستخدامات التجارية. إذا كنت تقوم ببناء منتج على رأس نموذج مفتوح، فإن الوضوح القانوني لـ Apache 2.0 مهم.
بالنسبة لمعظم حالات استخدام أدوات واجهة برمجة التطبيقات: ابدأ بـ Gemma 4 26B MoE للمهام الحساسة لزمن الانتقال، أو Gemma 4 31B للحصول على أعلى جودة إخراج.
الخلاصة
تمنح Gemma 4 المطورين بديلًا مفتوحًا موثوقًا به لواجهات برمجة تطبيقات الذكاء الاصطناعي الاحتكارية لبناء أدوات واجهة برمجة التطبيقات. يزيل ترخيص Apache 2.0 الاحتكاك القانوني الذي جعل النماذج المفتوحة السابقة معقدة عند الشحن التجاري. كما أن استدعاء الوظائف الأصلي ووضع إخراج JSON يجعلان دمجها في سير عمل واجهة برمجة التطبيقات عمليًا دون الحاجة إلى هندسة مطالبة مكثفة.
تغطي الأحجام الأربعة للنموذج كل مستوى من مستويات الأجهزة، من الهواتف إلى محطات العمل. ويعد نموذج 26B MoE الخيار البارز لمعظم حالات استخدام تطوير واجهة برمجة التطبيقات: فهو يوفر جودة شبه رائدة بجزء بسيط من تكلفة الاستدلال.
قم بإقران Gemma 4 بـ Apidog لإغلاق الحلقة بين البيانات المولدة بالذكاء الاصطناعي والتحقق من صحة واجهة برمجة التطبيقات. استخدم Gemma 4 لتوليد بيانات الاختبار والاستجابات الوهمية. استخدم Smart Mock من Apidog لإنشاء نماذج أولية للمخططات، وسيناريوهات الاختبار الخاصة به للتحقق من أن إخراج الذكاء الاصطناعي يفي بعقد واجهة برمجة التطبيقات الخاصة بك. يشكلان معًا سير عمل عمليًا لبناء واجهات برمجة تطبيقات مدعومة بالذكاء الاصطناعي واختبارها.
الأسئلة الشائعة
ما هو Gemma 4؟Gemma 4 هي أحدث عائلة من نماذج اللغة المفتوحة من Google DeepMind، تم إطلاقها في أبريل 2026. تأتي بأربعة أحجام (E2B، E4B، 26B MoE، 31B Dense) وهي مرخصة بموجب Apache 2.0. يحتل نموذج 31B حاليًا المرتبة الثالثة بين جميع النماذج المفتوحة على لوحة صدارة Arena AI النصية.
هل Gemma 4 مجاني للاستخدام؟أوزان النموذج مجانية للتنزيل والاستخدام بموجب ترخيص Apache 2.0. تدفع مقابل الحوسبة عندما تقوم بتشغيله بنفسك. إذا استخدمت Google AI Studio، فهناك طبقة مجانية بحدود معدل. يفرض Vertex AI أسعار حوسبة Google Cloud القياسية.
هل يمكن لـ Gemma 4 إخراج JSON منظم؟نعم. يدعم Gemma 4 معلمة response_mime_type: "application/json" أصلية من خلال Google Generative AI SDK. وهذا يجبر النموذج على إرجاع JSON صالح في كل مرة، وهو أمر ضروري لتكاملات واجهة برمجة التطبيقات حيث تقوم بتحليل الإخراج برمجيًا.
كيف يقارن Gemma 4 بـ GPT-4o لتطوير واجهة برمجة التطبيقات؟GPT-4o هو نموذج احتكاري بدون خيار نشر محلي وتكاليف واجهة برمجة تطبيقات أعلى. Gemma 4 31B مجاني للنشر محليًا، ودرجاته المعيارية تنافسية مع GPT-4o في مهام الاستدلال. بالنسبة للفرق التي تحتاج إلى خصوصية البيانات أو التحكم في التكلفة، فإن Gemma 4 يستحق التقييم الجاد.
هل يمكنني ضبط Gemma 4 على بيانات واجهة برمجة التطبيقات الخاصة بي؟نعم. تدعم Google الضبط الدقيق لـ Gemma 4 من خلال Google AI Studio و Vertex AI وأدوات الطرف الثالث مثل Hugging Face TRL. يمكن أن يؤدي الضبط الدقيق لمخططات واجهة برمجة التطبيقات الخاصة بالمجال وأنماط الاستجابة إلى تحسين جودة الإخراج بشكل كبير لحالات الاستخدام المتخصصة.
ما هي الأجهزة التي أحتاجها لتشغيل Gemma 4 محليًا؟تتناسب نماذج 31B و 26B على بطاقة NVIDIA H100 واحدة بحجم 80 جيجابايت بتنسيق bfloat16. تعمل الإصدارات الكمية على وحدات معالجة الرسوميات الاستهلاكية بسعة 16-24 جيجابايت من ذاكرة الفيديو. وتعمل نماذج E4B و E2B على الهواتف والأجهزة الطرفية، بما في ذلك Raspberry Pi و NVIDIA Jetson.
هل يدعم Gemma 4 استدعاء الوظائف؟نعم، تدعم جميع نماذج Gemma 4 استدعاء الوظائف الأصلي. يمكنك تعريف الأدوات ككائنات JSON تحتوي على اسم ووصف ومخطط معلمات. يقرر النموذج متى يستدعي أداة ويمرر حججًا منظمة يمكنك التصرف بناءً عليها في الكود.
كيف يمكنني اختبار استجابات واجهة برمجة تطبيقات Gemma 4 تلقائيًا؟استخدم سيناريوهات الاختبار في Apidog لبناء سير عمل اختبار متسلسل. قم باستيراد نقطة نهاية واجهة برمجة تطبيقات Gemma 4 الخاصة بك، وقم بإعداد خطوات الطلب، وأضف تأكيدات للتحقق من بنية الاستجابة. يمكنك تشغيل السيناريو محليًا، عبر CLI، أو تلقائيًا في خط أنابيب CI/CD الخاص بك في كل عملية دفع للكود.
