كيف تستخدم Gemma 4 12B مجانًا: 6 طرق فعالة في 2026

استخدم Gemma 4 12B مجانًا في عام 2026: ديمو Hugging Face، Ollama، LM Studio، llama.cpp، Transformers، و Google AI Edge. أوامر التشغيل بالإضافة إلى كيفية اختبار واجهة برمجة التطبيقات المحلية.

Ashley Innocent

Ashley Innocent

4 يونيو 2026

كيف تستخدم Gemma 4 12B مجانًا: 6 طرق فعالة في 2026

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Gemma 4 12B مفتوح الأوزان ومرخص بموجب Apache 2.0، لذا "مجاني" هنا يعني مجانيًا حقًا. لا توجد فواتير API ولا اشتراكات. يمكنك تنزيل النموذج وتشغيله على جهازك الخاص، أو تجربته في علامة تبويب المتصفح. التكلفة الوحيدة هي الأجهزة التي تمتلكها بالفعل.

شيء واحد يجب معرفته مقدمًا: تم تصميم 12B للاستخدام المحلي وعلى الجهاز. أشقاؤه الأكبر، 31B و 26B، هي النماذج التي تستضيفها Google للدردشة المجانية في AI Studio. الفكرة الأساسية لـ 12B هي أنه يعمل على جهاز كمبيوتر محمول بسعة 16 جيجابايت، لذا فإن المسارات المجانية أدناه تدور حول كيفية تشغيله على جهازك بسرعة. هل أنت جديد على النموذج؟ ابدأ بـ ما هو Gemma 4 12B للاطلاع على المواصفات.

فيما يلي ست طرق عمل، تتراوح من عرض توضيحي في المتصفح لمدة 60 ثانية إلى واجهة برمجة تطبيقات محلية كاملة يمكنك البناء عليها.

ملخص سريع

الطريقة ما تحصل عليه الأفضل لـ
مساحة Hugging Face دردشة المتصفح، بدون تثبيت تجربتها في دقيقة
Ollama نموذج محلي + واجهة برمجة تطبيقات متوافقة مع OpenAI المطورين، أمر واحد
LM Studio تطبيق سطح مكتب محلي بواجهة رسومية لا حاجة إلى طرفية
llama.cpp خادم API محلي خفيف الوزن الإعدادات المتقدمة ومنخفضة التكاليف
HF Transformers بايثون، تحكم كامل، وحدة معالجة رسومات Colab مجانية المفكرات والضبط الدقيق
Google AI Edge على الجهاز، للهواتف المحمولة الهواتف والأجهزة الطرفية

الطريقة 1: جربها في متصفحك (بدون تثبيت)

أسرع طريقة لرؤية Gemma 4 12B هي مساحة العرض التوضيحي الرسمية على Hugging Face. لا تنزيل، لا حساب، لا وحدة معالجة رسومات.

  1. افتح مساحة عرض Gemma 4 12B التوضيحية
  2. اكتب موجهًا، أو حمّل صورة أو مقطعًا صوتيًا
  3. اقرأ الرد

هذا هو المسار الصحيح لإجراء فحص سريع. يمكنك اختبار الجانب متعدد الوسائط أيضًا، حيث تقبل المساحة إدخال الصور والصوت. عندما تكون مستعدًا لبناء شيء حقيقي، انتقل إلى إحدى الطرق المحلية أدناه.

الطريقة 2: Ollama (الخيار الافتراضي للمطورين)

Ollama هي أبسط طريقة لتشغيل Gemma 4 12B محليًا والحصول على واجهة برمجة تطبيقات عاملة. تثبيت واحد، سحب واحد، انتهى.

تثبيت Ollama

على macOS أو Linux:

curl -fsSL https://ollama.com/install.sh | sh

على Windows، قم بتنزيل المثبت من ollama.com وقم بتشغيله.

سحب وتشغيل النموذج

ollama pull gemma4:12b
ollama run gemma4:12b

يقوم الأمر الأول بتنزيل النموذج (إصدار Q4_K_M بـ 4 بت افتراضيًا، حوالي 8 جيجابايت). يدخلك الأمر الثاني في دردشة تفاعلية. اكتب /bye للخروج.

استخدام واجهة برمجة التطبيقات المحلية

هذا هو الجزء الذي يهتم به المطورون. يقدم Ollama واجهة برمجة تطبيقات REST متوافقة مع OpenAI على http://localhost:11434. لا مفتاح، لا سحابة، لا حدود للمعدل.

curl http://localhost:11434/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma4:12b",
    "messages": [
      {"role": "user", "content": "Explain how transformers work in two sentences."}
    ]
  }'

نظرًا لأن نقطة النهاية تتطابق مع تنسيق OpenAI، فإن أي SDK أو أداة تدعم OpenAI تعمل عن طريق توجيه عنوان URL الأساسي إلى localhost:11434/v1. يتضمن ذلك المحررات وأطر عمل الوكلاء وعملاء واجهة برمجة التطبيقات. لنمط إعداد بيئة التطوير المتكاملة (IDE)، يحاكي هذا النهج دليل استخدام DeepSeek V4 في Cursor؛ استبدل سلسلة النموذج بـ gemma4:12b.

أوامر مفيدة:

الطريقة 3: LM Studio (لا حاجة لطرفية)

إذا كنت تفضل عدم التعامل مع سطر الأوامر، فإن LM Studio هو تطبيق سطح مكتب لأنظمة Windows و macOS و Linux.

  1. قم بتنزيل وتثبيت LM Studio
  2. ابحث عن Gemma 4 12B في فهرس النماذج
  3. اختر تقنية التكميم (quantization) التي تناسب ذاكرة الوصول العشوائي لديك وقم بتنزيلها
  4. افتح علامة تبويب الدردشة وابدأ في إدخال الموجهات

يقوم LM Studio أيضًا بتشغيل خادم محلي بنقطة نهاية متوافقة مع OpenAI، عادةً على المنفذ 1234، بحيث تحصل على واجهة برمجة تطبيقات دون كتابة أي تعليمات برمجية. إنه المسار الأكثر ودية للمصممين والكتاب وأي شخص يريد نافذة دردشة بدلاً من ملف تكوين.

الطريقة 4: llama.cpp (خفيف وسريع)

يقوم llama.cpp بتشغيل نماذج GGUF بحد أدنى من النفقات ويقدم خادمًا خاصًا به متوافقًا مع OpenAI.

تثبيته:

# macOS
brew install llama.cpp

# Windows
winget install llama.cpp

ثم ابدأ تشغيل خادم يشير إلى بنية GGUF الرسمية. تصفح مجموعة ggml-org/gemma-4 على Hugging Face للعثور على اسم مستودع 12B الدقيق، ثم قم بتمريره إلى llama-server:

llama-server -hf ggml-org/gemma-4-12B-it-GGUF

يكشف ذلك عن واجهة برمجة تطبيقات متوافقة مع OpenAI على http://localhost:8080/v1. هذا المسار هو الأفضل عندما تريد الحد الأدنى من التبعيات أو كنت تعمل على أجهزة متواضعة. كما أنه المحرك الأساسي للعديد من الأدوات الأخرى، لذا فإن تعلمه مجزٍ.

الطريقة 5: Hugging Face Transformers (تحكم كامل)

بالنسبة للمفكرات أو البرامج النصية أو الضبط الدقيق، قم بتشغيل النموذج باستخدام Transformers في بايثون. إذا لم يكن لديك وحدة معالجة رسومات محلية، فإن دفتر ملاحظات Google Colab المجاني يوفر لك واحدة.

تثبيت المكتبات:

pip install transformers torch accelerate torchvision
# add librosa for audio and video input
pip install librosa

ثم قم بتحميل النموذج المضبوط بالتعليمات وقم بالتوليد:

from transformers import AutoProcessor, AutoModelForMultimodalLM

MODEL_ID = "google/gemma-4-12B-it"

processor = AutoProcessor.from_pretrained(MODEL_ID)
model = AutoModelForMultimodalLM.from_pretrained(
    MODEL_ID,
    dtype="auto",
    device_map="auto",
)

messages = [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Write a short joke about saving RAM."},
]

inputs = processor.apply_chat_template(
    messages,
    tokenize=True,
    return_dict=True,
    return_tensors="pt",
    add_generation_prompt=True,
    enable_thinking=False,
).to(model.device)

input_len = inputs["input_ids"].shape[-1]
outputs = model.generate(**inputs, max_new_tokens=1024)
response = processor.decode(outputs[0][input_len:], skip_special_tokens=False)
print(processor.parse_response(response))

اضبط enable_thinking=True لتشغيل وضع التفكير خطوة بخطوة. لإدخال ملف صورة أو صوت، أضف قائمة محتوى تحتوي على {"type": "image", ...} قبل النص و {"type": "audio", ...} بعده. الأوزان موجودة أيضًا على Kaggle إذا كنت تفضل هذا المصدر. أنماط الكود الكاملة موجودة في دليل المطور.

الطريقة 6: Google AI Edge (على الجهاز والهواتف المحمولة)

لتشغيل Gemma 4 12B على هاتف أو جهاز طرفي، تقدم Google حزمة AI Edge. يعمل تطبيق Google AI Edge Gallery وواجهة سطر الأوامر LiteRT-LM كلاهما على تشغيل 12B على الجهاز.

لخادم محلي مع LiteRT-LM:

litert-lm import \
  --from-huggingface-repo=litert-community/gemma-4-12B-it-litert-lm \
  gemma-4-12B-it.litertlm gemma4-12b
litert-lm serve

هذا هو المسار للمساعدين المتنقلين غير المتصلين بالإنترنت والتطبيقات المدمجة حيث لا تغادر البيانات الجهاز أبدًا.

اختبر واجهة برمجة تطبيقات Gemma 4 12B المحلية باستخدام Apidog

بمجرد تشغيل Gemma 4 12B عبر Ollama أو llama.cpp، سيكون لديك واجهة برمجة تطبيقات HTTP حقيقية على جهازك. قبل ربطها بتطبيق، من المفيد اختبارها في عميل API مناسب لتتعرف على شكل الطلب والاستجابة الدقيقين. تم تصميم Apidog لذلك.

إليك إعداد نظيف:

  1. حمل Apidog وأنشئ مشروع HTTP جديدًا
  2. أضف طلب POST إلى http://localhost:11434/v1/chat/completions
  3. اضبط جسم الطلب على JSON والصق حمولة نموذجية:
{
  "model": "gemma4:12b",
  "messages": [
    {"role": "user", "content": "Return a JSON object with two fields: city and country."}
  ],
  "stream": false
}
  1. احفظ عنوان URL الأساسي كمتغير بيئة لتتمكن من التبديل بين Ollama (:11434) و llama.cpp (:8080) بنقرة واحدة
  2. أضف تأكيد استجابة لتأكيد أن النموذج يُرجع JSON صالحًا في حقل content
  3. غيّر "stream": true وشاهد Apidog وهو يعرض الرموز المتدفقة، وهي الطريقة التي ستؤكد بها عمل التدفق قبل بناء واجهة مستخدم حوله

الفائدة: ستكتشف موجهًا غير صحيح أو اسم حقل خاطئ في Apidog، وليس في عمق ثلاثة طبقات من التعليمات البرمجية لتطبيقك. إذا كنت تقارن العملاء، فراجع مجموعتنا من أدوات اختبار API المجانية عبر الإنترنت و أفضل بدائل Postman. نفس سير عمل الاختبار ينطبق على أي نقطة نهاية متوافقة مع OpenAI، لذا تنتقل العادات مباشرة إلى سير عمل كيفية اختبار واجهات برمجة التطبيقات باستخدام Postman.

أي تكميم يجب أن تختار؟

يتناسب Gemma 4 12B مع الأجهزة المختلفة بناءً على مدى قوة ضغطه:

الإصدار الذاكرة المطلوبة المفاضلة
دقة كاملة ~16 جيجابايت أفضل جودة
8 بت ~14 جيجابايت جودة شبه كاملة
4 بت (Q4_K_M) ~8 جيجابايت انخفاض طفيف في الجودة، يعمل على نطاق واسع

يستخدم Ollama افتراضيًا إصدار 4 بت، ولهذا السبب يعمل على وحدة معالجة رسومات 8 جيجابايت أو جهاز MacBook بذاكرة موحدة 16 جيجابايت. إذا كان لديك مساحة إضافية، فإن إصدار 8 بت يمنحك تحسينًا في الجودة مقابل بضعة غيغابايت إضافية.

ما هي الطريقة المجانية التي يجب أن تختارها؟

شجرة قرار سريعة:

معظم المطورين يعتمدون على Ollama للاستخدام اليومي ويحتفظون بـ Transformers للأعمال الأكثر تعقيدًا.

نصائح للحصول على أقصى استفادة من Gemma المحلي المجاني

الأسئلة الشائعة

هل Gemma 4 12B مجاني حقًا؟ نعم. إنه مفتوح الأوزان بموجب ترخيص Apache 2.0، مجاني للتنزيل والتشغيل، بما في ذلك الاستخدام التجاري. تدفع فقط ثمن الأجهزة أو السحابة التي تشغله عليها.

هل أحتاج إلى وحدة معالجة رسومات (GPU)؟ لا، لكنها تساعد. يعمل إصدار 4 بت على وحدة معالجة رسومات بسعة 8 جيجابايت أو جهاز Mac بذاكرة موحدة 16 جيجابايت. على وحدة المعالجة المركزية (CPU) فقط، يعمل ولكنه بطيء.

هل يمكنني استخدام Gemma 4 12B في Google AI Studio؟ ليس حاليًا. يستضيف AI Studio نموذجي 31B و 26B للدردشة المجانية في المتصفح. تم تصميم 12B للاستخدام المحلي وعلى الجهاز، لذا يمكنك تشغيله بنفسك باستخدام الطرق المذكورة أعلاه.

هل تحتاج واجهة برمجة التطبيقات المحلية إلى مفتاح API؟ لا. يقدم Ollama و llama.cpp النموذج على localhost بدون مفتاح. إذا كانت أداة تتطلب حقل مفتاح، فضع أي سلسلة نائبة؛ سيتجاهلها الخادم المحلي.

هل يمكنني استدعاؤه من كود OpenAI الموجود لدي؟ نعم. يعرض كل من Ollama و llama.cpp نقاط نهاية متوافقة مع OpenAI. وجه عنوان URL الأساسي الخاص بك إلى http://localhost:11434/v1 (Ollama) أو http://localhost:8080/v1 (llama.cpp) واحتفظ بكودك.

كيف أقوم بتشغيل ميزات الصورة والصوت؟ استخدم تطبيقات Transformers أو LM Studio أو AI Edge، التي تدعم إدخال الوسائط المتعددة. أضف محتوى الصورة قبل موجه النص الخاص بك ومحتوى الصوت بعده.

أيهما أسرع، Ollama أم llama.cpp؟ يستخدمان نفس المحرك الأساسي. يتميز llama.cpp بنفقات أقل ومزيد من خيارات الضبط؛ بينما Ollama أسهل في الإعداد. بالنسبة لمعظم الناس، الفارق صغير.

button

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات