تم إطلاق Gemini 3.1 Flash Lite من جوجل في 3 مارس 2026، وهو الأسرع والأكثر اقتصادية في تشكيلة Gemini. بسعر 0.25 دولار لكل مليون رمز إدخال و1.50 دولار لكل مليون رمز إخراج، تم تصميمه للمطورين الذين يحتاجون إلى الذكاء الاصطناعي على نطاق واسع دون استنزاف الميزانية.
يوضح لك هذا الدليل بالضبط كيفية الوصول، وإعداد مفتاح API الخاص بك، والبدء في إجراء الطلبات. ستحصل على كود يعمل في أقل من 10 دقائق.
ملخص سريع
إعداد سريع:
- اذهب إلى Google AI Studio
- قم بإنشاء مشروع وتوليد مفتاح API
- قم بتثبيت SDK:
pip install google-generativeai - قم بأول طلب لك باستخدام النموذج
gemini-3.1-flash-lite - اختبر في Apidog لتسهيل عملية التصحيح والتعاون الجماعي
التسعير: 0.25 دولار/مليون رمز إدخال، 1.50 دولار/مليون رمز إخراج
السرعة: أسرع بـ 2.5 مرة من Gemini 2.5 Flash
الطبقة المجانية: مليون رمز إدخال مجاني خلال فترة المعاينة
ما هو Gemini 3.1 Flash Lite؟
Gemini 3.1 Flash Lite هو أحدث نموذج ذكاء اصطناعي من جوجل مصمم للتطبيقات عالية الحجم. إنه أسرع بـ 2.5 مرة من Gemini 2.5 Flash مع سرعة إخراج أسرع بنسبة 45%، بينما يحقق 86.9% في اختبار GPQA Diamond و76.8% في اختبارات MMMU Pro.

يتضمن النموذج مستويات تفكير يمكنك تعديلها لكل طلب. قللها للمهام البسيطة، وزدها للمنطق المعقد. تتيح لك هذه المرونة تحسين التكاليف أثناء التعامل مع أعباء العمل المتنوعة.
يتوفر من خلال Google AI Studio للمطورين الأفراد وVertex AI للشركات.
المتطلبات الأساسية
قبل أن تبدأ، تأكد من أن لديك:
- حساب جوجل
- Python 3.7+ أو Node.js 14+ مثبتين
- فهم أساسي لواجهات برمجة تطبيقات REST
- (اختياري) Apidog مثبت لاختبار واجهات برمجة التطبيقات
الخطوة 1: إنشاء حساب Google AI Studio
Google AI Studio هو أسرع طريقة للوصول إلى نماذج Gemini للتطوير.
- اذهب إلى aistudio.google.com
- سجل الدخول باستخدام حسابك في Google
- اقبل شروط الخدمة
- ستصل إلى لوحة تحكم AI Studio
تعرض الواجهة النماذج المتاحة، واستخدامك لواجهة برمجة التطبيقات، وقوالب البدء السريع. يظهر Flash Lite في القائمة المنسدلة للنماذج باسم gemini-3.1-flash-lite.

الخطوة 2: توليد مفتاح API الخاص بك
تسمح لك مفاتيح API بالمصادقة على الطلبات إلى Gemini API.
- انقر على Get API Key في الزاوية العلوية اليمنى
- اختر Create API key in new project (أو اختر مشروعًا موجودًا)
- يقوم جوجل بإنشاء مشروع سحابي جديد وتوليد مفتاحك
- انسخ مفتاح API - يبدو كـ
AIzaSyXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX - احفظه بأمان - لن تراه مرة أخرى

نصيحة أمنية: لا تلتزم أبدًا بمفاتيح API للتحكم في الإصدار. استخدم متغيرات البيئة أو أدوات إدارة الأسرار.
الخطوة 3: تثبيت SDK
توفر جوجل حزم SDKs رسمية لـ Python و Node.js.
Python
pip install google-generativeai
Node.js
npm install @google/generative-ai
يتعامل SDK مع المصادقة، وتنسيق الطلبات، وتحليل الاستجابات. يمكنك أيضًا استخدام REST API مباشرة إذا كنت تفضل ذلك.
الخطوة 4: إجراء طلبك الأول
لنرسل طلبًا بسيطًا إلى Flash Lite.
مثال Python
import google.generativeai as genai
import os
# Configure API key
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
# Initialize the model
model = genai.GenerativeModel('gemini-3.1-flash-lite')
# Generate content
response = model.generate_content('Explain REST APIs in one sentence.')
print(response.text)
مثال Node.js
const { GoogleGenerativeAI } = require("@google/generative-ai");
// Initialize with API key
const genAI = new GoogleGenerativeAI(process.env.GOOGLE_API_KEY);
async function run() {
// Get the model
const model = genAI.getGenerativeModel({ model: "gemini-3.1-flash-lite" });
// Generate content
const result = await model.generateContent("Explain REST APIs in one sentence.");
const response = await result.response;
const text = response.text();
console.log(text);
}
run();
مثال cURL (REST API)
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-lite:generateContent?key=YOUR_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"contents": [{
"parts": [{
"text": "Explain REST APIs in one sentence."
}]
}]
}'
قم بتشغيل أي من هذه الأمثلة وستحصل على استجابة في ثوانٍ. يعيد النموذج نصًا واضحًا وموجزًا يجيب على طلبك.
الخطوة 5: الاختبار باستخدام Apidog
يجعل Apidog اختبار واجهة برمجة التطبيقات أسهل بواجهة مرئية، وتعاون جماعي، وتوثيق تلقائي.

لماذا تستخدم Apidog لـ Gemini API؟
- منشئ طلبات مرئي - لا حاجة لكتابة أوامر cURL
- متغيرات البيئة - التبديل بين مفاتيح API للتطوير/الإنتاج بسهولة
- التحقق من الاستجابة - اكتشاف الأخطاء قبل وصولها إلى الإنتاج
- المشاركة الجماعية - مشاركة مجموعات API مع فريقك
- التوثيق التلقائي - توليد وثائق من طلباتك
سترى الاستجابة في اللوحة اليمنى مع تمييز بناء الجملة، ووقت الاستجابة، ورمز الحالة.
الحفظ كمتغير بيئة
- اذهب إلى Environments في Apidog
- أنشئ بيئة جديدة (مثال: "Gemini Dev")
- أضف المتغير:
GOOGLE_API_KEY= مفتاح API الفعلي الخاص بك - استخدم
{{GOOGLE_API_KEY}}في طلباتك
الآن يمكنك التبديل بين البيئات دون تغيير طلباتك. مثالي لإدارة مفاتيح التطوير، والتدريج، والإنتاج.
فهم تنسيق الطلب
يستخدم Gemini API بنية JSON محددة.
بنية الطلب الأساسية
{
"contents": [{
"parts": [{
"text": "Your prompt here"
}]
}]
}
مع مستويات التفكير
{
"contents": [{
"parts": [{
"text": "Generate API documentation for a user authentication endpoint"
}]
}],
"generationConfig": {
"thinkingLevel": "high"
}
}
مستويات التفكير: low (منخفض)، medium (متوسط)، high (مرتفع)
- منخفض: استجابات سريعة وبسيطة
- متوسط: منطق متوازن
- مرتفع: تحليل عميق، مهام معقدة
مع تعليمات النظام
{
"systemInstruction": {
"parts": [{
"text": "You are an API documentation expert. Write clear, concise docs."
}]
},
"contents": [{
"parts": [{
"text": "Document this endpoint: POST /api/users"
}]
}]
}
توجه تعليمات النظام سلوك النموذج عبر جميع الطلبات في المحادثة.
تنسيق الاستجابة
يعيد API JSON بالبنية التالية:
{
"candidates": [{
"content": {
"parts": [{
"text": "REST APIs are interfaces that let applications communicate over HTTP using standard methods like GET, POST, PUT, and DELETE."
}],
"role": "model"
},
"finishReason": "STOP",
"index": 0,
"safetyRatings": [...]
}],
"usageMetadata": {
"promptTokenCount": 8,
"candidatesTokenCount": 25,
"totalTokenCount": 33
}
}
الحقول الرئيسية:
candidates[0].content.parts[0].text- الاستجابة المولدةusageMetadata- عدد الرموز للفواتيرfinishReason- سبب توقف التوليد (STOP, MAX_TOKENS, SAFETY)
حالات الاستخدام الشائعة
1. توليد وثائق API
import google.generativeai as genai
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')
endpoint_spec = """
POST /api/v1/users
Creates a new user account
Body: { "email": string, "password": string, "name": string }
"""
response = model.generate_content(
f"Generate comprehensive API documentation for this endpoint:\n{endpoint_spec}",
generation_config={"thinkingLevel": "medium"}
)
print(response.text)
2. التحقق من الطلب
def validate_api_request(request_body):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Validate this API request body and list any issues:
{request_body}
Check for:
- Missing required fields
- Invalid data types
- Security concerns
"""
response = model.generate_content(prompt)
return response.text
# Example usage
request = '{"email": "test@example.com", "password": "123"}'
validation_result = validate_api_request(request)
print(validation_result)
3. توليد رسائل الخطأ
def generate_user_friendly_error(error_code, technical_message):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Convert this technical error into a user-friendly message:
Error Code: {error_code}
Technical: {technical_message}
Make it clear, actionable, and non-technical.
"""
response = model.generate_content(
prompt,
generation_config={"thinkingLevel": "low"}
)
return response.text
# Example
friendly_error = generate_user_friendly_error(
"AUTH_TOKEN_EXPIRED",
"JWT token validation failed: exp claim is in the past"
)
print(friendly_error)
حدود المعدل والحصص
يمتلك Flash Lite حدودًا سخية خلال فترة المعاينة:
الطبقة المجانية:
- مليون رمز إدخال مجاني
- 15 طلبًا في الدقيقة
- 1,500 طلب في اليوم
الطبقة المدفوعة:
- 0.25 دولار لكل مليون رمز إدخال
- 1.50 دولار لكل مليون رمز إخراج
- 60 طلبًا في الدقيقة
- لا يوجد حد يومي
راقب استخدامك في Google AI Studio تحت Usage & Billing.
معالجة الأخطاء
تعامل مع الأخطاء الشائعة بأناقة:
import google.generativeai as genai
from google.api_core import exceptions
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')
def safe_generate(prompt):
try:
response = model.generate_content(prompt)
return response.text
except exceptions.ResourceExhausted:
return "تم تجاوز حد المعدل. حاول مرة أخرى في دقيقة."
except exceptions.InvalidArgument as e:
return f"طلب غير صالح: {str(e)}"
except exceptions.PermissionDenied:
return "مفتاح API غير صالح أو منتهي الصلاحية."
except Exception as e:
return f"خطأ غير متوقع: {str(e)}"
result = safe_generate("Explain APIs")
print(result)
أخطاء شائعة:
400 Bad Request- JSON غير صالح أو حقول مطلوبة مفقودة401 Unauthorized- مفتاح API غير صالح429 Too Many Requests- تم تجاوز حد المعدل500 Internal Server Error- واجهت خوادم جوجل مشكلة
استكشاف الأخطاء وإصلاحها
"مفتاح API غير صالح"
تحقق من الآتي:
- تم نسخ مفتاح API بشكل صحيح (لا توجد مسافات إضافية)
- مفتاح API ممكّن في Google Cloud Console
- تم تمكين الفوترة في مشروعك
- استخدام اسم متغير البيئة الصحيح
"النموذج غير موجود"
تأكد من استخدام اسم النموذج الدقيق:
# Correct
model = genai.GenerativeModel('gemini-3.1-flash-lite')
# Wrong
model = genai.GenerativeModel('gemini-flash-lite')
model = genai.GenerativeModel('gemini-3.1-flash')
"تم تجاوز حد المعدل"
لقد تجاوزت حد الطلبات في الدقيقة. الحلول:
- أضف منطق إعادة المحاولة بالأسلوب الأسي
- اجمع عدة طلبات في طلب واحد
- الترقية إلى الطبقة المدفوعة للحصول على حدود أعلى
- تنفيذ قائمة انتظار للطلبات
استجابات بطيئة
Flash Lite سريع، ولكن إذا كنت ترى تأخيرات:
- تحقق من اتصال الشبكة الخاص بك
- استخدم مستويات تفكير أقل للمهام البسيطة
- قلل طول الطلب
- فكر في بث الاستجابات للمخرجات الطويلة
متقدم: بث الاستجابات
للمخرجات الطويلة، قم ببث الرموز فور توليدها:
import google.generativeai as genai
genai.configure(api_key=os.environ.get('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = "Write a detailed explanation of REST API authentication methods"
response = model.generate_content(prompt, stream=True)
for chunk in response:
print(chunk.text, end='', flush=True)
يعمل البث على تحسين الأداء المتصور. يرى المستخدمون المخرجات على الفور بدلاً من الانتظار للحصول على الاستجابة الكاملة.
نصائح لتحسين التكلفة
1. تجميع الطلبات المتشابهة
# مكلف: 3 طلبات منفصلة
response1 = model.generate_content("Explain GET")
response2 = model.generate_content("Explain POST")
response3 = model.generate_content("Explain PUT")
# أرخص: طلب واحد مدمج
combined_prompt = """
Explain these HTTP methods:
1. GET
2. POST
3. PUT
"""
response = model.generate_content(combined_prompt)
2. استخدام مستويات تفكير أقل
# للتصنيف البسيط
response = model.generate_content(
"Is this email spam? 'Buy now!'",
generation_config={"thinkingLevel": "low"}
)
# للتحليل المعقد
response = model.generate_content(
"Analyze this API design and suggest improvements...",
generation_config={"thinkingLevel": "high"}
)
3. تنفيذ التخزين المؤقت (Caching)
تخزين الاستجابات مؤقتًا للاستعلامات المتكررة. يمكن أن يؤدي التخزين المؤقت البسيط في الذاكرة إلى خفض التكاليف بنسبة تزيد عن 50% للطلبات الشائعة.
4. تقليم الطلبات
إزالة السياق غير الضروري:
# مطول (رموز أكثر)
prompt = "I would like you to please explain to me what REST APIs are and how they work in detail"
# موجز (رموز أقل)
prompt = "Explain REST APIs"
اعتبارات الأمان
1. حماية مفتاح API الخاص بك
- تخزينه في متغيرات البيئة أو مديري الأسرار
- تدوير المفاتيح بانتظام
- استخدام مفاتيح منفصلة للتطوير/التدريج/الإنتاج
- عدم تسجيل مفاتيح API أبدًا
2. التحقق من صحة مدخلات المستخدم
def safe_prompt(user_input):
# Remove potential injection attempts
cleaned = user_input.replace("Ignore previous instructions", "")
cleaned = cleaned[:1000] # Limit length
return f"User question: {cleaned}"
3. تصفية البيانات الحساسة
لا ترسل معلومات حساسة إلى API:
import re
def sanitize_for_ai(text):
# Remove email addresses
text = re.sub(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', '[EMAIL]', text)
# Remove phone numbers
text = re.sub(r'\b\d{3}[-.]?\d{3}[-.]?\d{4}\b', '[PHONE]', text)
# Remove credit cards
text = re.sub(r'\b\d{4}[-\s]?\d{4}[-\s]?\d{4}[-\s]?\d{4}\b', '[CARD]', text)
return text
4. تنفيذ تحديد المعدل
حماية مفتاح API الخاص بك من سوء الاستخدام:
from collections import defaultdict
import time
class RateLimiter:
def __init__(self, max_requests=10, window=60):
self.max_requests = max_requests
self.window = window
self.requests = defaultdict(list)
def allow_request(self, user_id):
now = time.time()
# Remove old requests
self.requests[user_id] = [
req_time for req_time in self.requests[user_id]
if now - req_time < self.window
]
if len(self.requests[user_id]) < self.max_requests:
self.requests[user_id].append(now)
return True
return False
limiter = RateLimiter(max_requests=10, window=60)
def generate_with_limit(user_id, prompt):
if not limiter.allow_request(user_id):
return "تم تجاوز حد المعدل. حاول مرة أخرى لاحقًا."
model = genai.GenerativeModel('gemini-3.1-flash-lite')
response = model.generate_content(prompt)
return response.text
مقارنة Flash Lite بنماذج Gemini الأخرى
| الميزة | Flash Lite | Flash | Pro |
|---|---|---|---|
| سعر الإدخال | 0.25 دولار/مليون | 0.50 دولار/مليون | 1.25 دولار/مليون |
| سعر الإخراج | 1.50 دولار/مليون | 3.00 دولار/مليون | 7.50 دولار/مليون |
| السرعة | أسرع بـ 2.5 مرة | سريع | قياسي |
| نافذة السياق | 32 ألف رمز | مليون رمز | 2 مليون رمز |
| الأفضل لـ | حجم كبير، حساس للتكلفة | متوازن | منطق معقد |
اختر Flash Lite عندما:
- تحتاج إلى استجابات سريعة
- التكلفة مهمة
- الطلبات أقل من 32 ألف رمز
- متطلبات الجودة معتدلة
اختر Flash عندما:
- تحتاج إلى نوافذ سياق كبيرة
- الجودة أهم من التكلفة
اختر Pro عندما:
- تحتاج إلى أقصى قدرة على الاستدلال
- التكلفة ليست مصدر قلق
- العمل مع مستندات كبيرة جدًا
التكامل مع Apidog Workflows
يمكن لمستخدمي Apidog دمج Flash Lite في سير عمل تطوير واجهة برمجة التطبيقات الخاصة بهم:
1. توليد حالات الاختبار تلقائيًا
استخدم Flash Lite لتوليد حالات الاختبار من مواصفات واجهة برمجة التطبيقات الخاصة بك:
def generate_test_cases(endpoint_spec):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Generate comprehensive test cases for this API endpoint:
{json.dumps(endpoint_spec, indent=2)}
Include:
- Happy path tests
- Edge cases
- Error scenarios
- Boundary conditions
Format as JSON array of test cases.
"""
response = model.generate_content(prompt)
return json.loads(response.text)
2. التحقق من استجابات API
تحقق مما إذا كانت الاستجابات تتطابق مع المخططات المتوقعة:
def validate_response(response_data, expected_schema):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Validate this API response against the schema:
Response: {json.dumps(response_data, indent=2)}
Schema: {json.dumps(expected_schema, indent=2)}
List any mismatches or issues.
"""
response = model.generate_content(
prompt,
generation_config={"thinkingLevel": "low"}
)
return response.text
3. توليد بيانات وهمية
أنشئ بيانات اختبار واقعية:
def generate_mock_data(schema, count=10):
model = genai.GenerativeModel('gemini-3.1-flash-lite')
prompt = f"""
Generate {count} realistic mock data entries matching this schema:
{json.dumps(schema, indent=2)}
Return as JSON array.
"""
response = model.generate_content(prompt)
return json.loads(response.text)
الأسئلة الشائعة
هل Gemini 3.1 Flash Lite مجاني؟
أول مليون رمز إدخال مجاني خلال فترة المعاينة. بعد ذلك، تدفع 0.25 دولار لكل مليون رمز إدخال و1.50 دولار لكل مليون رمز إخراج.
ما مدى سرعة Flash Lite مقارنة بالنماذج الأخرى؟
Flash Lite أسرع بـ 2.5 مرة من Gemini 2.5 Flash من حيث وقت الرمز الأول وأسرع بنسبة 45% من حيث سرعة الإخراج. إنه أحد أسرع النماذج المتاحة.
هل يمكنني استخدام Flash Lite في الإنتاج؟
نعم. على الرغم من تسميته "معاينة"، فإن النموذج مستقر بما يكفي للاستخدام في الإنتاج. المستخدمون الأوائل مثل Latitude و Cartwheel و Whering يستخدمونه بالفعل على نطاق واسع.
ما هو حجم نافذة السياق؟
يدعم Flash Lite ما يصل إلى 32,000 رمز سياق. وهذا يكفي لمعظم حالات استخدام واجهة برمجة التطبيقات ولكنه أصغر من Flash (مليون رمز) أو Pro (2 مليون رمز).
كيف تعمل مستويات التفكير؟
تتحكم مستويات التفكير في مقدار المعالجة الذي يطبقه النموذج. المنخفض سريع وبسيط. المرتفع أبطأ ولكنه أكثر شمولاً. استخدم المنخفض للتصنيف، والمرتفع للمنطق المعقد.
هل يمكنني استخدام Flash Lite مع Apidog؟
نعم. يعمل Apidog مع أي واجهة برمجة تطبيقات REST، بما في ذلك Gemini. قم بإعداد طلباتك في Apidog لتسهيل الاختبار، والتعاون الجماعي، والتوثيق.
ماذا يحدث إذا تجاوزت حدود المعدل؟
ستتلقى خطأ 429. قم بتنفيذ منطق إعادة المحاولة بالأسلوب الأسي أو قم بالترقية إلى الطبقة المدفوعة للحصول على حدود أعلى (60 طلبًا/دقيقة مقابل 15).
هل يتم استخدام بياناتي لتدريب النموذج؟
وفقًا لسياسة جوجل، لا تُستخدم طلبات API لتدريب النماذج. تظل بياناتك خاصة.
هل يمكنني ضبط Flash Lite بدقة؟
ليس بعد. الضبط الدقيق متاح لبعض نماذج Gemini ولكن ليس لـ Flash Lite عند الإطلاق. استخدم تعليمات النظام لتوجيه السلوك بدلاً من ذلك.
كيف يقارن Flash Lite بـ GPT-4 Turbo؟
Flash Lite أسرع وأرخص ولكن GPT-4 Turbo لديه استدلال أقوى للمهام المعقدة. لأعباء عمل واجهة برمجة التطبيقات عالية الحجم، يتفوق Flash Lite في التكلفة والسرعة.
الخطوات التالية
لديك الآن كل ما تحتاجه للبدء في استخدام Gemini 3.1 Flash Lite:
- احصل على مفتاح API الخاص بك من Google AI Studio
- قم بتثبيت SDK وقم بتشغيل طلبك الأول
- اختبر في Apidog لتطوير أسهل
- نفذ معالجة الأخطاء ومنطق إعادة المحاولة
- راقب الاستخدام لتحسين التكاليف
النموذج جاهز للإنتاج. التسعير يجعل الذكاء الاصطناعي متاحًا على نطاق واسع. السرعة تحافظ على رضا المستخدمين.
ابدأ في البناء.
