Apidog

منصة تطوير API تعاونية متكاملة

تصميم API

توثيق API

تصحيح أخطاء API

محاكاة API

اختبار API الآلي

كيفية استخدام Google Veo 3 API على Vertex AI

Nikki Alessandro

Nikki Alessandro

Updated on مايو 21, 2025

لسنوات عديدة، كان إنشاء محتوى فيديو عالي الجودة مسعى معقدًا ويستغرق وقتًا طويلاً وغالبًا ما يكون مكلفًا، ويتطلب مهارات متخصصة في التصوير السينمائي والتحرير وتصميم الصوت والرسوم المتحركة. من المقرر أن يقلل الذكاء الاصطناعي التوليدي، وخاصة في الفيديو، هذه الحواجز بشكل كبير. تخيل إنشاء لقطات B-roll جذابة، أو صياغة رسوم متحركة ديناميكية لوسائل التواصل الاجتماعي، أو حتى إنتاج تسلسلات سينمائية قصيرة، كل ذلك من أوصاف نصية أو صور ثابتة. هذا هو وعد نماذج مثل Veo 3.

كانت جوجل مساهمًا كبيرًا في أبحاث وتطوير الذكاء الاصطناعي، والتزامها بالوسائط التوليدية واضح في التطور المستمر للنماذج المتاحة من خلال Vertex AI. يعمل Vertex AI كمنصة موحدة للتعلم الآلي، توفر الوصول إلى نماذج الذكاء الاصطناعي المتطورة من جوجل، بما في ذلك تلك من DeepMind، وتمكن المستخدمين من بناء تطبيقات التعلم الآلي ونشرها وتوسيع نطاقها بسهولة. إن تقديم Veo 3 و Imagen 4 و Lyria 2 يعزز مكانة Vertex AI كقوة دافعة للذكاء الاصطناعي الإبداعي.

💡
هل تريد أداة رائعة لاختبار واجهات برمجة التطبيقات (API Testing) تولد توثيق API جميل؟

هل تريد منصة متكاملة وشاملة لفريق المطورين لديك للعمل معًا بأقصى قدر من الإنتاجية؟

Apidog يلبي جميع متطلباتك، ويحل محل Postman بسعر أقل بكثير!
button

تقديم Veo 3: القفزة التالية في توليد الفيديو بالذكاء الاصطناعي

المطالبة (Prompt): لقطة متوسطة، إعداد مغامرة تاريخية: يضيء ضوء دافئ من مصباح رسام خرائط في دراسة فوضوية، يتفحص خريطة قديمة ممتدة على طاولة كبيرة. رسام الخرائط: "وفقًا لهذه الخريطة البحرية القديمة، الجزيرة المفقودة ليست أسطورة! يجب أن نعد حملة استكشافية على الفور!"


يمثل Veo 3، الذي طورته Google DeepMind، أحدث تقدم في تكنولوجيا توليد الفيديو من جوجل. يهدف إلى تزويد المستخدمين بالقدرة على توليد مقاطع فيديو عالية الجودة ليست فقط مبهرة بصريًا ولكنها غنية أيضًا بالتفاصيل السمعية. تشمل التحسينات والميزات الرئيسية المعلن عنها لـ Veo 3 ما يلي:

  • جودة فيديو محسنة: تم تصميم Veo 3 لإنتاج مقاطع فيديو بجودة فائقة عند توليدها من كل من المطالبات النصية والصورية. هذا يعني المزيد من الأنسجة الواقعية، وتماسك حركة أفضل، والتزام أكثر دقة بتفاصيل المطالبات المعقدة. النموذج قادر على التعامل مع تفاصيل المطالبات المعقدة، وترجمة الأوصاف النصية الدقيقة إلى روايات بصرية جذابة.
  • توليد الكلام المدمج: خطوة كبيرة إلى الأمام هي قدرة Veo 3 على دمج الكلام، مثل الحوار والتعليقات الصوتية، مباشرة في مقاطع الفيديو المولدة. تفتح هذه الميزة إمكانيات واسعة لسرد القصص، ومحتوى التسويق، والمواد التعليمية، مما يسمح للمبدعين بإضافة طبقة أخرى من العمق السردي دون الحاجة إلى سير عمل إنتاج صوتي منفصل للكلام الأساسي.
  • تكامل صوتي شامل: بالإضافة إلى الكلام، يمكن لـ Veo 3 توليد عناصر صوتية أخرى، بما في ذلك الموسيقى والمؤثرات الصوتية. هذا يعني أن النموذج لا يقتصر على إنشاء أفلام صامتة؛ بل يمكنه إنتاج مقاطع فيديو بمشهد صوتي أكثر اكتمالاً، مما يعزز تجربة المشاهدة ويجعل الصوت متوافقًا مع الحالة المزاجية البصرية والأحداث المصورة.

يتم بالفعل التعرف على التأثير المحتمل لهذه الميزات من قبل المستخدمين الأوائل. تستفيد Klarna، الشركة الرائدة في المدفوعات الرقمية، من Veo (و Imagen) على Vertex AI لزيادة كفاءة إنشاء المحتوى. لقد لاحظوا تخفيضات كبيرة في الجداول الزمنية لإنتاج الأصول التي تتراوح من B-roll إلى YouTube bumpers. علق جاستن توماس، رئيس تجربة النمو الرقمي في Klarna، على التحول قائلاً: "مع Veo و Imagen، حولنا ما كان في السابق عمليات إنتاج تستغرق وقتًا طويلاً إلى مهام سريعة وفعالة تتيح لنا توسيع نطاق إنشاء المحتوى بسرعة... ما كان يستغرق منا ثمانية أسابيع يستغرق الآن ثماني ساعات فقط، مما يؤدي إلى توفير كبير في التكاليف."

كيفية استخدام Google Veo API مع Vertex AI

نماذج Google Veo متاحة على Vertex AI، مما يسمح لك بتوليد مقاطع فيديو من مطالبات نصية أو صورية. يمكنك التفاعل مع Veo من خلال Google Cloud console أو عن طريق إجراء طلبات إلى Vertex AI API. يركز هذا الدليل على استخدام واجهة برمجة التطبيقات (API)، مع أمثلة تستخدم بشكل أساسي Gen AI SDK لـ Python واستدعاءات REST.

المتطلبات الأساسية لاستخدام Veo على Vertex AI

قبل أن تبدأ في توليد مقاطع الفيديو باستخدام Veo، تأكد من إعداد ما يلي:

  • حساب ومشروع Google Cloud:
  • ستحتاج إلى حساب Google Cloud. غالبًا ما تأتي الحسابات الجديدة مع أرصدة مجانية.
  • داخل Google Cloud console، حدد مشروع Google Cloud موجودًا أو أنشئ مشروعًا جديدًا. إذا كنت تجرب، فإن إنشاء مشروع جديد يمكن أن يجعل عملية التنظيف أسهل من خلال السماح لك بحذف المشروع وجميع موارده المرتبطة به بعد ذلك.
  • تمكين Vertex AI API:
  • انتقل إلى صفحة اختيار المشروع في Google Cloud console.
  • تأكد من تمكين Vertex AI API لمشروعك.
  • المصادقة (Authentication):
  • تحتاج إلى إعداد المصادقة لبيئتك.
  • لـ REST API (التطوير المحلي): إذا كنت تخطط لاستخدام عينات REST API محليًا، فسيتم استخدام بيانات الاعتماد التي تقدمها إلى Google Cloud CLI (gcloud CLI). قم بتثبيت gcloud CLI وتهيئته عن طريق تشغيل:
gcloud init

إذا كنت تستخدم موفر هوية خارجيًا (IdP)، فقم بتسجيل الدخول إلى gcloud CLI بهويتك الموحدة أولاً.

  • لـ Python SDK: يستخدم Gen AI SDK عادةً بيانات اعتماد التطبيق الافتراضية (ADC). يساعد تعيين متغير البيئة GOOGLE_CLOUD_PROJECT والتأكد من أن GOOGLE_GENAI_USE_VERTEXAI=True (كما هو موضح في الأمثلة اللاحقة) في تهيئة SDK للعمل مع Vertex AI، مع الاستفادة من بيئة gcloud المصادق عليها أو بيانات اعتماد حساب الخدمة إذا تم تكوينها.

الوصول إلى نماذج ومواقع Veo

  • إصدارات النموذج: يقدم Veo نماذج متعددة لتوليد الفيديو. توفر الوثائق أمثلة باستخدام veo-2.0-generate-001 وتذكر veo-3.0-generate-preview (حالياً في مرحلة المعاينة). ارجع دائمًا إلى الوثائق الرسمية "نماذج Veo" للحصول على أحدث قائمة وقدراتها.
  • المواقع: عند إجراء الطلبات، يمكنك تحديد منطقة (موقع) للتحكم في مكان تخزين بياناتك في حالة السكون. للحصول على قائمة بالمناطق المتاحة، راجع وثائق "مواقع الذكاء الاصطناعي التوليدي على Vertex AI". غالبًا ما تستخدم أمثلة Python SDK متغيرات البيئة لتعيين الموقع.

استخدام Veo API مع Python SDK (Gen AI SDK)

يوفر Gen AI SDK لـ Python طريقة ملائمة للتفاعل مع نماذج Veo على Vertex AI.

التثبيت

قم بتثبيت أو ترقية مكتبة google-genai:

pip install --upgrade google-genai

إعداد متغيرات البيئة

قم بتعيين متغيرات البيئة التالية. استبدل GOOGLE_CLOUD_PROJECT و GOOGLE_CLOUD_LOCATION بمعرف مشروعك وموقع Google Cloud المطلوب (مثل global أو منطقة محددة مثل us-central1).

export GOOGLE_CLOUD_PROJECT=YOUR_PROJECT_ID
export GOOGLE_CLOUD_LOCATION=YOUR_LOCATION
export GOOGLE_GENAI_USE_VERTEXAI=True

تهيئة العميل

from google import genai

client = genai.Client()

توليد فيديو من نص

يمكنك توليد مقاطع فيديو باستخدام مطالبة نصية وصفية. الإخراج هو عملية طويلة الأمد، ويتم حفظ الفيديو المولّد عادةً في Google Cloud Storage (GCS) URI الذي تحدده.

import time
from google import genai
from google.genai.types import GenerateVideosConfig

client = genai.Client()

# !!! IMPORTANT: Update and uncomment the GCS URI for output !!!
# output_gcs_uri = "gs://your-bucket-name/your-output-prefix/"
# Ensure this bucket exists and your project/service account has write permissions.

try:
    operation = client.models.generate_videos(
        model="veo-2.0-generate-001",  # Or other available Veo model
        prompt="a cat reading a book",
        config=GenerateVideosConfig(
            aspect_ratio="16:9",
            output_gcs_uri=output_gcs_uri, # Specify your GCS path
        ),
    )

    print("Video generation operation started. Polling for completion...")
    while not operation.done:
        time.sleep(15) # Wait for 15 seconds before checking status
        operation = client.operations.get(operation) # Refresh operation status
        print(f"Operation status: {operation.metadata.state if operation.metadata else 'Processing...'}")

    if operation.response and operation.result.generated_videos:
        print(f"Video generated successfully: {operation.result.generated_videos[0].video.uri}")
    elif operation.error:
        print(f"Error during video generation: {operation.error.message}")
    else:
        print("Operation finished but no video URI found or an unknown error occurred.")

except AttributeError:
    print("Error: 'output_gcs_uri' is not defined. Please set the 'output_gcs_uri' variable.")
except Exception as e:
    print(f"An unexpected error occurred: {e}")

تذكر استبدال "gs://your-bucket-name/your-output-prefix/" بدلو GCS الفعلي ومسار الإخراج المطلوب.

توليد فيديو من صورة (ونص اختياري)

يمكنك أيضًا توليد مقاطع فيديو بدءًا من صورة إدخال، موجهة اختياريًا بمطالبة نصية.

import time
from google import genai
from google.genai.types import GenerateVideosConfig, Image

client = genai.Client()

# !!! IMPORTANT: Update and uncomment the GCS URI for output !!!
# output_gcs_uri = "gs://your-bucket-name/your-output-prefix-image/"
# Ensure this bucket exists and your project/service account has write permissions.

# Example using a public GCS image. Replace with your image URI.
input_image_gcs_uri = "gs://cloud-samples-data/generative-ai/image/flowers.png"

try:
    operation = client.models.generate_videos(
        model="veo-2.0-generate-001",  # Or other available Veo model
        image=Image(
            gcs_uri=input_image_gcs_uri,
            mime_type="image/png", # Adjust mime_type based on your image
        ),
        prompt="the flowers sway gently in the breeze", # Optional text prompt
        config=GenerateVideosConfig(
            aspect_ratio="16:9", # Or match to your image/desired output
            output_gcs_uri=output_gcs_uri,
        ),
    )

    print("Image-to-video generation operation started. Polling for completion...")
    while not operation.done:
        time.sleep(15)
        operation = client.operations.get(operation)
        print(f"Operation status: {operation.metadata.state if operation.metadata else 'Processing...'}")

    if operation.response and operation.result.generated_videos:
        print(f"Video generated successfully: {operation.result.generated_videos[0].video.uri}")
    elif operation.error:
        print(f"Error during video generation: {operation.error.message}")
    else:
        print("Operation finished but no video URI found or an unknown error occurred.")

except AttributeError:
    print("Error: 'output_gcs_uri' is not defined. Please set the 'output_gcs_uri' variable.")
except Exception as e:
    print(f"An unexpected error occurred: {e}")

استخدام Veo API مع REST

يمكنك استدعاء Veo API مباشرة باستخدام طلبات HTTP. يتضمن ذلك إرسال طلب POST إلى نقطة نهاية محددة.

نقطة النهاية وطريقة HTTP

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID:predictLongRunning

استبدل PROJECT_ID و MODEL_ID (مثل veo-2.0-generate-001 أو veo-3.0-generate-preview).

جسم طلب JSON

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
      // For image input, the structure within "instances" will differ. Consult API reference.
    }
  ],
  "parameters": {
    "storageUri": "OUTPUT_STORAGE_URI", // Optional: GCS URI for output. e.g., "gs://video-bucket/output/"
                                        // If not provided, video bytes might be returned in the operation response for some configurations (check docs).
    "sampleCount": "RESPONSE_COUNT",    // Number of videos to generate (e.g., 1-4).
    "durationSeconds": "DURATION",      // Desired video length in seconds (e.g., 5-8).
    "enhancePrompt": "ENHANCED_PROMPT"  // Boolean: True (default) or False.
    // Add other parameters like "aspectRatio", "fps" as per the API reference.
  }
}

تأكد من استبدال العناصر النائبة مثل TEXT_PROMPT، OUTPUT_STORAGE_URI، إلخ، بالقيم الفعلية.

المصادقة وإرسال الطلب (مثال مع curl)

احفظ جسم طلبك في ملف (على سبيل المثال، request.json).

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT_ID/locations/us-central1/publishers/google/models/YOUR_MODEL_ID:predictLongRunning"

يعيد هذا الأمر اسم عملية (مثل projects/PROJECT_ID/locations/us-central1/publishers/google/models/MODEL_ID/operations/OPERATION_ID).

التعامل مع العمليات طويلة الأمد

تبدأ نقطة النهاية predictLongRunning عملية غير متزامنة. ستحتاج إلى استخدام اسم العملية المعادة لاستقصاء حالتها حتى الانتهاء، بشكل مشابه للطريقة التي يتعامل بها Python SDK معها.

ما هي مطالبات Veo 3 وكيفية كتابة مطالبات أفضل لـ Veo 3

نماذج Google Veo تولد مقاطع فيديو بناءً على أوصافك النصية. المطالبات الأكثر تفصيلاً تؤدي بشكل عام إلى مقاطع فيديو ذات جودة أعلى وأكثر صلة. ضع في اعتبارك وصف:

  • المواضيع والإجراءات.
  • الإعداد والبيئة.
  • الأنماط السينمائية، حركات الكاميرا.
  • الحالة المزاجية والنبرة.

بالنسبة للنماذج التي تدعم الصوت (مثل veo-3.0-generate-preview)، يمكنك تضمين أوصاف للنسخ (الحوار) والمؤثرات الصوتية.

  • معيد صياغة المطالبة (تحسين المطالبة):
    يتضمن Veo أداة تحسين المطالبة المستندة إلى LLM. يمكن لهذه الميزة إعادة صياغة مطالباتك لإضافة المزيد من التفاصيل الوصفية، حركات الكاميرا، النسخ، والمؤثرات الصوتية، بهدف الحصول على إخراج فيديو بجودة أعلى.
  • ممكن افتراضيًا: هذه الميزة ممكنة افتراضيًا لنماذج مثل veo-2.0-generate-001 و veo-3.0-generate-preview.
  • التعطيل: يمكنك إيقاف تشغيل تحسين المطالبة عن طريق تعيين المعلمة enhancePrompt إلى False في استدعاء REST API الخاص بك (أو معلمة مشابهة في SDK إذا كانت متاحة).
  • مهم لـ veo-3.0-generate-preview: لا يمكنك تعطيل معيد صياغة المطالبة عند استخدام نموذج veo-3.0-generate-preview.
  • المطالبة المعاد صياغتها في الاستجابة: إذا كانت المطالبة الأصلية أقل من 30 كلمة، يتم تسليم المطالبة المعاد صياغتها التي يستخدمها النموذج في استجابة API.

حسنًا، إليك القسم الإضافي حول استخدام أداة مثل APIDog لاختبار Veo REST API، يليه استنتاج للمقال.

اختبار Veo REST API باستخدام أداة مثل APIDog

بينما يعد curl ممتازًا للاختبار عبر سطر الأوامر، يمكن لأدوات اختبار واجهات برمجة التطبيقات القائمة على واجهة المستخدم الرسومية (GUI) مثل APIDog أو Postman أو Insomnia توفير طريقة أكثر بصرية وتنظيمًا لإنشاء طلبات API وإدارتها، خاصة عند التعامل مع أجسام JSON المعقدة أو إدارة نقاط نهاية API متعددة.

💡
هل تريد أداة رائعة لاختبار واجهات برمجة التطبيقات (API Testing) تولد توثيق API جميل؟

هل تريد منصة متكاملة وشاملة لفريق المطورين لديك للعمل معًا بأقصى قدر من الإنتاجية؟

Apidog يلبي جميع متطلباتك، ويحل محل Postman بسعر أقل بكثير!
button

الاستنتاج

تمثل نماذج Google Veo على Vertex AI تقدمًا كبيرًا في الذكاء الاصطناعي التوليدي، وخاصة لإنشاء الفيديو. من خلال توفير وصول بديهي لواجهة برمجة التطبيقات (API) عبر كل من Gen AI SDK لـ Python ونقاط نهاية REST المباشرة، تمكّن جوجل المطورين والمبدعين من دمج إمكانيات قوية لتحويل النص إلى فيديو والصورة إلى فيديو في سير عملهم وتطبيقاتهم.