วิธีใช้ Veo 3.1 API

Ashley Innocent

Ashley Innocent

16 October 2025

วิธีใช้ Veo 3.1 API

นักพัฒนาหันมาใช้โมเดล AI ขั้นสูงอย่าง Veo 3.1 มากขึ้นเพื่อสร้างเนื้อหาวิดีโอแบบไดนามิก API นี้ซึ่งรวมอยู่ในระบบนิเวศของ Gemini ช่วยให้สามารถสร้างวิดีโอได้อย่างแม่นยำ พร้อมคุณสมบัติเสียงและการเล่าเรื่องที่ได้รับการปรับปรุง ก่อนดำเนินการต่อ ให้พิจารณาเครื่องมือที่ช่วยปรับปรุงการโต้ตอบกับ API

💡
ตัวอย่างเช่น Apidog ทำหน้าที่เป็นแพลตฟอร์มแบบครบวงจรสำหรับการออกแบบ ดีบัก และทดสอบ API เช่น Veo 3.1 คุณสามารถดาวน์โหลด Apidog ได้ฟรีที่ apidog.com เพื่อลดความซับซ้อนของขั้นตอนการทำงานของคุณเมื่อส่งคำขอและวิเคราะห์การตอบกลับจาก Veo 3.1 API
ปุ่ม

Google ได้เปิดตัว Veo 3.1 เพื่อยกระดับความสามารถในการสร้างวิดีโอ โดยเน้นที่การปฏิบัติตามคำสั่งที่ได้รับการปรับปรุงและคุณภาพของภาพและเสียง โมเดลนี้สร้างขึ้นจากเวอร์ชันก่อนหน้าโดยการรวมองค์ประกอบเสียงที่สมบูรณ์ยิ่งขึ้นและการควบคุมฉากที่ดีขึ้น ผลที่ตามมาคือ ผู้ใช้จะได้รับผลลัพธ์ที่สมจริงยิ่งขึ้น เหมาะสำหรับการใช้งานในการสร้างภาพยนตร์ การตลาด และการศึกษา

อันดับแรก ทำความเข้าใจการปรับปรุงหลัก Veo 3.1 นำเสนอการรวมเสียงที่แข็งแกร่งขึ้น รวมถึงบทสนทนาที่เป็นธรรมชาติและเอฟเฟกต์เสียงที่ซิงโครไนซ์ นอกจากนี้ยังรองรับคุณสมบัติต่างๆ เช่น การใช้ภาพอ้างอิงเพื่อความสอดคล้องและการขยายวิดีโอได้อย่างราบรื่น ความก้าวหน้าเหล่านี้ทำให้ API เป็นเครื่องมือที่มีประสิทธิภาพสำหรับผู้ใช้ทางเทคนิคที่ต้องการการควบคุมอย่างละเอียด

การเข้าถึง Veo 3.1 ต้องใช้วิธีการที่เป็นระบบ ส่วนต่อไปนี้จะสรุปขั้นตอนที่จำเป็น ตั้งแต่การตั้งค่าไปจนถึงการใช้งานขั้นสูง เพื่อให้มั่นใจว่าคุณจะสามารถใช้งาน API ได้อย่างมีประสิทธิภาพ

Veo 3.1 API คืออะไร และคุณสมบัติหลักของมัน

Veo 3.1 แสดงถึงการทำซ้ำล่าสุดของ Google ในการสร้างวิดีโอที่ขับเคลื่อนด้วย AI ซึ่งมีให้ใช้งานผ่าน Gemini API วิศวกรที่ Google DeepMind ได้พัฒนาโมเดลนี้เพื่อแก้ไขข้อจำกัดในเวอร์ชันก่อนหน้า เช่น Veo 3 โดยการปรับปรุงการแปลงรูปภาพเป็นวิดีโอและการเพิ่มการรองรับเสียงแบบเนทีฟ ผลที่ได้คือ Veo 3.1 สร้างวิดีโอที่มีความสมจริงที่เหนือกว่า สามารถจับภาพพื้นผิว แสง และการเคลื่อนไหวได้อย่างแม่นยำ

คุณสมบัติหลัก ได้แก่:

ความสามารถเหล่านี้ทำให้ Veo 3.1 เป็น API ที่หลากหลายสำหรับนักพัฒนาที่สร้างแอปพลิเคชันเชิงสร้างสรรค์ ตัวอย่างเช่น ผู้สร้างเนื้อหาใช้มันเพื่อสร้างต้นแบบสตอรี่บอร์ด ในขณะที่องค์กรนำไปใช้ในกระบวนการผลิตวิดีโออัตโนมัติ

นอกจากนี้ Veo 3.1 ยังรวมเข้ากับเครื่องมืออย่าง Apidog ซึ่งช่วยให้ผู้ใช้สามารถจำลองปลายทางและทดสอบคำขอได้โดยไม่ต้องเรียกใช้ API โดยตรง การรวมนี้มีคุณค่าอย่างยิ่งในระหว่างการพัฒนา เนื่องจากช่วยลดข้อผิดพลาดและเร่งการวนซ้ำ

เพื่อแสดงคุณภาพของผลลัพธ์ ให้พิจารณาตัวอย่างเนื้อหาที่สร้างโดย Veo 3.1

ภาพนี้เน้นย้ำถึงความสามารถของโมเดลในการจัดการสถานการณ์ที่หลากหลาย ตั้งแต่ศิลปะนามธรรมไปจนถึงทิวทัศน์ที่สมจริงราวกับภาพถ่าย

เมื่อเปลี่ยนไปสู่ด้านการใช้งานจริง นักพัฒนาจะต้องเตรียมสภาพแวดล้อมก่อนที่จะเรียกใช้ API

ข้อกำหนดเบื้องต้นสำหรับการใช้ Veo 3.1 API

ก่อนที่คุณจะรวม Veo 3.1 ตรวจสอบให้แน่ใจว่าการตั้งค่าของคุณตรงตามข้อกำหนด อันดับแรก ให้เข้าถึง Gemini API เนื่องจาก Veo 3.1 ทำงานภายใต้กรอบนี้ Google ให้บริการนี้ผ่าน Google AI Studio หรือ Vertex AI สำหรับผู้ใช้ระดับองค์กร

ข้อกำหนดเบื้องต้นที่จำเป็น ได้แก่:

บัญชี Google Cloud: สร้างบัญชีหากคุณยังไม่มี สิ่งนี้ช่วยให้สามารถเรียกเก็บเงินและจัดการคีย์ API ได้

คีย์ API: สร้างคีย์ API แบบชำระเงิน เนื่องจาก Veo 3.1 มีให้ใช้งานเฉพาะในระดับแบบชำระเงินเท่านั้น

สภาพแวดล้อมการพัฒนา: ติดตั้ง Python 3.8 หรือสูงกว่า พร้อมกับไลบรารี Google Generative AI ผ่าน pip: pip install google-generativeai

ความคุ้นเคยกับ REST API: Veo 3.1 ใช้คำขอ HTTP ดังนั้นความรู้เกี่ยวกับเพย์โหลด JSON และการตรวจสอบสิทธิ์จึงเป็นประโยชน์

เครื่องมือทดสอบ: ดาวน์โหลด Apidog ฟรีเพื่อจัดการการสร้างคำขอและการตรวจสอบการตอบกลับ อินเทอร์เฟซของ Apidog ช่วยให้คุณสามารถนำเข้าข้อมูลจำเพาะ OpenAPI สำหรับ Veo 3.1 ทำให้การทดลองกับพารามิเตอร์ง่ายขึ้น

เมื่อตั้งค่าเสร็จแล้ว ให้ตรวจสอบสิทธิ์คำขอของคุณ ขั้นตอนนี้จะป้องกันการเข้าถึงโดยไม่ได้รับอนุญาตและติดตามการใช้งานสำหรับการเรียกเก็บเงิน

นอกจากนี้ ตรวจสอบทรัพยากรของระบบของคุณ การสร้างวิดีโอต้องใช้พลังในการประมวลผล แม้ว่า API จะถ่ายโอนการประมวลผลไปยังเซิร์ฟเวอร์ของ Google ก็ตาม อย่างไรก็ตาม ตรวจสอบให้แน่ใจว่าอินเทอร์เน็ตมีความเสถียรสำหรับการอัปโหลดรูปภาพหรือวิดีโอ

เมื่อมีสิ่งเหล่านี้พร้อมแล้ว ให้ดำเนินการตรวจสอบสิทธิ์

การตรวจสอบสิทธิ์และการจัดการคีย์ API สำหรับ Veo 3.1

การตรวจสอบสิทธิ์เป็นหัวใจสำคัญของการใช้งาน API ที่ปลอดภัย Veo 3.1 ต้องการคีย์ API จากแดชบอร์ด Gemini API นักพัฒนาจะสร้างคีย์นี้หลังจากเปิดใช้งานการเรียกเก็บเงิน

ทำตามขั้นตอนเหล่านี้:

ไปที่ ai.google.dev และลงชื่อเข้าใช้

สร้างคีย์ API ใหม่ โดยเลือกแพ็กเกจแบบชำระเงิน

กำหนดค่าคีย์ด้วยข้อจำกัด เช่น การอนุญาต IP เพื่อเพิ่มความปลอดภัย จัดเก็บคีย์อย่างปลอดภัย หลีกเลี่ยงการฮาร์ดโค้ดในสคริปต์

ในโค้ด ให้เริ่มต้นไคลเอนต์ดังนี้:

import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")

การตั้งค่านี้จะตรวจสอบสิทธิ์การเรียกใช้ครั้งต่อไป หากคุณพบข้อผิดพลาด ให้ตรวจสอบความถูกต้องของคีย์และขีดจำกัดโควต้า

นอกจากนี้ ให้ใช้ Apidog เพื่อทดสอบการตรวจสอบสิทธิ์ นำเข้าปลายทาง Veo 3.1 เพิ่มคีย์ API ของคุณเป็นส่วนหัว และส่งคำขอตัวอย่าง คุณสมบัติการดีบักของ Apidog จะเปิดเผยปัญหาต่างๆ เช่น ข้อมูลรับรองที่ไม่ถูกต้องได้อย่างรวดเร็ว

เมื่อได้รับการตรวจสอบสิทธิ์แล้ว ให้สำรวจความสามารถของ API อย่างละเอียด

สำรวจความสามารถของ Veo 3.1 API โดยละเอียด

Veo 3.1 โดดเด่นในการสร้างวิดีโอจากคำสั่ง รูปภาพ หรือคลิปที่มีอยู่ ความสามารถของมันขยายไปไกลกว่าการสร้างพื้นฐานเพื่อรวมฟังก์ชันที่คล้ายกับการแก้ไขขั้นสูง

ตัวอย่างเช่น คุณสมบัติ "Ingredients to Video" ใช้ภาพอ้างอิงเพื่อนำทางผลลัพธ์ ระบุภาพได้สูงสุดสามภาพ และโมเดลจะรักษาความสอดคล้องของตัวละครหรือสไตล์

ในทำนองเดียวกัน "Scene Extension" จะเพิ่มเนื้อหาต่อท้ายเฟรมสุดท้ายของวิดีโอที่มีอยู่ สร้างเรื่องราวที่ยาวขึ้น

"First and Last Frame" สร้างการเปลี่ยนฉากระหว่างสองภาพ พร้อมด้วยเสียง

คุณสมบัติเหล่านี้รองรับความละเอียดสูงสุด 1080p และความยาวเกินหนึ่งนาที ขึ้นอยู่กับการกำหนดค่า

เพื่อแสดงภาพ นี่คืออีกตัวอย่างหนึ่ง:

ผลลัพธ์ดังกล่าวแสดงให้เห็นถึงความสามารถของโมเดลในการจัดการกับคำสั่งที่ซับซ้อน

นอกจากนี้ Veo 3.1 ยังจัดการเสียงแบบเนทีฟ โดยซิงโครไนซ์เสียงกับภาพ สิ่งนี้ช่วยลดความจำเป็นในการผลิตหลังการถ่ายทำในหลายกรณี

เมื่อเปลี่ยนไปสู่การนำไปใช้งาน ให้ตรวจสอบปลายทาง

คำอธิบายปลายทางและพารามิเตอร์ของ Veo 3.1 API

ปลายทางหลักสำหรับ Veo 3.1 คือเมธอด generate_videos ใน Gemini API โดยรับพารามิเตอร์ผ่านคำขอ POST

พารามิเตอร์หลัก:

ตัวอย่างเช่น โครงสร้างคำขอพื้นฐานใน JSON:

{
  "model": "veo-3.1-generate-preview",
  "prompt": "A cowboy riding through a golden field at sunset"
}

Apidog ช่วยอำนวยความสะดวกในการทดสอบพารามิเตอร์โดยอนุญาตให้คุณสร้างและแก้ไขเพย์โหลดด้วยภาพ

นอกจากนี้ คุณสามารถควบคุมความยาวของวิดีโอผ่านคำสั่งหรือการกำหนดค่าได้ แม้ว่าค่าเริ่มต้นจะถูกนำมาใช้ก็ตาม

จัดการการตอบกลับแบบอะซิงโครนัส เนื่องจากการสร้างใช้เวลา ตรวจสอบความสมบูรณ์โดยใช้ ID การดำเนินการ

เมื่อเข้าใจปลายทางแล้ว ให้นำไปใช้ในโค้ด

ตัวอย่างโค้ดสำหรับการใช้งาน Veo 3.1 API พื้นฐาน

นักพัฒนาส่วนใหญ่ใช้ Veo 3.1 ใน Python เริ่มต้นด้วยการสร้างแบบง่ายๆ:

from google.generativeai import types
import google.generativeai as genai

genai.configure(api_key="YOUR_API_KEY")
client = genai.GenerativeModel('veo-3.1-generate-preview')

prompt = "A futuristic cityscape with flying cars and neon lights"
operation = client.generate_content([prompt], generation_config=types.GenerationConfig(candidate_count=1))

# Wait for completion
result = operation.result()
video_url = result.candidates[0].content.parts[0].video.uri
print(video_url)

โค้ดนี้จะสร้างวิดีโอและดึง URL ของวิดีโอนั้น

อย่างไรก็ตาม ให้ปรับใช้สำหรับข้อผิดพลาดโดยการเพิ่มบล็อก try-except

ใช้ Apidog เพื่อจำลองคำขอนี้ใน GUI โดยส่งออกคำสั่ง curl สำหรับการเขียนสคริปต์

ถัดไป ขยายไปยังตัวอย่างขั้นสูง

การใช้งานขั้นสูง: ภาพอ้างอิงกับ Veo 3.1 API

ภาพอ้างอิงช่วยเพิ่มความสอดคล้อง ระบุภาพเหล่านั้นในการกำหนดค่า:

from google.generativeai import types

config = types.GenerationConfig(
    reference_images=[image1, image2]  # Image objects or URLs
)

operation = client.generate_content([prompt], generation_config=config)

สิ่งนี้ช่วยรักษารูปลักษณ์ของตัวละครในฉากต่างๆ

ตัวอย่างเช่น ในแอปพลิเคชันการเล่าเรื่อง ให้อ้างอิงภาพตัวเอกเพื่อให้แน่ใจถึงความสม่ำเสมอ

ทดสอบความหลากหลายใน Apidog โดยการอัปโหลดรูปภาพที่แตกต่างกันและสังเกตผลลัพธ์

นอกจากนี้ ให้รวมกับคำสั่งเพื่อควบคุมสไตล์ เช่น "ในสไตล์ของ Pixar"

การใช้งาน Scene Extension ใน Veo 3.1 API

ขยายวิดีโอเพื่อสร้างเนื้อหาที่ยาวขึ้น:

operation = client.generate_content(
    [prompt],
    video=existing_video  # Video object
)

โมเดลจะดำเนินต่อจากวินาทีสุดท้าย โดยรักษาสไตล์และเสียงไว้

คุณสมบัตินี้เหมาะสำหรับแอปพลิเคชันเช่นเครื่องมือตัดต่อวิดีโอ ซึ่งผู้ใช้สามารถเพิ่มส่วนต่างๆ ได้อย่างต่อเนื่อง

ตรวจสอบขีดจำกัดการขยายเพื่อหลีกเลี่ยงการเกินโควต้า

การสร้างการเปลี่ยนฉากด้วย First and Last Frame ใน Veo 3.1

เชื่อมต่อเฟรมได้อย่างราบรื่น:

config = types.GenerationConfig(
    last_frame=last_image
)

operation = client.generate_content(
    [prompt],
    image=first_image,
    generation_config=config
)

สิ่งนี้สร้างการประมาณค่าระหว่างภาพพร้อมเสียง

กรณีการใช้งานรวมถึงแอนิเมชันหรือบทเรียนที่ต้องการการเปลี่ยนฉากที่ราบรื่น

แสดงภาพผลลัพธ์ที่เป็นไปได้:

การรวมคุณสมบัติเสียงใน Veo 3.1 API

Veo 3.1 สร้างเสียงโดยค่าเริ่มต้น ระบุในคำสั่ง: "รวมบทสนทนาระหว่างตัวละคร"

โมเดลจะซิงโครไนซ์เสียง ซึ่งช่วยเพิ่มความสมจริง

สำหรับเสียงที่กำหนดเอง ให้ประมวลผลผลลัพธ์หลังการสร้าง แต่การรองรับแบบเนทีฟช่วยลดความจำเป็นนี้

ทดสอบคุณภาพเสียงใน Apidog โดยการดาวน์โหลดวิดีโอที่สร้างขึ้น

แนวทางปฏิบัติที่ดีที่สุดสำหรับการเพิ่มประสิทธิภาพการเรียกใช้ Veo 3.1 API

เพิ่มประสิทธิภาพเพื่อลดต้นทุนและปรับปรุงประสิทธิภาพ:

นอกจากนี้ ให้จัดการขีดจำกัดอัตราโดยการใช้ exponential backoff

ปฏิบัติตามหลักจริยธรรม หลีกเลี่ยงเนื้อหาที่เป็นอันตราย

ราคาและการจัดการต้นทุนของ Veo 3.1 API

Veo 3.1 ทำงานในโหมดจ่ายตามการใช้งาน รายละเอียดราคา:

รุ่นโมเดล ราคาต่อวินาที (USD)
Veo 3.1 Standard (พร้อมเสียง) $0.40
Veo 3.1 Fast (พร้อมเสียง) $0.15

ไม่มีระดับฟรี การใช้งานทั้งหมดต้องใช้ระดับแบบชำระเงิน ค่าใช้จ่ายจะถูกสะสมตามความยาวของวิดีโอที่สร้างขึ้น

จัดการค่าใช้จ่ายโดยการประมาณ: วิดีโอ 10 วินาทีบน Fast มีค่าใช้จ่าย $1.50

ติดตามการเรียกเก็บเงินในแดชบอร์ดและตั้งค่าการแจ้งเตือน

การแก้ไขปัญหาทั่วไปเกี่ยวกับ Veo 3.1 API

ข้อผิดพลาดทั่วไปรวมถึงคีย์ไม่ถูกต้องหรือโควต้าเกิน แก้ไขได้โดยการตรวจสอบข้อมูลรับรอง

หากผลลัพธ์ไม่ตรงกับคำสั่ง ให้ปรับปรุงคำอธิบาย

สำหรับปัญหาเครือข่าย ตรวจสอบให้แน่ใจว่าการเชื่อมต่อมีความเสถียร

Apidog ช่วยในการแก้ไขปัญหาโดยการบันทึกคำขอ

บทสรุป: การใช้งาน Veo 3.1 API อย่างเชี่ยวชาญสำหรับแอปพลิเคชันที่เป็นนวัตกรรม

Veo 3.1 API ช่วยให้นักพัฒนาสามารถสร้างวิดีโอที่ซับซ้อนได้อย่างมีประสิทธิภาพ ด้วยการทำตามคู่มือนี้ คุณจะสามารถรวมคุณสมบัติของมันได้อย่างราบรื่น โปรดจำไว้ว่าเครื่องมืออย่าง Apidog ช่วยเพิ่มประสิทธิภาพการทำงาน—ดาวน์โหลดฟรีวันนี้เพื่อยกระดับขั้นตอนการทำงาน Veo 3.1 ของคุณ

ปุ่ม

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API