Hướng Dẫn Từng Bước Sử Dụng API Grok Chuyển Ảnh Thành Video

Ashley Innocent

Ashley Innocent

3 tháng 4 2026

Hướng Dẫn Từng Bước Sử Dụng API Grok Chuyển Ảnh Thành Video

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

Tóm tắt

API chuyển đổi hình ảnh thành video của Grok sử dụng mô hình grok-imagine-video để biến một hình ảnh tĩnh thành một đoạn video động. Bạn gửi (POST) URL hình ảnh của mình, một lời nhắc (prompt) và các cài đặt tùy chọn đến https://api.x.ai/v1/videos/generations. API sẽ trả về một request_id ngay lập tức. Sau đó, bạn thực hiện truy vấn (poll) GET /v1/videos/{request_id} cho đến khi status trở thành "done". Thời lượng video dao động từ 1 đến 15 giây. Giá bắt đầu từ 0.05 đô la mỗi giây cho đầu ra 480p.

Giới thiệu

Vào ngày 28 tháng 1 năm 2026, xAI đã ra mắt mô hình grok-imagine-video để truy cập API công khai. Trong tháng đầu tiên đó, mô hình đã tạo ra 1.2 tỷ video và xếp hạng số một trên bảng xếp hạng chuyển đổi văn bản thành video của Artificial Analysis. Chuyển đổi hình ảnh thành video là một trong những khả năng hàng đầu của nó: bạn cung cấp cho API một bức ảnh và một lời nhắc mô tả, và nó sẽ tạo hoạt ảnh cho bức ảnh thành một đoạn video ngắn sẵn sàng để tải xuống dưới dạng MP4.

Luồng bất đồng bộ (async flow) đó, nơi bạn gửi một tác vụ và sau đó truy vấn (poll) để hoàn thành, tạo ra một thách thức kiểm thử mà nhiều nhà phát triển thường bỏ qua. Việc tích hợp của bạn chưa hoàn tất khi yêu cầu POST đầu tiên trả về 200. Nó hoàn tất khi bạn đã xác nhận vòng lặp truy vấn (polling loop) xử lý các trạng thái "processing", "done""failed" một cách chính xác trong điều kiện mạng thực tế.

Các Kịch bản kiểm thử (Test Scenarios) của Apidog giải quyết vấn đề này trực tiếp. Bạn có thể xây dựng một chuỗi tuần tự: gửi (post) đến /v1/videos/generations, trích xuất request_id, lặp lại yêu cầu truy vấn (poll request) cho đến khi status == "done", sau đó xác nhận (assert) rằng URL video có mặt. Tải xuống Apidog miễn phí để làm theo hướng dẫn kiểm thử chi tiết sau trong tài liệu này.

button

API Grok chuyển đổi hình ảnh thành video là gì?

API Grok chuyển đổi hình ảnh thành video là một phần của sản phẩm tạo video của xAI. Nó hoạt động dưới mô hình grok-imagine-video và chấp nhận một hình ảnh làm khung bắt đầu của video đầu ra. Mô hình nghiên cứu nội dung hình ảnh và lời nhắc văn bản, sau đó tạo ra chuyển động tự nhiên để làm cho cảnh quay động.

Điểm cuối API là:

POST https://api.x.ai/v1/videos/generations

Xác thực sử dụng mã thông báo Bearer tiêu chuẩn:

Authorization: Bearer YOUR_XAI_API_KEY

Bạn lấy khóa của mình từ bảng điều khiển xAI. Giao diện API tương tự cũng hỗ trợ chuyển văn bản thành video (bỏ qua tham số image), mở rộng video và chỉnh sửa video.

Quá trình chuyển đổi hình ảnh thành video hoạt động như thế nào

Tham số image trong phần thân yêu cầu chỉ định **khung hình đầu tiên** của video đầu ra. Mô hình không thay thế hình ảnh. Nó bắt đầu từ hình ảnh đó. Mỗi pixel trong khung hình đầu tiên đều đến từ hình ảnh nguồn của bạn. Sau đó, mô hình dự đoán cảnh đó sẽ chuyển động như thế nào theo thời gian dựa trên lời nhắc của bạn.

Ví dụ: bạn cung cấp một bức ảnh hồ núi vào lúc bình minh. Lời nhắc của bạn ghi "những gợn sóng nhẹ nhàng lan tỏa trên mặt nước khi sương mù buổi sáng trôi qua." Khung hình đầu tiên của video đầu ra là bức ảnh của bạn. Các khung hình tiếp theo hiển thị nước và sương mù chuyển động theo lời nhắc.

Điều này khác với chuyển văn bản thành video, nơi mô hình tự tạo khung hình đầu tiên. Chuyển hình ảnh thành video cho phép bạn kiểm soát chính xác cảnh bắt đầu.

Bạn nên chọn chuyển hình ảnh thành video khi: - Bạn có sẵn ảnh sản phẩm, phong cảnh hoặc chân dung mà bạn muốn thêm chuyển động. - Tài sản thương hiệu của bạn cần có nhận diện hình ảnh nhất quán trong khung hình đầu tiên. - Bạn muốn chuyển động có cảm giác dựa trên một cảnh thực tế hoặc cụ thể.

Bạn nên chọn chuyển văn bản thành video khi: - Bạn đang khám phá các ý tưởng hình ảnh mà không có hình ảnh tham chiếu. - Bạn muốn mô hình tự quyết định toàn bộ bố cục cảnh. - Tốc độ lặp lại quan trọng hơn độ chính xác của khung hình đầu tiên.

Điều kiện tiên quyết

Trước khi thực hiện cuộc gọi đầu tiên, bạn cần:

  1. **Một tài khoản xAI** tại console.x.ai.
  2. **Một khóa API** từ bảng điều khiển xAI. Hãy giữ khóa này trong biến môi trường, không mã hóa cứng (hardcoded).
  3. **Python 3.8+** hoặc **Node.js 18+** (các ví dụ trong hướng dẫn này sử dụng cả hai).
  4. **Một URL hình ảnh có thể truy cập công khai**, hoặc một hình ảnh được mã hóa base64 dưới dạng data URI.
Bảng điều khiển xAI để lấy khóa API.

Đặt khóa của bạn làm biến môi trường:

export XAI_API_KEY="your_key_here"

Cài đặt xAI Python SDK nếu bạn muốn sử dụng client cấp cao hơn:

pip install xai-sdk

Đối với các lệnh gọi HTTP thô, không cần thêm gói nào ngoài requests (Python) hoặc fetch (Node.js).

Thực hiện yêu cầu chuyển hình ảnh thành video đầu tiên của bạn

Sử dụng curl

curl -X POST https://api.x.ai/v1/videos/generations \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "prompt": "Gentle waves move across the surface, morning mist rises slowly",
    "image": {
      "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/1/1a/24701-nature-natural-beauty.jpg/1280px-24701-nature-natural-beauty.jpg"
    },
    "duration": 6,
    "resolution": "720p",
    "aspect_ratio": "16:9"
  }'

Phản hồi trả về ngay lập tức với một request_id:

{
  "request_id": "d97415a1-5796-b7ec-379f-4e6819e08fdf"
}

Video chưa sẵn sàng. Việc tạo video diễn ra bất đồng bộ trong hạ tầng của xAI. Bạn cần truy vấn (poll) để lấy kết quả.

Sử dụng Python (yêu cầu thô)

import os
import requests

api_key = os.environ["XAI_API_KEY"]

payload = {
    "model": "grok-imagine-video",
    "prompt": "Gentle waves move across the surface, morning mist rises slowly",
    "image": {
        "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/1/1a/24701-nature-natural-beauty.jpg/1280px-24701-nature-natural-beauty.jpg"
    },
    "duration": 6,
    "resolution": "720p",
    "aspect_ratio": "16:9"
}

headers = {
    "Authorization": f"Bearer {api_key}",
    "Content-Type": "application/json"
}

response = requests.post(
    "https://api.x.ai/v1/videos/generations",
    json=payload,
    headers=headers
)

data = response.json()
request_id = data["request_id"]
print(f"Job started: {request_id}")

Sử dụng hình ảnh base64

Nếu hình ảnh của bạn là cục bộ hoặc không thể truy cập công khai, hãy mã hóa nó thành một data URI:

import base64

with open("my_image.jpg", "rb") as f:
    encoded = base64.b64encode(f.read()).decode("utf-8")

payload["image"] = {
    "url": f"data:image/jpeg;base64,{encoded}"
}

Truy vấn kết quả

Việc tạo video là bất đồng bộ. API trả về request_id trong khi video của bạn đang được render trên máy chủ của xAI. Bạn phải truy vấn điểm cuối trạng thái:

GET https://api.x.ai/v1/videos/{request_id}

Trường trạng thái sẽ chuyển qua các giá trị sau:

Trạng thái Ý nghĩa
"processing" Video vẫn đang được render
"done" Video đã sẵn sàng, URL nằm trong phản hồi
"failed" Đã xảy ra lỗi

Một phản hồi hoàn chỉnh trông như sau:

{
  "status": "done",
  "video": {
    "url": "https://vidgen.x.ai/....mp4",
    "duration": 6
  },
  "progress": 100
}

Vòng lặp truy vấn Python hoàn chỉnh

import time

def poll_video(request_id: str, api_key: str, interval: int = 5) -> dict:
    url = f"https://api.x.ai/v1/videos/{request_id}"
    headers = {"Authorization": f"Bearer {api_key}"}

    while True:
        response = requests.get(url, headers=headers)
        data = response.json()
        status = data.get("status")

        print(f"Status: {status} | Progress: {data.get('progress', 0)}%")

        if status == "done":
            return data["video"]
        elif status == "failed":
            raise RuntimeError(f"Video generation failed for {request_id}")

        time.sleep(interval)

# Usage
video = poll_video(request_id, api_key)
print(f"Video URL: {video['url']}")
print(f"Duration: {video['duration']}s")

Giữ khoảng thời gian truy vấn (polling interval) ở mức 5 giây trở lên. API có giới hạn tốc độ là 60 yêu cầu mỗi phút (1 yêu cầu mỗi giây). Việc truy vấn liên tục trên nhiều tác vụ cùng lúc có thể nhanh chóng làm cạn kiệt ngân sách đó.

Sử dụng xAI Python SDK

Thư viện xai-sdk đóng gói mẫu bất đồng bộ (async pattern) cho bạn. client.video.generate() gửi tác vụ và chặn cho đến khi video sẵn sàng, xử lý tất cả các truy vấn (polling) nội bộ:

from xai_sdk import Client
import os

client = Client(api_key=os.environ["XAI_API_KEY"])

video = client.video.generate(
    model="grok-imagine-video",
    prompt="Gentle waves move across the surface, morning mist rises slowly",
    image={"url": "https://example.com/landscape.jpg"},
    duration=6,
    resolution="720p",
    aspect_ratio="16:9"
)

print(f"Video URL: {video.url}")
print(f"Duration: {video.duration}s")

SDK xử lý vòng lặp truy vấn, kiểm tra trạng thái và truyền lỗi. Sử dụng phương pháp này khi bạn muốn có mã ứng dụng sạch mà không cần tự quản lý việc truy vấn HTTP.

Để kiểm soát chi tiết hơn về khoảng thời gian truy vấn, các chiến lược thử lại hoặc ghi nhật ký, phương pháp yêu cầu thô mang lại cho bạn sự linh hoạt hơn.

Kiểm soát độ phân giải, thời lượng và tỷ lệ khung hình

API video của Grok cho phép bạn kiểm soát trực tiếp định dạng đầu ra.

Thời lượng

Tham số duration chấp nhận các số nguyên từ 1 đến 15 giây. Mặc định là 6.

"duration": 10

Video dài hơn tốn kém hơn. Một clip 10 giây có giá cao gấp khoảng 10 lần một clip 1 giây ở cùng độ phân giải.

Độ phân giải

Có hai tùy chọn:

Giá trị Mô tả
"480p" Mặc định. Chi phí thấp hơn, tạo nhanh hơn.
"720p" Chất lượng cao hơn. Chi phí 0.07 đô la/giây so với 0.05 đô la/giây.
"resolution": "720p"

Tỷ lệ khung hình

Tham số aspect_ratio kiểm soát kích thước khung hình đầu ra:

Giá trị Trường hợp sử dụng
"16:9" Mặc định. Màn hình rộng cho cảnh quay ngang.
"9:16" Dọc cho điện thoại di động hoặc story trên mạng xã hội.
"1:1" Hình vuông cho Instagram hoặc hình thu nhỏ trên mạng xã hội.
"4:3" Định dạng chụp ảnh cổ điển hoặc trình chiếu.
"3:4" Chụp ảnh chân dung.
"3:2" Cắt ảnh tiêu chuẩn.
"2:3" Định dạng chân dung cao.

Khi bạn cung cấp một image, tỷ lệ khung hình sẽ mặc định khớp với kích thước của hình ảnh nguồn. Đặt rõ ràng để ghi đè hoặc cắt.


Sử dụng hình ảnh tham chiếu để định hướng phong cách

Tham số reference_images khác biệt với tham số image. Hiểu rõ sự khác biệt này là quan trọng.

**image**: Bức ảnh nguồn trở thành **khung hình đầu tiên** của video. Mô hình tạo hoạt ảnh từ điểm khởi đầu này.

**reference_images**: Một mảng gồm tối đa 7 hình ảnh dùng để định hướng **phong cách, nội dung hoặc ngữ cảnh hình ảnh** của video được tạo. Chúng không phải là các khung hình trong đầu ra. Chúng ảnh hưởng đến cách mô hình render chuyển động và diện mạo.

Sử dụng reference_images khi bạn muốn video đầu ra áp dụng các đặc điểm hình ảnh từ các tài sản hiện có, nhưng không phải làm khung hình bắt đầu:

{
  "model": "grok-imagine-video",
  "prompt": "A product rotating slowly on a clean white surface",
  "image": {
    "url": "https://example.com/product-shot.jpg"
  },
  "reference_images": [
    {"url": "https://example.com/brand-style-reference-1.jpg"},
    {"url": "https://example.com/lighting-reference.jpg"}
  ],
  "duration": 6,
  "resolution": "720p"
}

Trong ví dụ này, product-shot.jpg là khung hình đầu tiên. Các hình ảnh tham chiếu định hướng ánh sáng và cách xử lý phong cách.

Bạn có thể cung cấp hình ảnh tham chiếu mà không cần hình ảnh khung hình đầu tiên. Trong trường hợp đó, mô hình sẽ tạo ra đầu ra văn bản thành video trong khi lấy hướng dẫn phong cách từ các tham chiếu.

Mở rộng và chỉnh sửa video

API hỗ trợ hai hoạt động bổ sung ngoài việc tạo ban đầu.

Mở rộng video

POST /v1/videos/extensions nhận một video hiện có và tạo thêm vài giây từ điểm mà nó đã dừng lại. Điều này hữu ích để tạo các clip dài hơn từ nhiều lần tạo, trong khi vẫn duy trì giới hạn 15 giây cho mỗi cuộc gọi.

curl -X POST https://api.x.ai/v1/videos/extensions \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "video_id": "your_original_request_id",
    "prompt": "The mist continues to lift as sunlight breaks through",
    "duration": 5
  }'

Phản hồi tuân theo cùng một mẫu bất đồng bộ: truy vấn GET /v1/videos/{request_id} để lấy clip đã mở rộng.

Chỉnh sửa video

POST /v1/videos/edits áp dụng các sửa đổi dựa trên lời nhắc cho một video hiện có. Bạn có thể thay đổi các khía cạnh cụ thể của nội dung hoặc chuyển động mà không cần tạo lại từ đầu.

curl -X POST https://api.x.ai/v1/videos/edits \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-video",
    "video_id": "your_original_request_id",
    "prompt": "Change the sky to a dramatic sunset with deep orange tones"
  }'

Cả việc mở rộng và chỉnh sửa đều bất đồng bộ và sử dụng cùng một mẫu truy vấn.

Phân tích giá: chi phí của một video 10 giây

API video của xAI tính phí cho hai thành phần: xử lý hình ảnh đầu vào và thời lượng video đầu ra.

Thành phần Chi phí
Hình ảnh đầu vào 0.002 đô la mỗi hình ảnh
Đầu ra 480p 0.05 đô la mỗi giây
Đầu ra 720p 0.07 đô la mỗi giây

**Ví dụ: Video 10 giây ở độ phân giải 720p**

**Ví dụ: Video 6 giây ở độ phân giải 480p (cài đặt mặc định)**

Phí hình ảnh đầu vào áp dụng mỗi khi bạn gửi yêu cầu tạo, ngay cả khi bạn tái sử dụng cùng một URL hình ảnh. Hãy lên kế hoạch cho các lệnh gọi tạo của bạn một cách phù hợp nếu bạn đang lặp lại trên cùng một hình ảnh cơ sở.

Chuyển văn bản thành video (không có tham số image) bỏ qua phí đầu vào 0.002 đô la nhưng vẫn tuân theo cùng một mức giá theo giây.

Cách kiểm thử tích hợp API video Grok của bạn với Apidog

Mẫu bất đồng bộ tạo ra một thách thức kiểm thử mà các kiểm thử yêu cầu một lần đơn giản không thể bao quát. Bạn cần xác minh rằng:

  1. Yêu cầu tạo trả về một request_id.
  2. Yêu cầu truy vấn xử lý chính xác trạng thái "processing" trong khi chờ đợi.
  3. Phản hồi cuối cùng có status == "done" và một URL video không trống.

Các Kịch bản kiểm thử của Apidog xâu chuỗi các bước này lại với nhau trong một luồng tự động. Dưới đây là cách xây dựng nó:

**Bước 1: Tạo Kịch bản kiểm thử mới**

Trong Apidog, mở module Tests và nhấp vào nút + để tạo một kịch bản mới. Đặt tên nó là "Luồng bất đồng bộ Grok image-to-video."

**Bước 2: Thêm yêu cầu tạo**

Thêm một bước yêu cầu POST tùy chỉnh:

{
  "model": "grok-imagine-video",
  "prompt": "Gentle mist rises from the water as light filters through the trees",
  "image": {
    "url": "https://example.com/your-test-image.jpg"
  },
  "duration": 6,
  "resolution": "480p"
}

**Bước 3: Trích xuất request_id**

Sau bước POST, thêm một bộ xử lý **Trích xuất biến** (Extract Variable). Cấu hình nó:

Apidog lưu trữ giá trị được trích xuất trong {{video_request_id}} để sử dụng trong các bước sau.

**Bước 4: Xây dựng vòng lặp truy vấn**

Thêm một bộ xử lý vòng lặp **For**. Bên trong vòng lặp, thêm yêu cầu truy vấn:

Thêm một bộ xử lý **Trích xuất biến** bên trong vòng lặp để lấy trạng thái hiện tại:

Thêm một bộ xử lý **Chờ** (Wait) (5000ms) sau khi trích xuất trạng thái để tránh vượt quá giới hạn tốc độ.

Đặt điều kiện **Ngừng nếu** (Break If) của vòng lặp: {{video_status}} == "done".

**Bước 5: Xác nhận URL video**

Sau vòng lặp For, thêm một bước GET cuối cùng đến cùng điểm cuối truy vấn. Thêm một bộ xử lý **Xác nhận (Assertion)**:

Xác nhận này xác nhận URL video có mặt trước khi kiểm thử của bạn đạt.

Để tìm hiểu sâu hơn về cách kiểm thử API bất đồng bộ với Apidog, bao gồm các mẫu truy vấn phức tạp hơn và tích hợp CI/CD, hãy xem hướng dẫn chuyên dụng đó.

**Chạy kịch bản**

Nhấp vào Chạy trong chế độ xem kịch bản kiểm thử. Apidog thực hiện POST, trích xuất request_id, lặp lại truy vấn cho đến khi status == "done", và sau đó đánh giá các xác nhận của bạn. Báo cáo kiểm thử hiển thị trạng thái và thời gian của từng bước.

Bạn có thể tích hợp kịch bản này vào quy trình CI/CD của mình với Apidog CLI:

apidog run --scenario grok-video-async-flow --env production

Lỗi thường gặp và cách khắc phục

**401 Không được ủy quyền**

Khóa API của bạn bị thiếu hoặc không hợp lệ. Kiểm tra định dạng tiêu đề Authorization: Bearer YOUR_XAI_API_KEY. Xác nhận khóa đang hoạt động trong bảng điều khiển xAI.

**422 Thực thể không thể xử lý**

Phần thân yêu cầu bị định dạng sai. Các nguyên nhân phổ biến: trường model bị thiếu, prompt trống hoặc image.url không thể truy cập được. Hãy kiểm tra URL hình ảnh trong trình duyệt trước khi sử dụng.

**URL hình ảnh không thể truy cập**

Máy chủ của xAI phải có khả năng lấy URL hình ảnh tại thời điểm tạo. Các URL riêng tư, địa chỉ localhost hoặc URL yêu cầu xác thực sẽ thất bại. Thay vào đó, hãy sử dụng CDN công khai hoặc data URI base64.

**Trạng thái bị kẹt ở "processing" vô thời hạn**

Việc tạo có thể mất từ 30 giây đến vài phút tùy thuộc vào độ phân giải và thời lượng. Nếu trạng thái vẫn ở "processing" quá 10 phút, tác vụ có thể đã bị kẹt. Gửi một yêu cầu mới. API xAI hiện không hiển thị tín hiệu hết thời gian riêng biệt với "failed".

**Lỗi giới hạn tốc độ (429)**

API cho phép 60 yêu cầu mỗi phút và 1 yêu cầu mỗi giây. Nếu bạn đang truy vấn nhiều tác vụ cùng lúc, hãy giãn cách các yêu cầu của bạn. Ít nhất hãy thêm time.sleep(1) giữa các lệnh gọi truy vấn.

**Tải lên Base64 bị từ chối**

Đảm bảo data URI của bạn bao gồm tiền tố loại MIME chính xác. Sử dụng data:image/jpeg;base64, cho các tệp JPEG và data:image/png;base64, cho các tệp PNG.

**Tỷ lệ khung hình không khớp**

Khi bạn đặt một aspect_ratio rõ ràng khác biệt đáng kể so với tỷ lệ của hình ảnh nguồn, mô hình có thể cắt (crop) hoặc thêm viền đen (letterbox). Hãy khớp tỷ lệ khung hình với hình ảnh nguồn của bạn để có kết quả tốt nhất.

Kết luận

API Grok chuyển đổi hình ảnh thành video cung cấp cho bạn một con đường trực tiếp từ một bức ảnh tĩnh đến một đoạn clip hoạt hình ngắn. Bạn gửi (POST) hình ảnh và lời nhắc, nhận request_id, truy vấn (poll) cho đến khi hoàn tất và tải xuống MP4. Mô hình grok-imagine-video đã xếp hạng đầu bảng xếp hạng Artificial Analysis vào tháng 1 năm 2026. Hơn một tỷ video đã được tạo ra chỉ trong tháng đó. Quy mô đó phản ánh khả năng của mô hình cơ bản.

Mẫu truy vấn bất đồng bộ (async polling pattern) là nơi hầu hết các tích hợp gặp lỗi. Một kiểm thử phù hợp trong Kịch bản kiểm thử của Apidog bao gồm bước Trích xuất biến (Extract Variable), vòng lặp truy vấn với điều kiện dừng, và một xác nhận URL cuối cùng. Sự kết hợp đó giúp phát hiện các vấn đề trước khi chúng đến môi trường sản xuất.

button

Bắt đầu xây dựng tích hợp của bạn với Apidog miễn phí. Không yêu cầu thẻ tín dụng.

Câu hỏi thường gặp

**Tôi sử dụng tên mô hình nào cho API Grok chuyển đổi hình ảnh thành video?**

Tên mô hình là grok-imagine-video. Truyền nó làm trường model trong phần thân yêu cầu POST của bạn.

**Sự khác biệt giữa tham số imagereference_images là gì?**

Tham số image đặt khung hình đầu tiên của video đầu ra. Mô hình tạo hoạt ảnh tiến lên từ hình ảnh bắt đầu đó. Mảng reference_images cung cấp hướng dẫn về phong cách và nội dung mà không được sử dụng làm khung hình. Bạn có thể kết hợp cả hai trong cùng một yêu cầu.

**Việc tạo video mất bao lâu?**

Thời gian tạo thay đổi tùy theo thời lượng và độ phân giải. Một video 480p dài 6 giây thường mất 1 đến 3 phút. Một video 720p dài 15 giây có thể mất 4 đến 8 phút. Hãy truy vấn mỗi 5 giây để kiểm tra trạng thái mà không vượt quá giới hạn tốc độ của bạn.

**Tôi có thể sử dụng tệp cục bộ làm hình ảnh nguồn không?**

Có. Mã hóa tệp cục bộ của bạn thành một data URI base64: data:image/jpeg;base64,{encoded_bytes}. Truyền chuỗi đó làm giá trị url bên trong đối tượng image.

**Điều gì xảy ra nếu tôi không chỉ định aspect_ratio?**

Khi bạn cung cấp tham số image, tỷ lệ khung hình sẽ mặc định khớp với tỷ lệ tự nhiên của hình ảnh nguồn. Khi tạo văn bản thành video mà không có hình ảnh, mặc định là 16:9.

**Một video 720p dài 10 giây có giá bao nhiêu?**

Hình ảnh đầu vào có giá 0.002 đô la. Đầu ra có giá 10 × 0.07 đô la = 0.70 đô la. Tổng cộng: khoảng 0.702 đô la cho mỗi video.

**Giới hạn tốc độ là gì?**

API cho phép 60 yêu cầu mỗi phút và 1 yêu cầu mỗi giây. Điều này bao gồm cả yêu cầu POST tạo và yêu cầu GET truy vấn.

**Tôi có thể mở rộng video quá 15 giây không?**

Có, sử dụng điểm cuối POST /v1/videos/extensions. Bạn tạo một clip ban đầu tối đa 15 giây, sau đó mở rộng nó với các lượt tạo bổ sung. Mỗi lần mở rộng cũng tuân theo mẫu truy vấn bất đồng bộ.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API

Hướng Dẫn Từng Bước Sử Dụng API Grok Chuyển Ảnh Thành Video