Grok Imagine: Đánh Giá Thay Đổi & Tính Năng Hiệu Quả

Ashley Innocent

Ashley Innocent

8 tháng 4 2026

Grok Imagine: Đánh Giá Thay Đổi & Tính Năng Hiệu Quả

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

TÓM TẮT

Grok Imagine đã loại bỏ gói miễn phí vào ngày 19 tháng 3 năm 2026 và thắt chặt các bộ lọc nội dung sau một vụ tranh cãi về deepfake vào tháng Giêng. Người dùng miễn phí giờ đây không thể tạo ra hình ảnh nào. SuperGrok ($30/tháng) khôi phục quyền truy cập với giới hạn cao hơn nhưng bộ lọc nội dung nhạy cảm (NSFW) vẫn được áp dụng. API của xAI (grok-imagine-image) cung cấp quyền truy cập linh hoạt nhất cho các nhà phát triển. Nếu bạn muốn tạo hình ảnh cục bộ không kiểm duyệt, Stable Diffusion và FLUX là những lựa chọn tốt nhất của bạn.

Giới thiệu

Trong vài tháng cuối năm 2025, Grok Imagine là công cụ tạo hình ảnh được nhắc đến nhiều nhất trên internet. Nó miễn phí. Nó nhanh. Và nó ít bị kiểm duyệt hơn đáng kể so với DALL-E hay Midjourney. Điều đó đã thay đổi vào ngày 9 tháng 1 năm 2026, khi xAI hạn chế việc tạo hình ảnh đối với những người đăng ký trả phí sau khi một làn sóng nội dung deepfake lan truyền rộng rãi. Sau đó, vào ngày 19 tháng 3 năm 2026, gói miễn phí đã bị loại bỏ hoàn toàn.

Nếu bạn đang tìm kiếm "Grok Imagine không giới hạn", bạn có thể muốn một trong ba điều sau: bạn muốn biết chính xác giới hạn hiện tại là gì, liệu bạn có thể vượt qua chúng không, hoặc nên sử dụng gì thay thế. Bài viết này sẽ đề cập đến cả ba.

💡
Một điều nữa đáng biết trước khi bạn bắt đầu: nếu bạn là nhà phát triển đang xây dựng trên API của xAI, bạn sẽ muốn có một cách để kiểm tra quy trình tạo hình ảnh của mình mà không tốn tiền tín dụng cho mỗi lần chạy. Smart Mock của Apidog cho phép bạn mô phỏng phản hồi POST /v1/images/generations để giao diện người dùng của bạn có thể xử lý các trạng thái thành công, lỗi và giới hạn tỷ lệ mà không cần chạm vào API thực. Tải Apidog miễn phí để theo dõi phần kiểm thử sau trong hướng dẫn này.
Tải xuống ứng dụng

Điều gì đã xảy ra với gói miễn phí của Grok Imagine

Dòng thời gian ở đây rất quan trọng vì tình hình đã thay đổi ba lần trong vòng chưa đầy ba tháng.

Tháng 11 năm 2025: xAI ra mắt Grok Imagine như một phần của gói Grok miễn phí trên X (trước đây là Twitter). Người dùng miễn phí nhận được một số lượng tạo hình ảnh giới hạn mỗi ngày. Mô hình này là aurora và nó xếp hạng gần top đầu các bảng xếp hạng chuyển văn bản thành hình ảnh.

Ngày 9 tháng 1 năm 2026: Sau khi một báo cáo của Mashable ghi lại các hình ảnh deepfake nhạy cảm của những người nổi tiếng được tạo ra và chia sẻ, xAI đã hạn chế việc tạo hình ảnh đối với những người đăng ký trả phí. Người dùng miễn phí mất quyền truy cập. xAI đã thêm các bộ lọc an toàn bổ sung vào mô hình aurora. Thay đổi này được công bố một cách lặng lẽ, không có bài đăng blog công khai nào.

Ngày 19 tháng 3 năm 2026: Những phần còn lại cuối cùng của quyền truy cập hình ảnh miễn phí đã bị loại bỏ. xAI xác nhận rằng Grok Imagine hiện là một tính năng trả phí trên tất cả các cấp độ.

Tóm lại: Grok Imagine đã từng miễn phí, nó bị lạm dụng, và xAI đã loại bỏ hoàn toàn gói miễn phí.

Giới hạn hiện tại thực tế là gì (Tháng 4 năm 2026)

Grok Miễn phí

Không tạo hình ảnh. Hoàn toàn không. Nếu bạn đang ở gói miễn phí, tab Imagine vẫn hiển thị trong giao diện người dùng nhưng bạn sẽ gặp tường phí ngay khi cố gắng tạo hình ảnh.

SuperGrok ($30/tháng)

SuperGrok khôi phục quyền truy cập tạo hình ảnh với các giới hạn sau:

Tính năng Giới hạn
Số lần tạo hình ảnh ~100/tháng (chưa công bố chính thức)
Số lần tạo video Bị giới hạn qua grok-imagine-video
Nội dung nhạy cảm Bị chặn bởi bộ lọc an toàn
Khuôn mặt người thật Bị hạn chế một phần
Người của công chúng Bị hạn chế
Quyền truy cập API Không bao gồm (thanh toán riêng)

Bộ lọc nội dung trên SuperGrok được áp dụng ở cấp độ mô hình. xAI đã thêm một hệ thống hai lớp sau vụ tranh cãi tháng Giêng: một bộ phận bảo vệ câu lệnh (prompt guard) phát hiện các từ khóa và ngữ cảnh rõ ràng, và một bộ phân loại hình ảnh sau khi tạo. Cả hai lớp đều chạy trên mỗi lần tạo.

SuperGrok Nặng ($300/tháng)

Gói này nhắm đến những người dùng nặng và các nhóm. Bạn nhận được nhiều lần tạo hơn và thời gian phản hồi nhanh hơn, nhưng chính sách nội dung giống hệt SuperGrok. Mức giá $300 không mang lại cho bạn một chính sách an toàn khác.

API của xAI (quyền truy cập dành cho nhà phát triển)

API là lựa chọn linh hoạt nhất. Bạn gọi POST https://api.x.ai/v1/images/generations với mô hình grok-imagine-image. Giá là $0.02 mỗi hình ảnh.

Bộ lọc nội dung vẫn được áp dụng thông qua API. Chính sách sử dụng của xAI cấm nội dung tình dục, deepfake người thật và nội dung vi phạm điều khoản của họ. Nhưng bộ lọc ít gay gắt hơn đối với các câu lệnh mang tính nghệ thuật và sáng tạo so với giao diện người dùng tiêu dùng, và bạn có toàn quyền kiểm soát lập trình đối với những gì bạn gửi.

Bộ lọc nội dung: những gì nó chặn và những gì nó không chặn

Bộ lọc chặn nội dung tình dục rõ ràng, deepfake người thật, bạo lực đồ họa và nội dung liên quan đến trẻ vị thành niên. Phần đó là không thể thương lượng trên bất kỳ gói Grok nào.

Những gì bộ lọc không chặn là hầu hết nội dung nghệ thuật và sáng tạo. Bạo lực trong bối cảnh cách điệu hoặc lịch sử thường được chấp nhận. Nội dung gợi ý nhưng không rõ ràng được chấp nhận. Hình ảnh trừu tượng và siêu thực được chấp nhận. Cảnh máu me trong bối cảnh điện ảnh đôi khi được chấp nhận.

Bộ lọc được đào tạo dựa trên ý nghĩa ngữ nghĩa, không chỉ từ khóa. Các câu lệnh sử dụng ngôn ngữ khoa học, khung cảnh nghệ thuật, hoặc mô tả gián tiếp sẽ được xử lý khác với các yêu cầu trực tiếp. Đây là lý do tại sao bạn sẽ thấy mọi người trên Reddit báo cáo kết quả không nhất quán với các câu lệnh tương tự. Điều đó không phải ngẫu nhiên. Mô hình đang đưa ra phán đoán theo ngữ cảnh mỗi lần.

Kỹ thuật điều chỉnh câu lệnh (prompt reframing)

Cách giải quyết chính mà các nhà nghiên cứu đã ghi nhận là điều chỉnh khung cảnh nghệ thuật (artistic reframing). Một câu lệnh mô tả một cảnh như một phần của bức tranh, tác phẩm điêu khắc hoặc bối cảnh sách nghệ thuật sẽ được đánh giá khác so với một mô tả trực tiếp. Điều này không phải là bí mật. xAI biết về điều đó. Họ đã cố gắng thu hẹp khoảng cách nhưng sự căng thẳng cơ bản giữa tự do sáng tạo và các bộ lọc an toàn vẫn chưa được giải quyết.

Kỹ thuật này không bỏ qua bộ lọc đối với nội dung bị cấm rõ ràng. Nó chuyển nội dung ở ranh giới từ "bị chặn" sang "được phép" trong một số trường hợp.

Grok Imagine so với các công cụ tạo hình ảnh khác: cái nào thực sự ít bị hạn chế hơn

Nếu mục tiêu của bạn là ít hạn chế nội dung hơn, đây là cách các tùy chọn chính so sánh một cách trung thực:

Công cụ tạo Hạn chế Chi phí Cục bộ?
Grok Imagine (SuperGrok) Trung bình — chặn rõ ràng, cho phép nghệ thuật $30/tháng Không
DALL-E 3 (ChatGPT Plus) Nghiêm ngặt — từ chối bạo lực cách điệu và khỏa thân một phần $20/tháng Không
Midjourney Trung bình — tương tự Grok, mạnh về nghệ thuật $10-$120/tháng Không
Adobe Firefly Nghiêm ngặt — chỉ an toàn cho mục đích thương mại $5-$55/tháng Không
Stable Diffusion (cục bộ) Không — bạn kiểm soát mọi thứ Chi phí phần cứng
FLUX.1 (cục bộ) Không — bạn kiểm soát mọi thứ Chi phí phần cứng
ComfyUI + bất kỳ mô hình nào Không — tùy thuộc vào mô hình Chi phí phần cứng

Câu trả lời trung thực là không có công cụ tạo hình ảnh dựa trên đám mây nào thực sự cung cấp cho bạn không có giới hạn. Tất cả đều có chính sách nội dung được thực thi ở cấp độ API. Grok là tùy chọn đám mây ít bị lọc nhất vào cuối năm 2025, nhưng điều đó không còn đúng sau những thay đổi vào tháng Giêng.

Chạy tạo hình ảnh cục bộ: tùy chọn không giới hạn thực sự

Tạo hình ảnh cục bộ có nghĩa là cài đặt mô hình trên phần cứng của riêng bạn và chạy nó mà không cần bất kỳ API bên ngoài nào. Không có chính sách nội dung vì không có dịch vụ đám mây. Những gì bạn tạo ra sẽ nằm trên máy của bạn.

Stable Diffusion

Stable Diffusion là tùy chọn được thành lập nhất. Các mô hình SDXL và SD 3.5 là mã nguồn mở (open weights), nghĩa là bạn có thể tải xuống và chạy chúng trên GPU tiêu dùng.

Phần cứng tối thiểu: GPU 8GB VRAM (NVIDIA RTX 3060 hoặc tốt hơn). Người dùng Mac có thể chạy nó trên Apple Silicon thông qua CPU với hiệu suất chậm hơn.

Các tùy chọn cài đặt:- AUTOMATIC1111 (WebUI): dựa trên trình duyệt, dễ nhất cho người mới bắt đầu - ComfyUI: trình chỉnh sửa đồ họa dựa trên nút (node-based), kiểm soát nhiều hơn - Invoke AI: giao diện người dùng bóng bẩy, tốt cho việc lặp lại

Các mô hình không kiểm duyệt là các bản tinh chỉnh (fine-tunes) do cộng đồng duy trì. Chúng có sẵn rộng rãi trên Hugging Face và CivitAI. Bạn tải chúng vào bất kỳ giao diện nào ở trên.

FLUX.1

FLUX từ Black Forest Labs mới hơn Stable Diffusion và tạo ra hình ảnh sắc nét hơn, chân thực hơn. Mô hình FLUX.1-dev miễn phí cho mục đích phi thương mại. FLUX.1-schnell là hoàn toàn mở.

FLUX chạy trên cùng phần cứng với Stable Diffusion nhưng sử dụng nhiều VRAM hơn cho các lần tạo lớn hơn. Một GPU 12GB xử lý nó tốt. Bạn có thể chạy nó thông qua ComfyUI hoặc thư viện Python diffusers.

from diffusers import FluxPipeline
import torch

pipe = FluxPipeline.from_pretrained(
    "black-forest-labs/FLUX.1-schnell",
    torch_dtype=torch.bfloat16
)
pipe.to("cuda")

image = pipe(
    "your prompt here",
    height=1024,
    width=1024,
    num_inference_steps=4,
    max_sequence_length=256,
).images[0]

image.save("output.png")

Không có khóa API. Không có bộ lọc nội dung. Không giới hạn tỷ lệ. Giới hạn duy nhất là GPU của bạn.

Sử dụng API của xAI để tạo hình ảnh (hướng dẫn dành cho nhà phát triển)

Nếu bạn muốn tạo hình ảnh trên đám mây với nhiều kiểm soát hơn so với giao diện người dùng tiêu dùng, API của xAI là con đường đúng đắn. Nó vẫn bị lọc, nhưng nó hỗ trợ quyền truy cập lập trình, tạo hàng loạt và tích hợp với các ứng dụng của riêng bạn.

Xác thực

export XAI_API_KEY="your_key_here"

Lấy khóa của bạn từ console.x.ai. Bạn cần có phương thức thanh toán được đính kèm trước khi chức năng tạo hình ảnh hoạt động.

Yêu cầu tạo hình ảnh đầu tiên của bạn

curl https://api.x.ai/v1/images/generations \
  -H "Authorization: Bearer $XAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "grok-imagine-image",
    "prompt": "a photorealistic mountain lake at sunrise, mist over the water",
    "n": 1,
    "response_format": "url"
  }'

Phản hồi trả về đồng bộ với một URL:

{
  "created": 1744123456,
  "data": [
    {
      "url": "https://..."
    }
  ]
}

Điều này khác với API video, API video sử dụng một mẫu thăm dò không đồng bộ. Tạo hình ảnh là đồng bộ. Bạn POST và nhận lại URL của mình trong cùng một phản hồi, thường trong vòng 3-5 giây.

Ví dụ Python

import os
import requests

api_key = os.environ["XAI_API_KEY"]

response = requests.post(
    "https://api.x.ai/v1/images/generations",
    headers={
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    },
    json={
        "model": "grok-imagine-image",
        "prompt": "a cyberpunk city street at night, neon reflections in rain puddles",
        "n": 1,
        "response_format": "url"
    }
)

data = response.json()
image_url = data["data"][0]["url"]
print(f"Image URL: {image_url}")

Thông số

Thông số Loại Mô tả
model chuỗi Phải là "grok-imagine-image"
prompt chuỗi Mô tả văn bản của bạn
n số nguyên Số lượng hình ảnh (1-4)
response_format chuỗi "url" hoặc "b64_json"

Kiểm tra API hình ảnh của xAI với Apidog

Xây dựng một tính năng sản phẩm trên nền tảng Grok Imagine có nghĩa là ứng dụng của bạn cần xử lý đúng đắn một số trạng thái: tạo hình ảnh thành công, từ chối do chính sách nội dung (HTTP 400 với một nội dung lỗi cụ thể), phản hồi giới hạn tỷ lệ (HTTP 429), và thời gian chờ mạng.

Thiết lập Apidog Smart Mock để mô phỏng các phản hồi API của Grok Imagine

Kiểm tra tất cả những điều này với API thực tốn $0.02 cho mỗi lần gọi và yêu cầu truy cập internet. Điều đó ổn cho các kiểm tra tích hợp cuối cùng nhưng lãng phí trong quá trình phát triển giao diện người dùng.

Smart Mock của Apidog giải quyết vấn đề này. Bạn định nghĩa điểm cuối POST /v1/images/generations trong Apidog, thiết lập các phản hồi giả lập (mock responses) cho mỗi trạng thái, và giao diện người dùng của bạn sẽ gọi đến mock trong quá trình phát triển thay vì API thực.

Thiết lập mock lỗi chính sách nội dung:

  1. Trong Apidog, tạo một điểm cuối mới: POST https://api.x.ai/v1/images/generations
  2. Thêm một Mock Expectation với điều kiện trên nội dung yêu cầu
  3. Đặt nó trả về phản hồi 400 với nội dung này khi câu lệnh chứa nội dung bị gắn cờ:
{
  "error": {
    "message": "Your request was rejected as a result of our safety system.",
    "type": "invalid_request_error",
    "code": "content_policy_violation"
  }
}
  1. Thêm một Expectation thứ hai trả về 200 hợp lệ cho các câu lệnh thông thường

Bây giờ mã xử lý lỗi của bạn có thể được kiểm tra mà không kích hoạt bộ lọc an toàn thực. Điều này đáng để thiết lập sớm nếu ứng dụng của bạn cần hiển thị các thông báo lỗi có ý nghĩa cho người dùng khi câu lệnh của họ bị từ chối.

Để biết thiết lập kiểm thử API tạo video đầy đủ, hãy xem hướng dẫn API chuyển hình ảnh thành video của Grokhướng dẫn API chuyển văn bản thành video của Grok.

Mô hình grok-companion-ani là gì (và tại sao nó khác biệt)

Khi nghiên cứu bài viết này, bạn có thể bắt gặp các tài liệu tham khảo về grok-companion-ani trong tài liệu của xAI. Đây là một mô hình khác với grok-imagine-image. Nó được thiết kế cho hoạt hình nhân vật và tương tác kiểu bạn đồng hành chứ không phải tạo hình ảnh chung chung.

Nó có mức giá và chính sách nội dung khác nhau. Nó không phải là một phiên bản ít bị lọc hơn của công cụ tạo hình ảnh. Điều này đáng để biết vì các tên đủ giống nhau để gây nhầm lẫn.

Các lựa chọn thay thế cho Grok Imagine đáng biết

Đối với việc tạo trên đám mây với ít hạn chế hơn DALL-E:

Midjourney vẫn là tùy chọn đám mây mạnh nhất cho nội dung nghệ thuật và sáng tạo. Bộ lọc của nó tương tự như bản cập nhật sau tháng Giêng của Grok, nhưng chất lượng hình ảnh trên các câu lệnh phức tạp luôn tốt hơn. Bắt đầu từ $10/tháng.

Leonardo AI có chính sách nội dung khoan dung hơn hầu hết các nhà cung cấp đám mây đối với nội dung nghệ thuật. Gói miễn phí bị giới hạn nhưng có thể sử dụng để thử nghiệm.

Ideogram hoạt động tốt cho các trường hợp sử dụng văn bản trong hình ảnh và có gói miễn phí hợp lý. Ít liên quan hơn nếu trường hợp sử dụng của bạn là nội dung siêu thực.

Đối với việc tạo cục bộ:

FLUX.1-schnell để lặp lại nhanh. FLUX.1-dev cho chất lượng. SDXL Turbo để tạo theo thời gian thực. Tất cả những cái này đều chạy trên phần cứng tiêu dùng mà không có hạn chế về nội dung.

Kết luận

Grok Imagine đã có một khoảng thời gian ngắn khi nó là công cụ tạo hình ảnh ít bị lọc nhất, dễ tiếp cận nhất mà không tốn phí. Khoảng thời gian đó đã khép lại vào tháng 1 năm 2026 và hoàn toàn chấm dứt vào tháng 3 khi xAI loại bỏ hoàn toàn gói miễn phí.

Tình hình hiện tại rất rõ ràng. SuperGrok cung cấp cho bạn khả năng tạo hình ảnh trên đám mây với bộ lọc nội dung vừa phải với giá $30/tháng. API của xAI cung cấp cho bạn quyền truy cập lập trình với giá $0.02 cho mỗi hình ảnh với cùng bộ lọc được áp dụng. Nếu bạn muốn tạo ra nội dung không có giới hạn thực sự, con đường đáng tin cậy duy nhất là chạy Stable Diffusion hoặc FLUX cục bộ trên phần cứng của riêng bạn.

Câu hỏi về nhà cung cấp đám mây nào là "ít bị hạn chế nhất" thay đổi vài tháng một lần khi các đội an toàn vá lỗi mô hình của họ. Việc tạo cục bộ không thay đổi. Phần cứng của bạn, mô hình của bạn, đầu ra của bạn.

Để có danh sách đầy đủ các mô hình AI miễn phí và mã nguồn mở mà bạn có thể chạy mà không có giới hạn, hãy xem hướng dẫn các mô hình AI miễn phí.

Tải xuống ứng dụng

CÂU HỎI THƯỜNG GẶP

Grok Imagine còn có gói miễn phí không?Không. Kể từ ngày 19 tháng 3 năm 2026, việc tạo hình ảnh trên Grok yêu cầu đăng ký trả phí. SuperGrok với giá $30/tháng là gói khởi điểm để truy cập hình ảnh.

Bạn có thể bỏ qua bộ lọc nội dung của Grok Imagine không?Đối với nội dung bị cấm rõ ràng (nội dung tình dục liên quan đến người thật, trẻ vị thành niên, bạo lực đồ họa), không. Việc điều chỉnh khung cảnh nghệ thuật có thể chuyển các câu lệnh ở ranh giới từ bị chặn sang được phép trong một số trường hợp, nhưng điều này không hoạt động đối với nội dung vi phạm chính sách sử dụng cốt lõi của xAI.

Grok Imagine có khả dụng thông qua API không?Có. Mô hình grok-imagine-image có sẵn qua POST https://api.x.ai/v1/images/generations với giá $0.02 mỗi hình ảnh. Bạn cần một khóa API của xAI từ console.x.ai và một phương thức thanh toán được đính kèm.

Sự khác biệt giữa Grok Imagine và Grok chuyển hình ảnh thành video là gì?Grok Imagine (grok-imagine-image) tạo ra một hình ảnh tĩnh từ một câu lệnh văn bản. Grok chuyển hình ảnh thành video (grok-imagine-video) làm động một hình ảnh hiện có thành một đoạn video ngắn. Chúng là các mô hình riêng biệt với mức giá và điểm cuối khác nhau.

Công cụ tạo hình ảnh không giới hạn tốt nhất năm 2026 là gì?Đối với việc tạo cục bộ không giới hạn: FLUX.1-schnell hoặc SDXL. Cả hai đều chạy trên GPU tiêu dùng (8GB+ VRAM), là mã nguồn mở hoàn toàn, và không có chính sách nội dung vì chúng chạy trên phần cứng của bạn.

Công cụ tạo hình ảnh trên đám mây nào có ít hạn chế nhất?Sau bản cập nhật bộ lọc tháng 1 năm 2026 của Grok, tình hình tương đối đồng đều. Midjourney và Leonardo AI thường được coi là khoan dung hơn DALL-E hoặc Adobe Firefly đối với nội dung nghệ thuật. Không có nhà cung cấp đám mây nào cho phép nội dung tình dục rõ ràng hoặc deepfake.

Grok Imagine so sánh với Midjourney như thế nào?Sau tháng 1 năm 2026, các chính sách nội dung tương tự nhau. Grok Imagine có xu hướng tạo ra hình ảnh chân thực hơn. Midjourney tạo ra kết quả mạnh mẽ hơn đối với các câu lệnh nghệ thuật, cách điệu và có bố cục phức tạp. Midjourney bắt đầu từ $10/tháng; quyền truy cập hình ảnh của Grok bắt đầu từ $30/tháng với SuperGrok.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API