TÓM TẮT
Giá MiMo-V2-Pro bắt đầu từ 1 đô la/1 triệu token đầu vào và 3 đô la/1 triệu token đầu ra (ngữ cảnh ≤256K). Giá MiMo-V2-Omni bao gồm đầu vào đa phương thức như văn bản, hình ảnh, âm thanh và video trong một mô hình thống nhất. Cả hai đều có thể truy cập thông qua API tương thích với OpenAI tại platform.xiaomimimo.com. Hãy sử dụng Apidog để kiểm thử API trực quan, hoặc Python cho các tích hợp sản xuất và luôn hỗ trợ tích hợp của bạn bằng một kiểm thử đơn vị.
Giới thiệu
Xiaomi đã ra mắt ba mẫu AI mới vào ngày 18 tháng 3 năm 2026 và cộng đồng nhà phát triển đã nhanh chóng chú ý. MiMo-V2-Pro và MiMo-V2-Omni là hai bản phát hành chủ lực: một được xây dựng để suy luận tác nhân sâu sắc, một để hiểu biết đa phương thức thực sự. Nếu bạn đang cố gắng tìm hiểu Giá MiMo-V2-Pro, Giá Omni, hoặc đơn giản là cách sử dụng API trong ngăn xếp của mình, hướng dẫn này sẽ bao gồm tất cả. Chúng ta sẽ phân tích đầy đủ các bậc giá, hướng dẫn qua các khả năng của API, và chỉ cho bạn hai cách tích hợp — một quy trình làm việc dựa trên GUI (giao diện đồ họa người dùng) với Apidog và một phương pháp Python với một kiểm thử đơn vị để xác thực thiết lập của bạn.
Phân tích giá MiMo-V2-Pro & MiMo-V2-Omni
Hiểu về Giá MiMo-V2-Pro và Giá Omni là bước đầu tiên trước khi bạn bắt đầu gọi API. Cả hai mô hình đều sử dụng giá theo cấp độ dựa trên token, và cấu trúc chi phí đủ cạnh tranh để biến chúng thành lựa chọn đáng cân nhắc cho các khối lượng công việc sản xuất.
Giá MiMo-V2-Pro: Phân cấp theo độ dài ngữ cảnh
Giá MiMo-V2-Pro được chia thành hai cấp dựa trên lượng ngữ cảnh bạn sử dụng cho mỗi yêu cầu:
| Độ dài ngữ cảnh | Đầu vào (mỗi 1 triệu token) | Đầu ra (mỗi 1 triệu token) |
|---|---|---|
| ≤ 256K token | $1.00 | $3.00 |
| 256K – 1M token | $2.00 | $6.00 |
Cấu trúc phân cấp này phản ánh cửa sổ ngữ cảnh 1 triệu token của mô hình — một trong những cửa sổ lớn nhất hiện có. Đối với hầu hết các khối lượng công việc nằm dưới 256K token, Giá MiMo-V2-Pro là cực kỳ cạnh tranh: đầu ra với 3 đô la/1 triệu token chỉ bằng 1/8 giá của Claude Opus. Đối với các tác vụ dài hạn như xử lý toàn bộ cơ sở mã hoặc chuỗi kế hoạch mở rộng, cấp 256K–1M sẽ được áp dụng.
Giá MiMo-V2-Omni
Giá Omni tuân theo cấu trúc tương tự như MiMo-V2-Pro, với những cân nhắc bổ sung cho đầu vào đa phương thức. MiMo-V2-Omni xử lý nguyên bản văn bản, hình ảnh, âm thanh và video trong một kiến trúc thống nhất — không phải là các mô-đun được gắn thêm riêng biệt. Token hình ảnh và âm thanh được tính cùng với token văn bản, vì vậy Giá Omni mở rộng theo sự phong phú của đầu vào của bạn.
Đối với các tác vụ văn bản thuần túy, Giá Omni tương đương với MiMo-V2-Pro. Đối với các khối lượng công việc đa phương thức, hãy mong đợi số lượng token cao hơn cho mỗi yêu cầu do việc tạo token hình ảnh và âm thanh.
So sánh giá dòng MiMo-V2
Để đặt Giá MiMo-V2-Pro và Giá Omni vào ngữ cảnh:
| Mô hình | Đầu vào (mỗi 1 triệu token) | Đầu ra (mỗi 1 triệu token) | Cửa sổ ngữ cảnh | Phương thức |
|---|---|---|---|---|
| MiMo-V2-Pro | $1.00 / $2.00* | $3.00 / $6.00* | 1M token | Văn bản |
| MiMo-V2-Omni | ~$1.00* | ~$3.00* | 256K token | Văn bản, Hình ảnh, Âm thanh, Video |
| MiMo-V2-Flash | $0.10 | $0.30 | 256K token | Văn bản |
Phân cấp hoặc ước tính – hãy xác minh mức giá hiện tại tại platform.xiaomimimo.com
MiMo-V2-Flash là lựa chọn rẻ nhất cho các tác vụ văn bản thuần túy. MiMo-V2-Pro là lựa chọn phù hợp khi bạn cần suy luận sâu sắc và ngữ cảnh dài. MiMo-V2-Omni là lựa chọn cho các quy trình đa phương thức nơi Giá Omni bao gồm tất cả các loại đầu vào trong một lần gọi API.
Khả năng API MiMo-V2-Pro & Omni
Trước khi bạn tìm hiểu cách sử dụng API, sẽ hữu ích nếu biết mỗi mô hình thực sự làm gì.
MiMo-V2-Pro là mô hình suy luận chủ lực của Xiaomi được xây dựng cho "kỷ nguyên tác nhân". Các thông số kỹ thuật chính:
- Tổng cộng 1 nghìn tỷ tham số, 42 tỷ đang hoạt động (lớn gấp 3 lần MiMo-V2-Flash)
- Cửa sổ ngữ cảnh 1 triệu token xử lý toàn bộ cơ sở mã và chuỗi kế hoạch dài
- Dự đoán Đa Token (MTP) để suy luận nhanh hơn
- Được thiết kế cho suy luận đa bước tự động, thực thi công cụ và các tác vụ kỹ thuật phần mềm
- Xếp hạng số 1 trong số 160 mô hình trong phân khúc giá của nó trên Chỉ số Trí tuệ Phân tích Nhân tạo (Artificial Analysis Intelligence Index) (điểm: 49 so với mức trung bình là 13)
- Hiệu suất mạnh mẽ trên SWE-Bench và các điểm chuẩn mã hóa
MiMo-V2-Omni là mô hình nền tảng đa phương thức của Xiaomi:
- Xử lý nguyên bản văn bản, hình ảnh, âm thanh và video trong một kiến trúc thống nhất
- Các bộ mã hóa hình ảnh và âm thanh chuyên dụng được tích hợp ở cấp độ kiến trúc
- Phù hợp để hiểu tài liệu, chuyển đổi âm thanh thành văn bản, phân tích video và suy luận đa phương thức
Cả hai mô hình đều có sẵn thông qua nền tảng API chính thức tại platform.xiaomimimo.com, với các điểm cuối tương thích với OpenAI — có nghĩa là bạn có thể thay thế chúng vào bất kỳ tích hợp SDK OpenAI hiện có nào với những thay đổi tối thiểu.
Cách sử dụng API với Apidog
Apidog là cách nhanh nhất để khám phá cách sử dụng API mà không cần viết mã trước. Nó cung cấp cho bạn một GUI đầy đủ để gửi yêu cầu, kiểm tra phản hồi và chạy các xác nhận kiểm thử đơn vị, tất cả ở cùng một nơi. Tải Apidog miễn phí trước khi bạn bắt đầu.
Thiết lập yêu cầu API MiMo-V2-Pro & Omni trong Apidog
Cách sử dụng API trong Apidog mất chưa đầy hai phút:
- Mở Apidog và tạo một dự án mới — đặt tên nó là một cái gì đó như
Kiểm thử API MiMo-V2. - Tạo một yêu cầu HTTP mới:
- Phương thức:
POST - URL:
https://api.xiaomimimo.com/v1/chat/completions
3. Thêm tiêu đề trong tab Headers:
| Khóa | Giá trị |
|---|---|
Authorization | Bearer KHÓA_API_MIMO_CỦA_BẠN |
Content-Type | application/json |
4. Đặt phần thân yêu cầu (Body → JSON) cho MiMo-V2-Pro:
{
"model": "mimo-v2-pro",
"messages": [
{
"role": "user",
"content": "Viết một hàm Python kiểm tra xem một số có phải là số nguyên tố không, và giải thích cách bạn sẽ kiểm thử đơn vị nó."
}
],
"temperature": 0.6,
"max_tokens": 512
}
Đối với MiMo-V2-Omni, thay đổi mô hình và thêm đầu vào hình ảnh:
{
"model": "mimo-v2-omni",
"messages": [
{
"role": "user",
"content": [
{ "type": "text", "text": "Mô tả những gì bạn thấy trong hình ảnh này." },
{ "type": "image_url", "image_url": { "url": "https://example.com/diagram.png" } }
]
}
],
"max_tokens": 300
}5. Nhấp Gửi. Apidog hiển thị toàn bộ phản hồi với việc sử dụng token, cho phép bạn theo dõi chi phí MiMo-V2-Pro Pricing và Omni Pricing cho mỗi yêu cầu theo thời gian thực.
Viết kiểm thử đơn vị cho API MiMo-V2-Pro & Omni trong Apidog
Apidog có một công cụ tạo kịch bản kiểm thử tích hợp. Sau khi gửi yêu cầu, mở tab Tests và thêm các xác nhận kiểm thử đơn vị này:
// Kiểm thử đơn vị 1: Trạng thái HTTP là 200
pm.test("Status code is 200", function () {
pm.response.to.have.status(200);
});
// Kiểm thử đơn vị 2: Mô hình trả về chính xác (xác thực giá MiMo-V2-Pro)
pm.test("Model ID is correct", function () {
const json = pm.response.json();
pm.expect(json.model).to.include("mimo-v2");
});
// Kiểm thử đơn vị 3: Phản hồi chứa thông báo từ trợ lý
pm.test("Assistant message is present", function () {
const json = pm.response.json();
pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});
// Kiểm thử đơn vị 4: Báo cáo việc sử dụng token (để theo dõi giá Omni và Pro)
pm.test("Token usage is present", function () {
const json = pm.response.json();
pm.expect(json.usage.total_tokens).to.be.above(0);
});
Bốn kiểm thử đơn vị này bao gồm các yếu tố cần thiết: trạng thái, nhận dạng mô hình, nội dung phản hồi và việc sử dụng token. Apidog chạy chúng tự động trên mỗi lần Gửi, vì vậy bạn phát hiện lỗi hồi quy ngay lập tức khi bạn lặp lại các lời nhắc. Bạn cũng có thể lưu bộ sưu tập và chạy nó trong CI bằng cách sử dụng trình chạy CLI của Apidog.
Cách sử dụng API với Python
Để sử dụng trong sản xuất, đây là cách sử dụng API trong Python với một bộ kiểm thử đơn vị đầy đủ sử dụng pytest.
Cài đặt
pip install openai pytest
API MiMo tương thích với OpenAI, vì vậy SDK openai hoạt động trực tiếp.
Gọi API cơ bản (MiMo-V2-Pro)
# mimo_client.py
from openai import OpenAI
# Trỏ máy khách OpenAI tới API MiMo
client = OpenAI(
api_key="YOUR_MIMO_API_KEY",
base_url="https://api.xiaomimimo.com/v1"
)
def ask_mimo_pro(prompt: str) -> dict:
"""Gọi API MiMo-V2-Pro và trả về phản hồi có cấu trúc."""
response = client.chat.completions.create(
model="mimo-v2-pro",
messages=[{"role": "user", "content": prompt}],
temperature=0.6,
max_tokens=512
)
return {
"content": response.choices[0].message.content,
"model": response.model,
"prompt_tokens": response.usage.prompt_tokens,
"completion_tokens": response.usage.completion_tokens,
"total_tokens": response.usage.total_tokens,
}
if __name__ == "__main__":
result = ask_mimo_pro("Kiểm thử đơn vị là gì và tại sao nó quan trọng?")
print(result["content"])
# Ước tính chi phí bằng cách sử dụng MiMo-V2-Pro Pricing (bậc ≤256K)
input_cost = (result["prompt_tokens"] / 1_000_000) * 1.00
output_cost = (result["completion_tokens"] / 1_000_000) * 3.00
print(f"Chi phí ước tính: ${input_cost + output_cost:.6f}")
Kiểm thử đơn vị cho API MiMo-V2-Pro
# test_mimo_client.py
import pytest
from unittest.mock import patch, MagicMock
from mimo_client import ask_mimo_pro
@pytest.fixture
def mock_mimo_response():
"""Phản hồi API MiMo-V2-Pro giả định cho kiểm thử đơn vị."""
mock = MagicMock()
mock.choices[0].message.content = (
"Kiểm thử đơn vị xác minh một hàm duy nhất hoạt động chính xác một cách độc lập."
)
mock.model = "mimo-v2-pro"
mock.usage.prompt_tokens = 20
mock.usage.completion_tokens = 30
mock.usage.total_tokens = 50
return mock
@patch("mimo_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_mimo_response):
"""Kiểm thử đơn vị: API trả về nội dung chuỗi không rỗng."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Kiểm thử đơn vị là gì?")
assert isinstance(result["content"], str)
assert len(result["content"]) > 0
@patch("mimo_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_mimo_response):
"""Kiểm thử đơn vị: xác nhận ID mô hình mimo-v2-pro được sử dụng."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Xin chào")
assert result["model"] == "mimo-v2-pro"
@patch("mimo_client.client.chat.completions.create")
def test_token_usage_for_pricing(mock_create, mock_mimo_response):
"""Kiểm thử đơn vị: việc sử dụng token hiện diện để theo dõi giá MiMo-V2-Pro."""
mock_create.return_value = mock_mimo_response
result = ask_mimo_pro("Xin chào")
assert result["total_tokens"] > 0
assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]
Chạy các kiểm thử đơn vị:
pytest test_mimo_client.py -v
Đầu ra dự kiến:
test_mimo_client.py::test_returns_content PASSED
test_mimo_client.py::test_correct_model PASSED
test_mimo_client.py::test_token_usage_for_pricing PASSED
3 passed in 0.28s
Việc giả lập API trong bộ kiểm thử đơn vị của bạn có nghĩa là không tốn token nào trong quá trình chạy CI — điều này quan trọng khi Giá MiMo-V2-Pro tăng theo mỗi yêu cầu trong các quy trình tự động.
Các phương pháp hay nhất cho API MiMo-V2-Pro & Omni
Để tận dụng tối đa cách sử dụng API trong sản xuất đòi hỏi sự chủ động. Dưới đây là các phương pháp chính:
1. Theo dõi việc sử dụng token để kiểm soát chi phí MiMo-V2-Pro Pricing và Omni Pricing Ghi lại prompt_tokens và completion_tokens cho mỗi lần gọi. Với 1 đô la/1 triệu đầu vào và 3 đô la/1 triệu đầu ra, các lời nhắc hệ thống dài dòng sẽ tốn kém nhanh chóng. Hãy giữ chúng ngắn gọn.
2. Sử dụng Apidog trước khi viết mã Trước khi xây dựng một tích hợp hoàn chỉnh, hãy sử dụng Apidog để tạo mẫu lời nhắc và xác thực hình dạng phản hồi. Đây là cách nhanh nhất để học cách sử dụng API mà không lãng phí token vào mã bị lỗi. Apidog cũng cho phép bạn chia sẻ bộ sưu tập yêu cầu với nhóm của mình.
3. Viết kiểm thử đơn vị ngay từ đầu Thêm một kiểm thử đơn vị cho mỗi hàm gọi API. Giả lập phản hồi bằng unittest.mock để bộ kiểm thử của bạn chạy ngay lập tức và miễn phí. Sử dụng các kịch bản kiểm thử của Apidog để kiểm thử đơn vị dựa trên GUI, và pytest để kiểm thử ở cấp độ mã.
4. Chọn mô hình phù hợp cho tác vụ Sử dụng MiMo-V2-Pro cho các tác vụ chỉ văn bản, nặng về suy luận — đặc biệt là bất cứ điều gì liên quan đến mã, lập kế hoạch hoặc logic đa bước. Sử dụng MiMo-V2-Omni khi quy trình của bạn liên quan đến hình ảnh, âm thanh hoặc video. Đừng trả Giá Omni cho các tác vụ chỉ cần văn bản.
5. Giữ ngữ cảnh dưới 256K khi có thể Giá MiMo-V2-Pro tăng gấp đôi ở cấp 256K–1M. Đối với các quy trình RAG, chỉ truy xuất các đoạn có liên quan nhất thay vì truyền toàn bộ bộ tài liệu.
6. Sử dụng OpenAI SDK để tích hợp dễ dàng Vì cả hai mô hình đều cung cấp các điểm cuối tương thích với OpenAI, bạn có thể tích hợp chúng vào bất kỳ cơ sở mã dựa trên OpenAI hiện có nào bằng cách thay đổi base_url và model. Không yêu cầu SDK mới — điều này làm cho cách sử dụng API trở nên đơn giản cho các nhóm đã sử dụng ngăn xếp OpenAI.
Kết luận
Giá MiMo-V2-Pro ở mức 1 đô la/1 triệu đầu vào và 3 đô la/1 triệu đầu ra biến nó thành một trong những mô hình suy luận chủ lực hiệu quả chi phí nhất hiện có trên thị trường ngày nay. Giá Omni mở rộng giá trị đó sang các khối lượng công việc đa phương thức — văn bản, hình ảnh, âm thanh và video — trong một cuộc gọi API thống nhất duy nhất.
Dù bạn đang khám phá cách sử dụng API lần đầu tiên với giao diện đồ họa (GUI) của Apidog, hay xây dựng một tích hợp Python sản xuất được hỗ trợ bởi bộ kiểm thử đơn vị, cả MiMo-V2-Pro và MiMo-V2-Omni đều phù hợp một cách gọn gàng vào quy trình làm việc của nhà phát triển hiện đại. Bắt đầu với Apidog để xác thực yêu cầu của bạn một cách trực quan, sau đó tự tin chuyển sang mã.
Thử Apidog miễn phí – không yêu cầu thẻ tín dụng.
Câu hỏi thường gặp
Giá MiMo-V2-Pro là gì? Giá MiMo-V2-Pro là 1 đô la/1 triệu token đầu vào và 3 đô la/1 triệu token đầu ra cho ngữ cảnh lên đến 256K. Đối với ngữ cảnh từ 256K đến 1M token, đó là 2 đô la/1 triệu đầu vào và 6 đô la/1 triệu đầu ra.
Giá MiMo-V2-Omni là gì? Giá Omni tương đương với MiMo-V2-Pro cho đầu vào văn bản. Các đầu vào đa phương thức (hình ảnh, âm thanh, video) được tạo token và tính phí cùng với token văn bản. Kiểm tra platform.xiaomimimo.com để biết mức giá Omni mới nhất.
Làm cách nào để sử dụng API MiMo-V2-Pro? Sử dụng OpenAI Python SDK với base_url="https://api.xiaomimimo.com/v1" và model="mimo-v2-pro". API hoàn toàn tương thích với OpenAI. Sử dụng Apidog để kiểm tra trực quan trước khi viết mã.
Làm cách nào để viết kiểm thử đơn vị cho API MiMo? Giả lập máy khách API với unittest.mock trong Python và xác nhận cấu trúc phản hồi. Trong Apidog, sử dụng tab Tests để thêm các xác nhận kiểm thử đơn vị dựa trên JavaScript sau mỗi yêu cầu.
Sự khác biệt giữa MiMo-V2-Pro và MiMo-V2-Omni là gì? MiMo-V2-Pro là mô hình suy luận chỉ văn bản với 1 nghìn tỷ tham số và cửa sổ ngữ cảnh 1 triệu token. MiMo-V2-Omni là mô hình đa phương thức xử lý nguyên bản văn bản, hình ảnh, âm thanh và video trong một kiến trúc thống nhất.
Giá MiMo-V2-Pro so với MiMo-V2-Flash như thế nào? MiMo-V2-Flash rẻ hơn nhiều ở mức 0.10 đô la/1 triệu đầu vào và 0.30 đô la/1 triệu đầu ra, nhưng MiMo-V2-Pro cung cấp khả năng suy luận mạnh mẽ hơn đáng kể và cửa sổ ngữ cảnh 1 triệu token. Hãy chọn dựa trên độ phức tạp của tác vụ.
Tôi có thể truy cập API MiMo ở đâu? API MiMo có sẵn tại platform.xiaomimimo.com. Cả MiMo-V2-Pro và MiMo-V2-Omni cũng có thể truy cập được thông qua các nhà cung cấp bên thứ ba như OpenRouter và Vercel AI Gateway.
