Chi Phí Sử Dụng Xiaomi MiMo V2.5 Năm 2026 Là Bao Nhiêu?

Ashley Innocent

Ashley Innocent

27 tháng 5 2026

Chi Phí Sử Dụng Xiaomi MiMo V2.5 Năm 2026 Là Bao Nhiêu?

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

Giá API Xiaomi MiMo V2.5 đã giảm xuống mức cố định 1 USD cho mỗi triệu token đầu vào và 3 USD cho mỗi triệu token đầu ra vào ngày 27 tháng 5 năm 2026, và nhóm đã quyết định duy trì mức giá mới này vĩnh viễn. Gói ngữ cảnh dài cũ, nơi các lời nhắc vượt quá 256K token phải chịu một hệ số nhân cao trên mức giá cơ bản, đã không còn nữa. Giờ đây chỉ còn một mức giá duy nhất, bất kể độ dài ngữ cảnh. Đối với hầu hết các tác vụ, tiêu đề chính là một câu: MiMo V2.5 là một trong ba mô hình ngữ cảnh 1M rẻ nhất đang được sản xuất, và nó sẽ duy trì như vậy.

Tóm tắt

Những thay đổi vào ngày 27 tháng 5 năm 2026

Thông báo cập nhật giá chính thức của Xiaomi đưa ra ba thay đổi. Cả ba đều có hiệu lực vào lúc 00:00 giờ Bắc Kinh ngày 27 tháng 5, tức 16:00 UTC ngày 26 tháng 5.

1. Giá cố định trên tất cả các cửa sổ ngữ cảnh. Biểu giá MiMo V2.5 cũ sử dụng các mức giá theo bậc: giá cơ bản cho lời nhắc lên đến 32K token đầu vào, hệ số nhân cho dải từ 32K đến 256K, và mức giá cao hơn nữa cho trên 256K. Biểu giá mới có một số duy nhất cho mỗi loại token. Các ứng dụng ngữ cảnh dài không còn phải trả phí ngữ cảnh dài nữa.

2. Vĩnh viễn, không phải khuyến mãi. Thông báo sử dụng cụm từ "Giảm giá Vĩnh viễn" hai lần và "thay đổi vĩnh viễn toàn bộ hệ thống định giá mô hình" một lần. Không có ngày hết hạn. Không có điều khoản hoàn nguyên. Hãy coi đây là giá niêm yết mới.

3. Đặt lại phần thưởng Gói Token. Nếu bạn đang sử dụng Gói Token (hệ thống hạn mức trả trước của Xiaomi), số dư tín dụng của bạn đã được tăng từ 5 đến 8 lần và mọi tín dụng bạn đã sử dụng trong thời gian hiệu lực đã được hoàn lại. Bản thân thời gian hiệu lực không được gia hạn, vì vậy các gói hiện có đã nhận được một khoản tiền bất ngờ nhưng không có thêm thời gian.

Tuyên bố "giảm giá tới 99%" áp dụng cụ thể cho dải ngữ cảnh dài. Giá trước đây cho 256K+ token đầu vào cao đến mức việc làm phẳng nó xuống còn 1 USD/M tạo ra mức giảm hơn 90%. Đối với các tác vụ thuộc gói cơ bản, mức giảm nhỏ hơn nhưng vẫn đáng kể.

Bảng giá cố định mới

Giá mỗi 1 triệu token, USD, có hiệu lực ngay lập tức và vĩnh viễn:

Mô hình Đầu vào Đầu ra Đã lưu cache Ngữ cảnh
MiMo V2.5 Pro $1.00 $3.00 $0.20 1M token
MiMo V2 Flash ~$0.10 ~$0.40 $0.02 256K token

Một vài chi tiết bảng không thể hiện rõ ràng:

Để biết giá V2-Pro cũ làm điểm tham chiếu, hãy xem hướng dẫn định giá MiMo V2-Pro & Omni hiện có của chúng tôi.

MiMo V2.5 mang lại gì ngoài mức giá rẻ hơn

Thông báo ngày 27 tháng 5 là một sự kiện về giá, nhưng bản thân V2.5 cũng là một bản nâng cấp đáng kể so với V2-Pro ra mắt vào tháng 4. Ba thay đổi đáng chú ý:

Không có điều nào trong số này là các điểm chuẩn hàng đầu, nhưng chúng là những thay đổi xuất hiện trong các triển khai sản xuất thực tế. Kết hợp mức giá rẻ hơn với cửa sổ ngữ cảnh đáng tin cậy dài hơn, bạn có một lựa chọn chưa từng tồn tại cho công việc tài liệu dài nghiêm túc trước ngày 27 tháng 5.

MiMo V2.5 so với các đối thủ khác

So sánh thú vị không phải là với phiên bản V2.5 cũ. Mà là so sánh với các tùy chọn API cấp tiên tiến khác ra mắt vào tháng 5 năm 2026:

Mô hình Đầu vào ($/MTok) Đầu ra ($/MTok) Ngữ cảnh
Xiaomi MiMo V2.5 Pro $1.00 $3.00 1M
DeepSeek V4-Pro $0.435 $0.87 128K
GPT-5.5 $5.00 $30.00 200K
Claude Opus 4.7 $3.00 $15.00 200K
Gemini 3.5 Flash ~$1.50 ~$9.00 1M

Ba điểm chính:

Để so sánh về DeepSeek, hãy xem DeepSeek V4-Pro Giảm giá 75% Vĩnh viễn. Hai bài viết này là những bài đọc bổ sung. Cả hai đều đề cập đến việc cắt giảm giá vĩnh viễn cấp tiên tiến trong tuần này từ các phòng thí nghiệm Trung Quốc.

Ba tác vụ, ba hóa đơn mới

Ba trường hợp cụ thể sử dụng mức giá cố định mới:

1. RAG tài liệu dài trên các tệp PDF doanh nghiệp. 50.000 truy vấn/ngày, ngữ cảnh 800K token mỗi truy vấn, câu trả lời 1K token. Gói ngữ cảnh dài MiMo V2.5 cũ (tỷ lệ hiệu dụng ước tính 50 USD/M): khoảng 60.000 USD/tháng. Mức giá cố định mới: khoảng 1.225 USD/tháng. Tiết kiệm: 58.775 USD/tháng.

2. Đại lý đánh giá mã. 5.000 yêu cầu kéo/ngày, ngữ cảnh kho chứa 30K token, đầu ra bình luận 2K token. Hóa đơn hàng tháng GPT-5.5 cũ: khoảng 5.250 USD. MiMo V2.5 mới: khoảng 510 USD. Tiết kiệm: 4.740 USD/tháng.

3. Chatbot hỗ trợ khách hàng. 200.000 lượt/ngày, lời nhắc hệ thống 4K token, phản hồi 300 token. Hóa đơn hàng tháng Claude Opus 4.7 cũ: khoảng 11.250 USD. MiMo V2.5 mới: khoảng 805 USD. Tiết kiệm: 10.445 USD/tháng.

Tác vụ số 1 là nơi MiMo V2.5 tách biệt với phần còn lại. Các tác vụ ngữ cảnh dài đã từng quá đắt đỏ trên mọi API tiên tiến trước khi có đợt cắt giảm này. Giờ thì không còn nữa. Các tài liệu tương tự mà trước đây phải gửi đến các công cụ tóm tắt và quy trình phân đoạn giờ đây có thể được đưa trực tiếp vào mô hình, mà không cần phải thực hiện các thao tác cân bằng ngân sách token.

Một ghi chú ngắn về lượt truy cập bộ nhớ cache

Tỷ lệ đầu vào được lưu cache 0,20 USD/M rẻ hơn 5 lần so với tỷ lệ input-miss 1,00 USD. Đó là một mức chiết khấu cache nhỏ hơn so với tỷ lệ 120:1 của DeepSeek, nhưng nó vẫn có ý nghĩa đối với bất kỳ tác nhân nào tái sử dụng một lời nhắc hệ thống ổn định.

Một ví dụ minh họa. Giả sử trợ lý của bạn sử dụng lời nhắc hệ thống 6.000 token và xử lý 80.000 lượt trò chuyện mỗi ngày, với tin nhắn người dùng trung bình là 250 token đầu vào và phản hồi trung bình là 600 token đầu ra:

Đó không phải là mức cache 88% mà DeepSeek mang lại, nhưng với một tác vụ có chi phí đầu vào 500 USD/ngày, giảm một nửa là một khoản tiền đáng kể. Hãy ghim lời nhắc hệ thống, sắp xếp ngữ cảnh truy xuất một cách ổn định và không chèn dấu thời gian theo yêu cầu vào tiền tố. Các quy tắc tương tự giúp đạt được lượt truy cập cache ở mọi nơi khác cũng áp dụng ở đây.

Khi nào MiMo V2.5 là lựa chọn phù hợp, khi nào không

Mức giá mới biến MiMo V2.5 thành lựa chọn mặc định cho hai loại tác vụ và là lựa chọn kém cho một loại.

Lựa chọn đúng:

Lựa chọn kém:

Lưu ý:

Để biết bối cảnh ra mắt V2-Pro đã tạo tiền đề cho V2.5, hãy xem Xiaomi Vừa Ra Mắt Mô Hình AI Riêng, Và Nó Miễn Phí Trên OpenRouter. Để tham gia gói miễn phí, chương trình 100T token miễn phí Xiaomi MiMo Orbit bao gồm điều kiện và cách đăng ký.

Kiểm tra MiMo V2.5 với Apidog

Khả năng tương thích OpenAI của nền tảng là tốt, nhưng chưa hoàn hảo. Hãy xác minh tích hợp của bạn trước khi chuyển sang lưu lượng sản xuất.

Apidog cho phép bạn gửi yêu cầu Hoàn thành trò chuyện (Chat Completions) tới https://platform.xiaomimimo.com/v1 bằng khóa API MiMo của bạn, sau đó:

Tải xuống Apidog, nhập lược đồ Hoàn thành trò chuyện OpenAI, thay đổi URL cơ sở và bạn sẽ có một bộ công cụ kiểm thử V2.5 hoạt động trong vòng chưa đầy mười phút. Quy trình làm việc tương tự mà chúng tôi đã khuyến nghị trong Cách sử dụng API DeepSeek V4.

Cuộc chiến giá LLM năm 2026 đang diễn ra như thế nào

MiMo V2.5 là đợt cắt giảm vĩnh viễn cấp tiên tiến thứ hai từ một phòng thí nghiệm Trung Quốc chỉ trong một tuần. DeepSeek đã giảm giá V4-Pro vĩnh viễn xuống còn 1/4 giá niêm yết vào ngày 22 tháng 5. Kimi K2 đã cắt giảm giá sớm hơn vào Quý 1. OpenAI O3 đã giảm 80% vào tháng 2. Rõ ràng là có một xu hướng:

Để biết thêm về bức tranh này:

Điều này ảnh hưởng đến việc xây dựng của bạn như thế nào

Việc cắt giảm giá MiMo V2.5 không phải là một chiêu trò tiếp thị. Đó là một sự định giá lại mang tính cấu trúc của gói ngữ cảnh 1M, và việc cắt giảm là vĩnh viễn. Nếu bạn đã trì hoãn các tác vụ RAG tài liệu dài, các tác nhân mã hóa trên toàn kho chứa, hoặc bất kỳ tác vụ nào yêu cầu ngữ cảnh >200K token vì lý do chi phí, thì ngân sách bạn đã định giá quý trước có thể đã đánh giá quá cao nhu cầu của quý này gấp nhiều lần.

Ba bước tiếp theo cụ thể:

Mức giá sàn đã thay đổi một lần nữa. Hãy xây dựng phù hợp.

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API