Berapa Biaya Menggunakan Xiaomi MiMo V2.5 di Tahun 2026?

Ashley Innocent

Ashley Innocent

29 May 2026

Berapa Biaya Menggunakan Xiaomi MiMo V2.5 di Tahun 2026?

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

Harga API Xiaomi MiMo V2.5 turun menjadi $1 per juta token masukan dan $3 per juta token keluaran pada tanggal 27 Mei 2026, dan tim membuat tarif baru ini permanen. Tingkat konteks panjang yang lama, di mana _prompt_ di atas 256K token memiliki pengganda yang tinggi dari tarif dasar, sudah tidak ada lagi. Sekarang hanya ada satu harga, terlepas dari panjang konteks. Untuk sebagian besar beban kerja, intinya adalah satu kalimat: MiMo V2.5 adalah salah satu dari tiga model dengan konteks 1 juta token termurah dalam produksi, dan akan tetap seperti itu.

Ringkasan Cepat

Apa yang Berubah pada 27 Mei 2026

Pemberitahuan pembaruan harga resmi Xiaomi menjelaskan tiga perubahan. Ketiganya mulai berlaku pada pukul 00:00 waktu Beijing tanggal 27 Mei, yaitu pukul 16:00 UTC tanggal 26 Mei.

1. Harga tetap di semua jendela konteks. Jadwal MiMo V2.5 yang lama menggunakan tarif berjenjang: harga dasar untuk _prompt_ hingga 32K token masukan, pengganda untuk rentang 32K hingga 256K, dan tarif yang lebih tinggi di atas 256K. Jadwal baru memiliki satu angka per jenis token. Aplikasi konteks panjang berhenti membayar 'pajak' konteks panjang.

2. Permanen, bukan promosi. Pemberitahuan tersebut menggunakan frasa “Penurunan Harga Permanen” dua kali dan “secara permanen merenovasi seluruh sistem penetapan harga model” sekali. Tidak ada tanggal kedaluwarsa. Tidak ada klausa pembalikan. Perlakukan ini sebagai harga daftar baru.

3. _Reset_ hadiah Paket Token. Jika Anda menggunakan Paket Token (sistem kuota prabayar Xiaomi), saldo kredit Anda ditingkatkan 5 hingga 8 kali dan setiap kredit yang telah Anda konsumsi dalam periode validitas Anda dikembalikan. Periode validitas itu sendiri tidak diperpanjang, jadi paket yang ada mendapatkan keuntungan anggaran tetapi tidak lebih banyak waktu.

Klaim utama “diskon hingga 99%” berlaku khusus untuk rentang konteks panjang. Harga sebelumnya untuk 256K+ token masukan cukup tinggi sehingga meratakannya menjadi $1/M menghasilkan pengurangan lebih dari 90%. Untuk beban kerja yang berada di tingkat dasar, pemotongan lebih kecil tetapi tetap signifikan.

Daftar Harga Permanen Baru

Harga per 1 juta token, USD, berlaku segera dan permanen:

Model Masukan Keluaran _Cached_ Konteks
MiMo V2.5 Pro $1,00 $3,00 $0,20 1 juta token
MiMo V2 Flash ~$0,10 ~$0,40 $0,02 256 ribu token

Beberapa detail yang tidak dijelaskan secara gamblang oleh tabel:

Untuk harga V2-Pro yang lebih lama sebagai titik referensi, lihat panduan harga MiMo V2-Pro & Omni kami yang permanen.

Apa yang Ditawarkan MiMo V2.5 Selain Harga yang Lebih Murah

Pengumuman 27 Mei adalah peristiwa penetapan harga, tetapi V2.5 sendiri juga merupakan peningkatan yang signifikan dari V2-Pro yang diluncurkan pada bulan April. Tiga perubahan yang patut dicatat:

Tidak ada di antara ini yang merupakan tolok ukur utama, tetapi inilah perubahan yang muncul dalam penerapan produksi nyata. Padukan harga yang lebih murah dengan jendela konteks yang lebih panjang dan andal, dan Anda memiliki pilihan yang belum ada untuk pekerjaan dokumen panjang yang serius sebelum 27 Mei.

Bagaimana MiMo V2.5 Bersaing dengan Model Lain di Pasaran

Perbandingan yang menarik bukanlah dengan V2.5 versi lama. Ini adalah perbandingan dengan opsi API _frontier-tier_ lainnya yang tersedia pada Mei 2026:

Model Masukan ($/MTok) Keluaran ($/MTok) Konteks
Xiaomi MiMo V2.5 Pro $1,00 $3,00 1 Juta
DeepSeek V4-Pro $0,435 $0,87 128 Ribu
GPT-5.5 $5,00 $30,00 200 Ribu
Claude Opus 4.7 $3,00 $15,00 200 Ribu
Gemini 3.5 Flash ~$1,50 ~$9,00 1 Juta

Tiga poin penting:

Untuk perbandingan sisi DeepSeek ini, lihat Pemotongan Harga Permanen DeepSeek V4-Pro sebesar 75%. Kedua artikel ini adalah bacaan pelengkap. Keduanya membahas pemotongan harga _frontier-tier_ permanen minggu ini dari laboratorium Tiongkok.

Tiga Beban Kerja, Tiga Tagihan Baru

Tiga kasus konkret menggunakan tarif permanen baru:

1. RAG dokumen panjang atas PDF perusahaan. 50.000 _query_/hari, konteks 800K token per _query_, jawaban 1K token. MiMo V2.5 tingkat konteks panjang lama (perkiraan tarif efektif $50/M): sekitar $60.000/bulan. Tarif tetap baru: sekitar $1.225/bulan. Penghematan: $58.775/bulan.

2. Agen peninjau kode. 5.000 _pull request_/hari, konteks repo 30K token, keluaran komentar 2K token. Tagihan bulanan GPT-5.5 lama: sekitar $5.250. MiMo V2.5 baru: sekitar $510. Penghematan: $4.740/bulan.

3. _Chatbot_ dukungan pelanggan. 200.000 putaran/hari, _system prompt_ 4K token, respons 300 token. Tagihan bulanan Claude Opus 4.7 lama: sekitar $11.250. MiMo V2.5 baru: sekitar $805. Penghematan: $10.445/bulan.

Beban kerja #1 adalah di mana MiMo V2.5 membedakan diri dari yang lain. Pekerjaan konteks panjang sangat mahal di setiap API _frontier_ sebelum pemotongan ini. Sekarang tidak lagi. Dokumen yang sama yang dulu dikirim ke _summarizer_ dan _chunking pipeline_ kini dapat langsung masuk ke model secara utuh, tanpa _gymnastics_ anggaran token.

Catatan Singkat tentang _Cache Hits_

Tarif masukan _cached_ $0,20/M 5x lebih murah daripada tarif _cache-miss_ $1,00. Itu adalah diskon _cache_ yang lebih kecil dibandingkan rasio 120:1 DeepSeek, tetapi masih signifikan untuk agen apa pun yang menggunakan kembali _system prompt_ yang stabil.

Contoh penerapan. Misalkan asisten Anda menggunakan _system prompt_ 6.000 token dan menangani 80.000 giliran obrolan per hari, dengan rata-rata pesan pengguna 250 token masukan dan rata-rata respons 600 token keluaran:

Itu bukan 88% yang diberikan oleh _caching_ DeepSeek, tetapi pada beban kerja yang menghabiskan $500/hari untuk masukan, setengah harga adalah uang sungguhan. Tetapkan _system prompt_, urutkan konteks yang diambil secara stabil, dan jangan menyuntikkan _timestamp_ per permintaan ke dalam _prefix_. Aturan yang sama yang menghasilkan _cache hits_ di tempat lain juga berlaku di sini.

Kapan MiMo V2.5 Tepat Digunakan, dan Kapan Tidak

Harga baru menjadikan MiMo V2.5 pilihan _default_ untuk dua kelas beban kerja dan pilihan yang buruk untuk satu kelas.

Pilihan tepat:

Pilihan buruk:

Peringatan:

Untuk konteks peluncuran V2-Pro yang menjadi dasar V2.5, lihat Xiaomi Baru Saja Merilis Model AI-nya Sendiri, dan Gratis di OpenRouter. Untuk akses tingkat gratis, program 100T token gratis Xiaomi MiMo Orbit mencakup kelayakan dan pendaftaran.

Menguji MiMo V2.5 dengan Apidog

Kompatibilitas platform dengan OpenAI baik, tetapi tidak sempurna. Verifikasi integrasi Anda sebelum Anda mengarahkan lalu lintas produksi.

Apidog memungkinkan Anda mengarahkan permintaan Chat Completions ke https://platform.xiaomimimo.com/v1 dengan kunci API MiMo Anda, kemudian:

Unduh Apidog, impor skema OpenAI Chat Completion, ubah URL dasar, dan Anda memiliki _test harness_ V2.5 yang berfungsi dalam waktu kurang dari sepuluh menit. Alur kerja yang sama kami rekomendasikan di Cara menggunakan API DeepSeek V4.

Bagaimana Perang Harga LLM 2026 Terjadi

MiMo V2.5 adalah pemotongan harga _frontier-tier_ permanen kedua dari laboratorium Tiongkok dalam satu minggu. DeepSeek menjadikan V4-Pro permanen dengan harga 1/4 dari harga daftar pada 22 Mei. Kimi K2 memotong harga lebih awal di Q1. OpenAI O3 turun 80% pada bulan Februari. Polanya jelas:

Untuk gambaran selengkapnya:

Dampak pada Pengembangan Anda

Pemotongan harga MiMo V2.5 bukanlah _stunt_ pemasaran. Ini adalah penyesuaian harga struktural pada tingkat konteks 1 juta token, dan pemotongan ini permanen. Jika Anda menunda RAG dokumen panjang, agen kode di seluruh repo, atau beban kerja apa pun yang membutuhkan konteks >200K token karena alasan biaya, anggaran yang Anda perkirakan kuartal lalu mungkin melebih-lebihkan kebutuhan kuartal ini hingga satu tingkat besaran.

Tiga langkah konkret selanjutnya:

Batas harga dasar bergerak lagi. Bangunlah sesuai dengan itu.

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.