MiniMax M3 adalah model AI berbobot terbuka yang dirilis MiniMax pada 1 Juni 2026. Ini adalah model berbobot terbuka pertama yang menggabungkan tiga hal dalam satu sistem: pengkodean tingkat terdepan, jendela konteks hingga 1.000.000 token, dan multimodalitas asli yang menangani masukan gambar dan video serta bahkan dapat mengoperasikan komputer desktop.
Kombinasi tersebut adalah inti utamanya. Banyak model yang melakukan satu atau dua hal ini dengan baik. M3 adalah yang pertama yang dapat Anda jalankan dengan bobot Anda sendiri yang bertujuan untuk melakukan ketiganya sekaligus. MiniMax juga telah berjanji untuk menerbitkan bobot terbuka dan laporan teknis lengkap dalam waktu sekitar 10 hari setelah peluncuran, sehingga model yang Anda baca hari ini akan menjadi sesuatu yang dapat Anda host sendiri segera setelahnya. Jika Anda telah mengikuti perlombaan model berbobot terbuka melalui rilis seperti Qwen 3.7, M3 adalah entri besar berikutnya, dan detail peluncurannya berasal langsung dari pengumuman MiniMax M3.
Artikel ini membahas tentang apa itu M3, tolok ukur yang dilaporkan MiniMax, bagaimana arsitekturnya menjaga biaya konteks panjang tetap rendah, apa yang dapat Anda bangun dengannya, dan cara mendapatkan akses.
Apa yang Membuat M3 Berbeda
Kebanyakan model terdepan memaksa adanya pertukaran. Anda bisa memiliki pengkodean yang kuat, atau jendela konteks yang besar, atau masukan multimodal, tetapi jarang ketiganya dalam satu model terbuka. M3 mengklaim bahwa Anda tidak perlu lagi memilih.

Berikut adalah penyatuan tiga arah dalam istilah yang sederhana:
- Pengkodean terdepan. M3 menargetkan tingkat yang sama dengan model tertutup terkuat pada tolok ukur pengkodean dan perangkat lunak agen, bukan hanya yang terbuka.
- Konteks 1 juta token. Anda dapat memberinya hingga satu juta token sekaligus. Itu berarti basis kode yang besar, set dokumen yang panjang, atau riwayat obrolan lengkap tanpa pemotongan agresif.
- Multimodalitas asli. Ia menerima gambar dan video sebagai masukan, dan dapat menggerakkan komputer desktop secara langsung. MiniMax mendemonstrasikannya membuka klien ERP lokal dan memasukkan faktur secara massal dengan sendirinya.
Aspek bobot terbuka adalah yang menyatukan ini. Ketika bobot bersifat publik, Anda dapat melakukan self-hosting untuk pekerjaan yang sensitif terhadap data, menyetel halus pada domain Anda sendiri, dan menghindari ketergantungan pada vendor per panggilan. Menggabungkan kebebasan itu dengan pengkodean terdepan dan jendela satu juta token adalah bagian yang belum pernah ada dalam satu paket sebelumnya. Untuk gambaran tentang bagaimana bidang yang lebih luas bergerak ke arah ini, perang harga LLM Tiongkok tahun 2026 mencakup tekanan kompetitif yang mendorong model seperti ini ke ranah terbuka.
Angka-angka Penting
MiniMax menerbitkan serangkaian hasil tolok ukur saat peluncuran. Ini adalah angka yang dilaporkan vendor, jadi perlakukan sebagai pengukuran MiniMax sendiri daripada skor pihak ketiga independen. Dengan peringatan tersebut, berikut adalah posisi M3.

Hasil yang patut dicermati adalah SWE-Bench Pro sebesar 59,0%. SWE-Bench Pro adalah kumpulan tugas rekayasa perangkat lunak nyata yang sulit dan tahan kontaminasi; Anda dapat membaca lebih lanjut tentang metodologinya di situs proyek SWE-Bench. MiniMax melaporkan bahwa M3 melampaui GPT-5.5 dan Gemini 3.1 Pro di dalamnya dan mendekati Claude Opus 4.7. Untuk model berbobot terbuka, itu adalah klaim yang kuat.
M3 tidak unggul di semua tempat. Pada PostTrainBench, ia mencetak 0,37, sedikit di belakang Opus 4.7 (0,42) dan GPT-5.5 (0,39). Satu celah jujur di papan skor terlihat lebih kredibel daripada kemenangan telak.
Satu detail yang belum diungkapkan MiniMax: jumlah parameter dan angka parameter aktif. Angka-angka tersebut diharapkan akan disertakan dalam laporan teknis, jadi untuk saat ini Anda tidak dapat menghitung perbandingan biaya per parameter yang tepat. Jika Anda ingin perbandingan langsung dengan model terdepan yang tertutup, lihat MiniMax M3 vs Opus 4.7 vs GPT-5.5.
Arsitektur MSA dalam Bahasa Sederhana
Efisiensi M3 berasal dari MSA, singkatan dari MiniMax Sparse Attention. Perhatian standar membandingkan setiap token dengan setiap token lainnya, sehingga biaya meningkat pesat seiring dengan panjangnya konteks Anda. Itulah yang membuat jendela satu juta token mahal pada arsitektur konvensional.

Perhatian jarang mengubah perhitungannya. Alih-alih memperhatikan segalanya, setiap token memperhatikan subset urutan yang dipilih. MiniMax melaporkan bahwa ini memangkas komputasi per-token menjadi sekitar 1/20 dari model generasi sebelumnya. Manfaat praktisnya terlihat dalam dua fase inferensi:
- Prefill (membaca prompt Anda) lebih dari 9x lebih cepat.
- Decode (menghasilkan respons) lebih dari 15x lebih cepat.
Mengapa itu penting bagi Anda? Pekerjaan konteks panjang biasanya lambat dan mahal, yang mendorong tim menuju solusi chunking dan pengambilan data. Ketika biaya per-token turun sebesar satu tingkat besaran, memasukkan seluruh repositori atau tumpukan dokumen panjang langsung ke dalam model menjadi praktis alih-alih masalah anggaran. Peningkatan kecepatan juga berarti latensi yang lebih rendah pada loop agen, di mana model membaca, bertindak, dan membaca lagi berkali-kali.
Apa yang Benar-benar Dapat Anda Bangun
M3 dibangun untuk pekerjaan agen berjangka panjang, jenis di mana model berjalan dalam jangka waktu yang lama dan menghasilkan sesuatu yang konkret. MiniMax menghadirkan beberapa demonstrasi yang menunjukkan cakupannya:
- Optimasi kernel CUDA 24 jam. M3 bekerja pada kernel secara otonom dan mencapai peningkatan kecepatan 9,4x.
- Reproduksi makalah otonom. Ini mereproduksi makalah penelitian melalui 18 commit dan menghasilkan 23 angka eksperimental, mengelola proses multi-langkah dengan sendirinya.
- Penggunaan komputer. Ini dapat mengoperasikan aplikasi desktop secara langsung, seperti membuka klien ERP lokal dan memasukkan faktur secara massal.
Pembungkus produk untuk ini adalah MiniMax Code, yang menambahkan Tim Agen yang memiliki: alur kerja multi-tahap, bersamaan, dan dapat disesuaikan secara dinamis. Salah satu pola yang patut disoroti adalah loop pengujian adversarial "Produser plus Verifikator", di mana satu agen menghasilkan pekerjaan dan agen lain memeriksanya sebelum diterima. Desain pemeriksa dalam loop tersebut cenderung mengurangi kegagalan diam-diam yang menghantui agen satu-jalur.
Jika Anda membangun agen di atas M3, bagian yang sulit jarang pada modelnya; melainkan pada penghubung antara model dan alat Anda. Skema panggilan alat bergeser, argumen kembali tidak terformat, dan satu respons buruk dapat menghentikan seluruh alur kerja. Di sinilah pengujian API berperan penting. Anda dapat menangkap respons panggilan alat M3 dan memvalidasi strukturnya di Apidog, sehingga Anda menangkap panggilan fungsi yang rusak sebelum mencapai produksi. Untuk sisi desain pekerjaan tersebut, pengkabelan alat alur kerja agen: pola dan jebakan mencakup jebakan umum.
Cara Mengakses M3
Saat ini MiniMax memiliki dua jalur: paket token berlangganan dan API.

Paket berlangganan mencakup jatah token bulanan
Untuk akses terprogram, API menggunakan antarmuka chat-completions gaya OpenAI. URL dasarnya adalah https://api.minimax.io/v1, Anda memanggil POST /chat/completions, dan ID modelnya adalah MiniMax-M3. Autentikasi adalah token bearer di header:
POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json
Anda dapat memanggilnya melalui HTTP mentah, melalui Anthropic SDK (jalur yang direkomendasikan MiniMax), atau melalui OpenAI SDK. Referensi API MiniMax resmi memiliki skema lengkap.
Dua detail harga yang perlu diketahui. Panggilan API ditagih dengan tarif standar saat masukan Anda 512K token atau kurang, dan dengan tarif konteks panjang yang lebih tinggi di atas 512K, sehingga prompt yang sangat besar biayanya lebih mahal per panggilan. Ada juga dua tingkat layanan: standar (default) dan prioritas. MiniMax belum menerbitkan harga per-token yang pasti, jadi konfirmasikan tarif saat ini di dokumen sebelum Anda membuat anggaran.
Untuk pengaturan langkah demi langkah dengan permintaan yang berfungsi, lihat cara menggunakan API MiniMax M3. Jika Anda lebih suka mencobanya tanpa membayar, cara menggunakan MiniMax M3 secara gratis mencakup opsi tanpa biaya. Setelah Anda memiliki kunci, Unduh Apidog untuk mengirim permintaan pertama Anda dan memeriksa bentuk respons sebelum Anda menulis kode aplikasi apa pun.
Perbandingannya dengan Model Berbobot Terbuka Lainnya
M3 hadir di tengah ramai-ramainya model berbobot terbuka, banyak di antaranya dari lab Tiongkok yang sangat agresif dalam harga dan kemampuan. Pesaing saat ini termasuk DeepSeek V4-pro, Qwen 3.7, Kimi k2.6, dan GLM-5.1. Masing-masing memiliki kekuatannya sendiri di bidang pengkodean, penalaran, dan pekerjaan multibahasa.
Pembeda M3 bukanlah skor tunggal; melainkan paketnya. Sedikit rekan model berbobot terbuka yang menggabungkan pengkodean terdepan dengan jendela 1 juta token yang sebenarnya dan penggunaan komputer secara asli dalam model yang sama. Perbandingan terdekat cenderung unggul pada satu aspek sementara M3 menyebarkan taruhannya pada ketiganya. Namun, laporan teknis dan bobot terbuka belum dirilis, jadi tolok ukur independen akan menjadi ujian sebenarnya. Jika Anda sudah menjalankan model terbuka lainnya, ikhtisar Qwen 3.7 adalah titik referensi yang berguna untuk mengetahui apa yang M3 lawan.
FAQ
Apakah MiniMax M3 sumber terbuka? Ini berbobot terbuka. MiniMax telah berjanji untuk menerbitkan bobot model dan laporan teknis dalam waktu sekitar 10 hari setelah peluncuran 1 Juni 2026. Saat penulisan ini, bobot tersebut belum keluar, jadi Anda tidak dapat mengunduh dan self-host hari ini. Setelah MiniMax merilis bobot sumber terbuka, Anda akan dapat menjalankan M3 di infrastruktur Anda sendiri.
Berapa jendela konteksnya? Hingga 1.000.000 token. Arsitektur MSA adalah yang membuat jendela sebesar itu terjangkau, karena memangkas komputasi per-token menjadi sekitar 1/20 dari model generasi sebelumnya.
Apakah MiniMax M3 gratis? Tidak secara langsung. MiniMax menjual paket token berlangganan mulai dari $20/bulan (Plus) dan akses API yang ditagih berdasarkan token. Tidak ada tingkatan gratis yang dipublikasikan dari MiniMax sendiri, meskipun cara menggunakan MiniMax M3 secara gratis membahas rute tanpa biaya yang tersedia.
Bagaimana perbandingan M3 dengan Claude Opus 4.7? Berdasarkan tolok ukur yang dilaporkan MiniMax, M3 mendekati Opus 4.7 pada SWE-Bench Pro (59,0%) dan mengalahkannya pada SVG-Bench, sementara tertinggal pada PostTrainBench (0,37 vs 0,42). Ini adalah angka vendor, jadi tunggu pengujian independen sebelum menganggap angka tunggal apa pun sebagai final.
Kapan bobotnya akan dirilis? MiniMax berkomitmen untuk merilis bobot terbuka dan laporan teknis dalam waktu sekitar 10 hari setelah peluncuran 1 Juni 2026. Laporan teknis juga seharusnya mengisi jumlah parameter, yang belum diungkapkan MiniMax.
Bisakah M3 menangani gambar dan video? Ya. M3 bersifat multimodal asli dan menerima masukan gambar dan video. Ini juga selangkah lebih maju dengan penggunaan komputer, mengoperasikan aplikasi desktop secara langsung daripada hanya menggambarkan apa yang ada di layar.
Versi Singkat
MiniMax M3 adalah model berbobot terbuka pertama yang menggabungkan pengkodean terdepan, jendela konteks 1 juta token, dan multimodalitas asli dalam satu tempat. Arsitektur MSA menjaga biaya konteks panjang tetap rendah, skor SWE-Bench Pro yang dilaporkan menempatkannya mendekati batas tertutup, dan bobot terbuka akan dirilis dalam beberapa hari setelah peluncuran. Celah yang jujur, jumlah parameter yang belum diungkapkan, dan beberapa tolok ukur di mana ia tertinggal, patut dipantau seiring dengan masuknya hasil independen. Jika Anda siap untuk membangun di atasnya, dapatkan kunci API, uji panggilan pertama Anda dan respons alat di Apidog, dan mulai dari skala kecil sebelum Anda memperbesar.
