Cara Menggunakan API MiniMax M3

Cara menggunakan API MiniMax M3: dapatkan kunci, lakukan panggilan pertama Anda, aktifkan/nonaktifkan pemikiran, tangani konteks 1 juta token, dan uji permintaan di Apidog.

Ashley Innocent

Ashley Innocent

1 June 2026

Cara Menggunakan API MiniMax M3

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

MiniMax M3 adalah model penalaran dan pengkodean terdepan dengan jendela konteks hingga 1.000.000 token. Angka tersebut adalah daya tarik utamanya. Anda dapat memberinya seluruh repositori, log seminggu penuh, atau dokumen desain yang panjang dan memintanya untuk melakukan penalaran di semua itu dalam satu panggilan. Jika Anda ingin mengetahui latar belakang tentang apa model ini dan di mana posisinya, bacalah apa itu MiniMax M3 terlebih dahulu.

Panduan ini adalah versi praktis. Anda akan mendapatkan kunci API, mengirim permintaan pertama Anda dengan tiga cara berbeda, dan menguji setiap langkah di Apidog sehingga Anda dapat melihat permintaan dan respons mentah sebelum Anda mengintegrasikan apa pun ke dalam kode Anda sendiri. Unduh Apidog jika Anda ingin mengikutinya.

Referensi resmi terdapat di dokumentasi API MiniMax. Biarkan terbuka di tab.

Yang Anda perlukan

Anda tidak memerlukan instalasi tambahan untuk contoh curl. Untuk contoh SDK, Anda memerlukan Python 3.8+ atau Node 18+.

Langkah 1: Dapatkan kunci API Anda

Masuk di platform.minimax.io, buka bagian kunci API akun Anda, dan buat kunci baru. MiniMax mengeluarkan dua jenis kredensial, dan perbedaannya penting:

Pilih yang sesuai dengan cara Anda ingin ditagih. Salin kunci sekali dan simpan. Anda tidak akan melihatnya lagi.

Jangan pernah menempelkan kunci langsung ke kode sumber. Ekspor sebagai variabel lingkungan sebagai gantinya:

export MINIMAX_API_KEY="your-key-here"

Ini menjaga rahasia keluar dari riwayat git Anda dan dari file apa pun yang mungkin Anda bagikan. Jika Anda juga bekerja dengan kunci API di dalam editor Anda, aturan kebersihan yang sama berlaku di sana. Kami membahas kebocoran umum di keamanan kunci API ekstensi VS Code.

Langkah 2: Kirim permintaan pertama Anda

URL dasar adalah https://api.minimax.io/v1 dan obrolan berada di POST https://api.minimax.io/v1/chat/completions. Autentikasi adalah token pembawa: Authorization: Bearer $MINIMAX_API_KEY. String ID model adalah MiniMax-M3.

Berikut adalah panggilan berguna terkecil dengan curl. Tugasnya adalah tugas nyata, meminta model untuk merefaktor fungsi:

curl https://api.minimax.io/v1/chat/completions \
 -H "Authorization: Bearer $MINIMAX_API_KEY" \
 -H "Content-Type: application/json" \
 -d '{"model":"MiniMax-M3","messages":[{"role":"user","content":"Refactor this function to be async."}]}'

Anda memiliki tiga cara untuk memanggil M3. MiniMax merekomendasikan Anthropic SDK, tetapi OpenAI SDK dan HTTP mentah keduanya berfungsi pada endpoint yang sama. Gunakan mana pun yang sudah Anda pakai.

Berikut adalah OpenAI SDK di Python. Satu-satunya perubahan dari pengaturan OpenAI normal adalah base_url:

from openai import OpenAI

client = OpenAI(
 base_url="https://api.minimax.io/v1",
 api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
 model="MiniMax-M3",
 messages=[
 {"role": "user", "content": "Refactor this function to be async."}
 ],
)

print(response.choices[0].message.content)

Dan ide yang sama di Node, lagi-lagi hanya mengarahkan ulang URL dasar:

import OpenAI from "openai";

const client = new OpenAI({
 baseURL: "https://api.minimax.io/v1",
 apiKey: process.env.MINIMAX_API_KEY,
});

const response = await client.chat.completions.create({
 model: "MiniMax-M3",
 messages: [
 { role: "user", content: "Refactor this function to be async." },
 ],
});

console.log(response.choices[0].message.content);

Jika Anda pernah menggunakan Qwen 3.7 API, pola ini sudah tidak asing. Sebagian besar model terdepan kini mengekspos antarmuka yang kompatibel dengan OpenAI, sehingga biaya migrasi hanya satu baris. Dokumentasi OpenAI Python SDK dan dokumentasi Anthropic SDK mencakup opsi klien lengkap.

Langkah 3: Uji dan periksa di Apidog

Sebelum Anda menanam panggilan ini di dalam aplikasi, kirimkan secara manual dan baca respons mentahnya. Di situlah Apidog mendapatkan tempatnya dalam lingkaran ini.

  1. Buat permintaan HTTP baru dan atur metode ke POST dengan URL https://api.minimax.io/v1/chat/completions.
  2. Buka panel Lingkungan (Environments) dan tambahkan variabel bernama MINIMAX_API_KEY dengan kunci Anda sebagai nilai. Simpan sebagai variabel lingkungan agar tidak pernah berada di badan permintaan atau dalam koleksi bersama Anda.
  3. Di header permintaan, tambahkan Authorization dengan nilai Bearer {{MINIMAX_API_KEY}}. Apidog akan mengganti variabel tersebut saat pengiriman.
  4. Atur badan ke JSON mentah dan tempel payload yang sama dari contoh curl.
  5. Tekan Kirim (Send) dan perhatikan panel respons.
[Tangkapan layar: permintaan dan respons MiniMax-M3 di Apidog]

Menyimpan token sebagai variabel lingkungan berarti Anda dapat berbagi permintaan dengan rekan tim tanpa membocorkan rahasia, dan Anda dapat menukar kunci (bayar sesuai penggunaan versus langganan) dengan mengubah satu variabel. Saat Anda mengaktifkan streaming nanti, Apidog menampilkan peristiwa yang dikirim server saat tiba, sehingga Anda dapat mengonfirmasi format streaming sebelum menulis kode parsing apa pun. Memeriksa respons secara manual menangkap kejutan skema lebih awal, yang merupakan inti dari pengujian endpoint sebelum Anda mempercayainya.

Langkah 4: Mengaktifkan dan menonaktifkan pemikiran

M3 adalah model penalaran. Secara default, ia mengembalikan jawaban akhir. Anda juga dapat memintanya untuk mengekspos penalaran perantaranya, yang berguna ketika Anda ingin men-debug mengapa ia mencapai suatu kesimpulan atau memberikan penalaran tersebut ke langkah peninjauan.

Dengan OpenAI SDK, teruskan reasoning_split melalui extra_body:

from openai import OpenAI

client = OpenAI(
 base_url="https://api.minimax.io/v1",
 api_key="YOUR_API_KEY",
)

response = client.chat.completions.create(
 model="MiniMax-M3",
 messages=[
 {"role": "user", "content": "Refactor this function to be async."}
 ],
 extra_body={"reasoning_split": True},
)

print(response.choices[0].message.reasoning_details[0]["text"]) # pemikiran
print(response.choices[0].message.content) # jawaban akhir

Ketika reasoning_split diaktifkan, teks pemikiran akan kembali di response.choices[0].message.reasoning_details[0]["text"] dan jawaban akhir tetap berada di response.choices[0].message.content. Pisahkan keduanya di UI Anda. Tampilkan jawaban kepada pengguna, dan simpan penalaran untuk log atau langkah verifikasi.

Aktifkan pemikiran untuk masalah sulit: refaktor multi-langkah, perburuan bug yang rumit, apa pun yang Anda ingin audit rantainya. Nonaktifkan untuk panggilan sederhana yang sensitif terhadap latensi di mana token penalaran tambahan memakan waktu dan uang yang tidak perlu Anda keluarkan.

Langkah 5: Bekerja dengan konteks 1M-token

Jendela konteks yang besar adalah alasan untuk memilih M3. Anda dapat menempelkan seluruh file log dan mengajukan satu pertanyaan untuk seluruh isinya:

with open("production-2026-05-30.log") as f:
 log_text = f.read()

response = client.chat.completions.create(
 model="MiniMax-M3",
 messages=[
 {
 "role": "user",
 "content": f"Find the root cause of the 502 spike at 14:20 UTC.\n\n{log_text}",
 }
 ],
)

Ada batasan penagihan yang perlu Anda ketahui. MiniMax mengenakan tarif standar untuk panggilan dengan 512K token input atau kurang, dan tarif konteks panjang yang lebih tinggi setelah input melebihi 512K token. Jadi, lompatan dari prompt 400K-token ke prompt 600K-token tidak linear. Ini melintasi ambang batas harga.

Pelajaran praktisnya: jangan membuang jutaan token ke dalam konteks karena kebiasaan. Kirimkan bagian yang dibutuhkan model. Jika Anda merangkai banyak panggilan dalam sebuah agen, pemangkasan konteks per panggilan adalah salah satu pengungkit terbesar pada tagihan Anda. Kami akan membahas lebih dalam mengenai hal itu di cara mengurangi biaya token agen.

Langkah 6: Pemanggilan alat dan input multimodal

M3 menangani pemanggilan alat dan input multimodal, sehingga dapat menggerakkan agen dan membaca gambar, tidak hanya teks.

Untuk pemanggilan alat, Anda mendeklarasikan alat yang diizinkan untuk dipanggil oleh model, lalu menangani panggilan yang dikembalikannya:

tools = [
 {
 "type": "function",
 "function": {
 "name": "run_tests",
 "description": "Run the test suite for a given module path.",
 "parameters": {
 "type": "object",
 "properties": {
 "module": {"type": "string"},
 },
 "required": ["module"],
 },
 },
 }
]

response = client.chat.completions.create(
 model="MiniMax-M3",
 messages=[
 {"role": "user", "content": "Fix the failing test in auth/session.py and confirm it passes."}
 ],
 tools=tools,
)

Ketika model memutuskan untuk memanggil alat, responsnya membawa array tool_calls. Kode Anda menjalankan fungsi, menambahkan hasilnya sebagai pesan tool, dan memanggil API lagi agar model dapat melanjutkan. Memahami proses ini dengan benar adalah di mana sebagian besar bug agen berada. Pola pengkabelan dan mode kegagalan layak dibaca sebelum Anda mengimplementasikannya: pengkabelan alat alur kerja agensi.

Apidog juga membantu di sini. Anda dapat memutar ulang seluruh pertukaran multi-giliran (permintaan awal, respons panggilan alat, hasil alat Anda, tindak lanjut) sebagai permintaan tersimpan terpisah, sehingga Anda dapat memverifikasi setiap langkah dari awal hingga akhir alih-alih menebak di dalam runtime agen Anda.

Untuk input multimodal, Anda meneruskan konten gambar dalam array pesan yang sama, di samping prompt teks Anda, mengikuti bentuk bagian konten standar. Periksa referensi API untuk nama bidang yang tepat, karena ini berkembang lebih cepat daripada endpoint teks.

Harga dan tingkatan

Dua kontrol terpisah mengatur apa yang Anda bayar dan seberapa cepat Anda dilayani.

Paket token menentukan anggaran kredit Anda. Tingkatan langganan adalah Plus seharga $20, Max seharga $50, dan Ultra seharga $120, masing-masing menggabungkan kumpulan kredit token yang lebih besar yang digunakan oleh Kunci Langganan Anda. Pembayaran sesuai penggunaan (Pay-as-you-go) menagih Kunci API reguler terhadap saldo Anda sebagai gantinya.

Tingkatan layanan menentukan prioritas penjadwalan. Ada dua: standar (default) dan prioritas. Standar baik untuk sebagian besar beban kerja. Prioritas adalah untuk lalu lintas yang sensitif terhadap latensi atau terikat SLA yang tidak dapat menunggu dalam antrean di belakang yang lain.

Tambahkan itu di atas tarif standar versus konteks panjang dari Langkah 5, dan biaya riil Anda tergantung pada ukuran input, paket, dan tingkatan secara bersamaan. Untuk angka per token saat ini, periksa halaman harga dan model MiniMax serta dokumentasi API, karena tarif yang dipublikasikan dapat berubah.

FAQ

Apakah ada cara gratis untuk mencoba M3? Ya. Anda dapat menguji model tanpa berkomitmen pada suatu paket, dan ada beberapa cara tanpa biaya. Kami mengumpulkannya di cara menggunakan MiniMax M3 secara gratis.

SDK mana yang berfungsi dengan API? Tiga pilihan: HTTP mentah, Anthropic SDK, dan OpenAI SDK. MiniMax merekomendasikan Anthropic SDK, tetapi ketiganya menggunakan endpoint yang sama https://api.minimax.io/v1/chat/completions. Untuk klien OpenAI dan Anthropic, Anda hanya perlu mengubah base_url untuk menunjuk ke MiniMax.

Bagaimana cara melakukan streaming respons? Tambahkan "stream": true ke badan permintaan Anda. API mengembalikan peristiwa yang dikirim server, dan kedua SDK mengekspos iterator yang dapat Anda ulangi untuk membaca potongan data saat tiba. Uji streaming di Apidog terlebih dahulu agar Anda dapat melihat format peristiwa sebelum Anda menguraikannya.

Berapa batas tarifnya? Batas tergantung pada tingkatan akun Anda dan apakah Anda menggunakan layanan standar atau prioritas. Jika Anda mendapatkan 429, mundur dan coba lagi, atau pindahkan lalu lintas yang sensitif terhadap latensi ke tingkatan prioritas. Angka-angka saat ini ada di dasbor akun Anda dan dokumentasi API.

Bagaimana ambang batas 512K memengaruhi tagihan saya? Panggilan dengan input 512K token atau kurang ditagih dengan tarif standar. Setelah melewati 512K token input, tarif konteks panjang yang lebih tinggi berlaku. Pangkas prompt Anda ke token yang benar-benar dibutuhkan model, terutama dalam loop agen di mana biaya bertambah pada setiap panggilan.

Bisakah saya menghosting bobot sendiri alih-alih memanggil API? API yang di-host adalah jalur yang dibahas panduan ini, dan ini adalah cara tercepat untuk memulai. Self-hosting tergantung pada apa yang MiniMax publikasikan untuk M3 pada waktu tertentu, jadi periksa halaman model untuk situasi bobot dan lisensi saat ini.

Penutup

Anda sekarang memiliki segalanya untuk memanggil MiniMax M3: kunci API yang disimpan sebagai variabel lingkungan, permintaan curl, Python, dan Node yang berfungsi, pengalih pemikiran, ambang batas penagihan 512K, dan proses panggilan alat. Cara tercepat untuk memahaminya adalah dengan menjalankan satu panggilan nyata secara manual. Masukkan endpoint ke Apidog, simpan token pembawa Anda sebagai variabel lingkungan, kirim prompt refaktor, dan baca responsnya. Setelah Anda melihat bentuk mentahnya, mengintegrasikannya ke dalam kode Anda hanya membutuhkan beberapa menit.

button

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.