MiniMax M3, 1.000.000 tokene kadar bağlam penceresine sahip, öncü bir akıl yürütme ve kodlama modelidir. Bu sayı manşet niteliğindedir. Ona tüm bir depoyu, bir haftalık günlükleri veya uzun bir tasarım belgesini besleyebilir ve tek bir çağrıda hepsini akıl yürütmesini isteyebilirsiniz. Modelin ne olduğu ve nerede konumlandığı hakkında arka plan bilgisi edinmek isterseniz, önce MiniMax M3 nedir başlıklı yazıyı okuyun.
Bu rehber, uygulamalı versiyondur. Bir API anahtarı alacak, ilk isteğinizi üç farklı yolla gönderecek ve kendi kodunuza herhangi bir şeyi bağlamadan önce ham istek ve yanıtı görebilmeniz için her adımı Apidog'da test edeceksiniz. Takip etmek isterseniz Apidog'u indirin.
Resmi referans, MiniMax API belgeleri adresinde bulunmaktadır. Bir sekmede açık tutun.

İhtiyacınız Olanlar
- platform.minimax.io adresinde bir MiniMax hesabı.
- Bir API anahtarı (aşağıda bir tane oluşturacağız).
- Kullanım için ödeme yapmanın bir yolu: kullandıkça öde kredileri veya bir abonelik token planı. Her ikisi de aynı uç noktalar için çalışır.
Curl örnekleri için başka hiçbir şeye ihtiyacınız yoktur. SDK örnekleri için Python 3.8+ veya Node 18+ gereklidir.
Adım 1: API Anahtarınızı Alın
platform.minimax.io adresinden giriş yapın, hesabınızın API anahtarları bölümünü açın ve yeni bir anahtar oluşturun. MiniMax iki tür kimlik bilgisi verir ve aralarındaki fark önemlidir:
- Normal bir API Anahtarı, kullandıkça öde bakiyenizden ücretlendirilir.
- Bir Abonelik Anahtarı, planınızdaki (Plus, Max veya Ultra) token kredilerinden düşer. Planın tokenleri bittiğinde, plan yenilenene veya kullandıkça öde anahtarına geçene kadar o anahtar üzerindeki çağrılar durur.
Nasıl faturalandırılmak istediğinize uygun olanı seçin. Anahtarı bir kez kopyalayın ve saklayın. Bir daha görmeyeceksiniz.
Anahtarı asla doğrudan kaynak koduna yapıştırmayın. Bunun yerine bir ortam değişkeni olarak dışa aktarın:
export MINIMAX_API_KEY="anahtarınız-buraya"
Bu, sırrı git geçmişinizden ve paylaşabileceğiniz herhangi bir dosyadan uzak tutar. Düzenleyicinizde de API anahtarlarıyla çalışıyorsanız, aynı hijyen kuralları geçerlidir. VS Code uzantısı API anahtar güvenliği makalesinde sık görülen sızıntıları ele aldık.
Adım 2: İlk İsteğinizi Gönderin
Temel URL https://api.minimax.io/v1 ve sohbet POST https://api.minimax.io/v1/chat/completions adresinde bulunmaktadır. Kimlik doğrulama bir taşıyıcı tokendir: Authorization: Bearer $MINIMAX_API_KEY. Model kimlik dizesi MiniMax-M3'tür.
İşte curl ile en küçük kullanışlı çağrı. Görev gerçek bir görevdir, modelden bir işlevi yeniden düzenlemesini ister:
curl https://api.minimax.io/v1/chat/completions \
-H "Authorization: Bearer $MINIMAX_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model":"MiniMax-M3","messages":[{"role":"user","content":"Bu işlevi eşzamansız olacak şekilde yeniden düzenle."}]}'
M3'ü çağırmanın üç yolu vardır. MiniMax, Anthropic SDK'yı önermektedir, ancak OpenAI SDK ve ham HTTP de aynı uç noktaya karşı çalışır. Yığınınıza zaten uygun olanı kullanın.
İşte Python'daki OpenAI SDK'sı. Normal bir OpenAI kurulumundan tek fark base_url'dir:
from openai import OpenAI
client = OpenAI(
base_url="https://api.minimax.io/v1",
api_key="ANAHTARINIZ",
)
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{"role": "user", "content": "Bu işlevi eşzamansız olacak şekilde yeniden düzenle."}
],
)
print(response.choices[0].message.content)
Ve Node'da aynı fikir, yine sadece temel URL'yi yeniden işaretlemek:
import OpenAI from "openai";
const client = new OpenAI({
baseURL: "https://api.minimax.io/v1",
apiKey: process.env.MINIMAX_API_KEY,
});
const response = await client.chat.completions.create({
model: "MiniMax-M3",
messages: [
{ role: "user", content: "Bu işlevi eşzamansız olacak şekilde yeniden düzenle." },
],
});
console.log(response.choices[0].message.content);
Qwen 3.7 API'sini kullandıysanız, bu desen tanıdıktır. Çoğu öncü model artık OpenAI uyumlu bir arayüz sunar, bu nedenle geçiş maliyeti tek bir satırdır. OpenAI Python SDK belgeleri ve Anthropic SDK belgeleri tüm istemci seçeneklerini kapsar.
Adım 3: Apidog'da Test Edin ve İnceleyin
Bu çağrıyı bir uygulamanın içine gömmeden önce, elle gönderin ve ham yanıtı okuyun. İşte Apidog'un bu döngüdeki yerini kazandığı yer.

- Yeni bir HTTP isteği oluşturun ve yöntemi
POSTolarak, URL'yihttps://api.minimax.io/v1/chat/completionsolarak ayarlayın. - Ortamlar panelini açın ve anahtarınızın değeriyle birlikte
MINIMAX_API_KEYadında bir değişken ekleyin. Bunu bir ortam değişkeni olarak saklayın, böylece istek gövdesinde veya paylaşılan koleksiyonunuzda asla bulunmaz. - İstek başlıklarına,
AuthorizationalanınıBearer {{MINIMAX_API_KEY}}değeriyle ekleyin. Apidog, gönderme zamanında değişkeni değiştirir. - Gövdeyi ham JSON olarak ayarlayın ve curl örneğindeki aynı yükü yapıştırın.
- Gönder düğmesine basın ve yanıt panelini izleyin.
[Ekran görüntüsü: Apidog'daki MiniMax-M3 isteği ve yanıtı]
Tokeni bir ortam değişkeni olarak saklamak, sırrı sızdırmadan isteği ekip arkadaşlarınızla paylaşabileceğiniz anlamına gelir ve tek bir değişkeni değiştirerek anahtarları (kullandıkça öde veya abonelik) değiştirebilirsiniz. Daha sonra akışı açtığınızda, Apidog sunucu tarafından gönderilen olayları geldikçe gösterir, böylece herhangi bir ayrıştırma kodu yazmadan önce akış biçimini onaylayabilirsiniz. Yanıtı elle incelemek, şema sürprizlerini erken yakalar, ki bu bir uç noktaya güvenmeden önce test etmenin asıl amacıdır.
Adım 4: Düşünmeyi Açıp Kapatma
M3 bir akıl yürütme modelidir. Varsayılan olarak nihai bir yanıt döndürür. Ayrıca, bir sonuca neden ulaştığını hata ayıklamak istediğinizde veya akıl yürütmeyi bir inceleme adımına beslemek istediğinizde ara akıl yürütmelerini ifşa etmesini de isteyebilirsiniz.
OpenAI SDK ile, reasoning_split'i extra_body aracılığıyla geçirin:
from openai import OpenAI
client = OpenAI(
base_url="https://api.minimax.io/v1",
api_key="ANAHTARINIZ",
)
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{"role": "user", "content": "Bu işlevi eşzamansız olacak şekilde yeniden düzenle."}
],
extra_body={"reasoning_split": True},
)
print(response.choices[0].message.reasoning_details[0]["text"]) # düşünce
print(response.choices[0].message.content) # nihai yanıt
reasoning_split açık olduğunda, düşünme metni response.choices[0].message.reasoning_details[0]["text"] adresinde geri gelir ve nihai yanıt response.choices[0].message.content adresinde kalır. İkisini kullanıcı arayüzünüzde ayrı tutun. Kullanıcılara yanıtı gösterin ve akıl yürütmeyi günlükler veya bir doğrulama geçişi için saklayın.
Zor problemler için düşünmeyi açın: çok adımlı yeniden düzenlemeler, zorlu hata avları, zinciri denetlemek istediğiniz her şey. Ekstra akıl yürütme tokenlerinin size zaman ve para kaybına neden olduğu, basit, gecikmeye duyarlı çağrılar için kapatın.
Adım 5: 1M Token Bağlamı ile Çalışma
Büyük bağlam penceresi, M3'e yönelmenin nedenidir. Tüm bir günlük dosyasını yapıştırabilir ve hepsi hakkında tek bir soru sorabilirsiniz:
with open("production-2026-05-30.log") as f:
log_text = f.read()
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{
"role": "user",
"content": f"14:20 UTC'deki 502 artışının temel nedenini bulun.\n\n{log_text}",
}
],
)
Bilmeniz gereken faturalandırma eşiği. MiniMax, 512K veya daha az giriş tokeni olan çağrılar için standart bir ücret, giriş 512K tokeni geçtiğinde ise daha yüksek bir uzun bağlam ücreti alır. Bu nedenle, 400K-tokenlik bir komut isteminden 600K-tokenlik bir komut istemine geçiş doğrusal değildir. Bir fiyatlandırma eşiğini aşar.
Pratik çıkarım: Alışkanlıktan bir milyon tokeni bağlama dökmeyin. Modelin ihtiyaç duyduğu dilimi gönderin. Bir aracıda birçok çağrıyı zincirliyorsanız, çağrı başına bağlamı kısaltmak, faturanızdaki en büyük kaldıraçlardan biridir. Bununla ilgili daha derinlemesine bilgiyi aracı token maliyetlerini nasıl azaltırsınız başlıklı yazımızda bulabilirsiniz.
Adım 6: Araç Çağrısı ve Çok Modlu Giriş
M3, araç çağrısını ve çok modlu girişi yönetir, bu nedenle sadece metin değil, aracıları çalıştırabilir ve görüntüleri okuyabilir.
Araç çağırma için, modelin çağırmasına izin verilen araçları bildirirsiniz, ardından döndürdüğü çağrıyı işlersiniz:
tools = [
{
"type": "function",
"function": {
"name": "run_tests",
"description": "Belirli bir modül yolu için test paketini çalıştırır.",
"parameters": {
"type": "object",
"properties": {
"module": {"type": "string"},
},
"required": ["module"],
},
},
}
]
response = client.chat.completions.create(
model="MiniMax-M3",
messages=[
{"role": "user", "content": "auth/session.py dosyasındaki başarısız testi düzelt ve geçtiğini onayla."}
],
tools=tools,
)
Model bir aracı çağırmaya karar verdiğinde, yanıt bir tool_calls dizisi taşır. Kodunuz işlevi çalıştırır, sonucu bir tool mesajı olarak ekler ve modelin devam etmesi için API'yi tekrar çağırır. Bu el sıkışmasını doğru yapmak, çoğu aracı hatasının yaşadığı yerdir. Göndermeden önce bağlantı desenlerini ve arıza modlarını okumaya değer: aracılı iş akışı araç bağlantısı.
Apidog burada da yardımcı olur. Tüm çok turlu değişimi (ilk istek, araç çağrısı yanıtı, araç sonucunuz, takip) ayrı kaydedilmiş istekler olarak tekrar oynatabilir, böylece aracınızın çalışma zamanı içinde tahmin etmek yerine her atlamayı uçtan uca doğrulayabilirsiniz.
Çok modlu giriş için, standart içerik parçaları şekline uygun olarak, görüntü içeriğini metin isteminizle birlikte aynı mesaj dizisine geçirirsiniz. Bunlar metin uç noktalarından daha hızlı geliştiğinden, tam alan adları için API referansını kontrol edin.
Fiyatlandırma ve Katmanlar
Ne kadar ödeyeceğinizi ve ne kadar hızlı hizmet alacağınızı iki ayrı kontrol ayarlar.
Token planları, kredi bütçenizi belirler. Abonelik katmanları, her biri Abonelik Anahtarınız tarafından çekilen daha büyük bir token kredi havuzunu içeren 20 dolarlık Plus, 50 dolarlık Max ve 120 dolarlık Ultra'dır. Kullandıkça öde, düzenli bir API Anahtarını bakiyenize göre faturalandırır.

Hizmet katmanları, zamanlama önceliğini belirler. İki tanedir: standard (varsayılan) ve priority. Standart, çoğu iş yükü için uygundur. Öncelik, herkesin arkasındaki bir kuyrukta bekleyemeyen, gecikmeye duyarlı veya SLA'ya bağlı trafik içindir.
Bunu, Adım 5'teki standart ve uzun bağlam oranı üzerine eklediğinizde, gerçek maliyetiniz giriş boyutu, plan ve katmanın birleşimine bağlıdır. Güncel token başına sayılar için, yayınlanan oranlar değiştiği için MiniMax fiyatlandırma ve model sayfasını ve API belgelerini kontrol edin.
Sıkça Sorulan Sorular
M3'ü denemek için ücretsiz bir yol var mı? Evet. Modeli bir plana taahhütte bulunmadan test edebilirsiniz ve birkaç ücretsiz yol vardır. Bunları MiniMax M3'ü ücretsiz nasıl kullanacağınız yazımızda topladık.
Hangi SDK'lar API ile çalışır? Üç seçenek: ham HTTP, Anthropic SDK ve OpenAI SDK. MiniMax, Anthropic SDK'yı önermektedir, ancak üçü de aynı https://api.minimax.io/v1/chat/completions uç noktasına ulaşır. OpenAI ve Anthropic istemcileri için, sadece base_url'i MiniMax'ı işaret edecek şekilde değiştirirsiniz.
Yanıtları nasıl akış yaparım? İstek gövdenize "stream": true ekleyin. API, sunucu tarafından gönderilen olayları döndürür ve her iki SDK da gelen parçaları okumak için döngüye alabileceğiniz bir yineleyici sunar. Akışı ayrıştırmadan önce olay formatını görmek için önce Apidog'da test edin.
Hız limiti nedir? Limitler hesap katmanınıza ve standard veya priority hizmette olup olmadığınıza bağlıdır. Bir 429 hatası alırsanız, geri çekilin ve yeniden deneyin veya gecikmeye duyarlı trafiği öncelikli katmana taşıyın. Güncel sayılar hesap panelinizde ve API belgelerinde bulunmaktadır.
512K eşiği faturamı nasıl etkiler? 512K token veya daha az girişli çağrılar standart oran üzerinden faturalandırılır. 512K giriş tokenini aştığında, daha yüksek uzun bağlam oranı uygulanır. Özellikle maliyetin çağrılar arasında arttığı aracı döngülerinde, komut isteminizi modelin gerçekten ihtiyaç duyduğu tokenlere göre kısaltın.
API'yi çağırmak yerine ağırlıkları kendi sunucumda barındırabilir miyim? Barındırılan API, bu rehberin kapsadığı yoldur ve başlamanın en hızlı yoludur. Kendi kendine barındırma, MiniMax'ın M3 için herhangi bir zamanda yayınladığına bağlıdır, bu nedenle güncel ağırlık ve lisans durumu için model sayfasını kontrol edin.
Kapanış
Artık MiniMax M3'ü çağırmak için her şeye sahipsiniz: bir ortam değişkeni olarak saklanan bir API anahtarı, çalışan curl, Python ve Node istekleri, bir düşünme anahtarı, 512K faturalandırma eşiği ve araç çağırma el sıkışması. Bunu sağlamlaştırmanın en hızlı yolu, bir gerçek çağrıyı elle çalıştırmaktır. Uç noktayı Apidog'a bırakın, taşıyıcı tokeninizi bir ortam değişkeni olarak saklayın, yeniden düzenleme istemini gönderin ve yanıtı okuyun. Ham şekli gördükten sonra, kodunuza bağlamak dakikalar sürer.
