Son iki yılın büyük bir bölümünde, "en iyi kodlama modeli hangisi?" sorusunun Batılı bir cevabı vardı. GPT, Claude veya Gemini'yi seçtiniz, jeton başına ücreti ödediniz ve ağırlıkların başka birinin veri merkezinde kilitli kaldığını kabul ettiniz. Bu artık tek yol değil. Bir dizi Çin laboratuvarı şimdi, kodlamada öncü modellerle eşleşen ve ya ağırlıkları yayınlayan ya da API'yi o kadar düşük fiyatlandıran modeller sunuyor ki, çalıştırdığınız her aracıdaki hesaplamaları değiştiriyor.
MiniMax M3, 1 Haziran 2026'da piyasaya sürüldü ve şimdiye kadarki en net sinyal. Açık ağırlıklı, kodlama ve aracı çalışmalar için geliştirildi, 1.000.000 jetonluk bir bağlam penceresi taşıyor ve bunun üzerine yerel çok modluluk ekliyor. DeepSeek'in V4 ailesi ve Alibaba'nın Qwen 3.7'si ile birlikte haftalar içinde gelen üçüncü ciddi açık ağırlıklı rakip. Açık ağırlıklar, düşük maliyet ve satıcıya bağımlılık olmadan bir seçenek arıyorsanız, artık tek bir seçenek yerine gerçek bir kısa listeniz var.
Üç aday
MiniMax M3 yeni gelen. MiniMax, onu 1M jetonluk bir bağlam penceresine ve yerel çok modluluğa sahip öncü bir kodlama modeli olarak konumlandırıyor; bu, yalnızca metin değil, görüntü ve video girişini işleyebileceği ve bilgisayar kullanma görevlerini yürütebileceği anlamına geliyor. Yeni bir MSA mimarisi üzerinde çalışıyor. MiniMax, açık ağırlıkların ve teknik bir raporun lansmandan yaklaşık on gün sonra yayınlanacağını belirtiyor ve parametre sayılarını açıklamadı. Tam döküm MiniMax M3 nedir makalesinde.
DeepSeek V4-Pro, akıl yürütme ve kodlama işgücüdür. Bu bir düşünce modelidir: son cevabından önce reasoning_content düşünce zinciri döndürür, bu da düz tamamlama modellerinin gözden kaçırdığı çoklu dosya bağımlılıklarını yakalar. DeepSeek'in R1 ve V3 serilerinde açık ağırlıkları yayınlama konusunda uzun ve belgelenmiş bir geçmişi var ve V4-Pro'yu daha ucuz, düşünmeyen bir V4-Flash varyantıyla eşleştiriyor. Öne çıkan şey fiyat, ona geleceğiz. DeepSeek, resmi sitesini ve API'sini deepseek.com adresinde çalıştırıyor.
Qwen 3.7, Qwen3.7-Max-Preview liderliğindeki Alibaba'nın amiral gemisidir. 1M jetonluk bir bağlam penceresine sahip, uzun ufuklu aracı çalışmalarına yönelik yoğun bir akıl yürütme modelidir. Bu karşılaştırmanın merkezinde dürüst bir uyarı var: Mayıs 2026 ortasındaki lansmanı itibarıyla Qwen3.7-Max amiral gemisi tescilli ve kapalı ağırlıktır. Alibaba'nın amiral gemisinin altındaki katmanı açık kaynaklı hale getirme konusunda güçlü bir geçmişi var, bu nedenle açık 3.7 ağırlıkları daha sonra makul olabilir, ancak henüz hiçbiri gönderilmedi. Tam ayrıntılar Qwen 3.7 nedir makalesinde. Alibaba'nın açık kaynak depoları github.com/QwenLM adresinde bulunmaktadır.
Teknik özellikler tablosu
| Özellik | MiniMax M3 | DeepSeek V4-Pro | Qwen3.7-Max-Preview |
|---|---|---|---|
| Satıcı | MiniMax | DeepSeek | Alibaba (Qwen) |
| Yayınlandı | 1 Haziran 2026 | 2026 | Mayıs 2026 (önizleme) |
| Açık ağırlıklar | Evet (ağırlıklar ~10 gün içinde) | Evet (DeepSeek'in R1/V3 serisindeki geçmişi) | Henüz değil (amiral gemisi kapalı ağırlıkta) |
| Bağlam penceresi | 1.000.000 jeton | Burada belirtilmemiştir | 1.000.000 jeton |
| Çok modlu | Evet (görüntü + video, bilgisayar kullanımı) | Hayır (metin + akıl yürütme) | Metin odaklı akıl yürütme |
| Akıl yürütme / düşünme modu | Evet | Evet (reasoning_content) |
Evet (genişletilmiş düşünme) |
| Parametre sayısı | Açıklanmadı | Burada belirtilmemiştir | Burada belirtilmemiştir |
| Mimari | MSA | Burada belirtilmemiştir | Burada belirtilmemiştir |
"Açık ağırlıklar" satırına dair bir not, çünkü bu karşılaştırmanın bel kemiği. M3, lansmandan yaklaşık on gün sonra ağırlıkları ve teknik bir raporu yayınlamayı taahhüt ediyor. DeepSeek, tekrar tekrar açık ağırlıkları göndermiştir. Qwen 3.7'nin amiral gemisi bugün kapalı. Eğer açık ağırlıklar şu anda zorunlu bir gereklilikse, bu, tek bir karşılaştırma okumadan önce alanınızı daraltır.
Kodlama ve aracı gücü
İşte verilerin düzensizleştiği nokta, bu yüzden doğrulanmış olanla başlayacak ve olmadığı yerlerde niteliksel kalacağız.
MiniMax M3, satıcı tarafından bildirilen tam bir kodlama ve aracı kıyaslama seti ile piyasaya sürüldü. Bunlar MiniMax'ın kendi sayılarıdır, bu yüzden üçüncü taraflar onları yeniden üretene kadar lansman günü satıcı iddiaları olarak kabul edin:
| Kıyaslama (satıcı tarafından bildirilen, MiniMax) | MiniMax M3 |
|---|---|
| SWE-Bench Pro | %59,0 |
| Terminal-Bench 2.1 | %66,0 |
| SWE-fficiency | %34,8 |
| KernelBench Hard | %28,8 |
| MCP Atlas | %74,2 |
| PostTrainBench | 0,37 |
| SVG-Bench | Opus 4.7'nin üzerinde bildirildi |
| OmniDocBench | Gemini 3.1 Pro'nun üzerinde bildirildi |
| Claw-Eval | Kendi setinde en yüksek olarak bildirildi |
SWE-Bench Pro ve Terminal-Bench, gerçek yazılım mühendisliği görevlerini ölçer: GitHub sorunlarını çözme, bir terminalde çalışma. MCP Atlas, araç kullanımını ve aracı orkestrasyonunu ölçer. Birlikte, sadece otomatik tamamlama değil, aracı kodlama işi yapmak için tasarlanmış bir modeli tanımlarlar. SWE-Bench alanını SWE-Bench liderlik tablosundan kontrol edebilirsiniz.
DeepSeek V4-Pro ve Qwen 3.7 için karşılaştırılabilir aracı kodlama sayıları aynı formatta yayınlanmadı, bu yüzden doğrudan hücre hücre eşleştirme uydurulmuş olur ve bunu yapmayacağız. Belgelenmiş olanlar:
- DeepSeek V4-Pro, üçüncü taraf karşılaştırmalarına göre kodlama yeteneğini GPT-5.5'in birkaç kıyaslama puanı içinde sunarken, fiyatının çok küçük bir kısmına mal oluyor. Akıl yürütme zinciri pratik avantajdır: karmaşık çoklu dosya refactoring'lerinde, yeniden adlandırmalarda ve imza değişikliklerinde, düşünme geçişi, düz modellerin üç turda ele alması gereken bağımlılıkları tek seferde yakalar. Kurulum detayları ve maliyet hesaplamaları DeepSeek V4-Pro'yu Cursor ile nasıl kullanırsınız makalesinde.
- Qwen 3.7, akıl yürütme, bilgi, matematik ve kodlamayı birleştiren bir bileşik olan Artificial Analysis Intelligence Index'te 57 puan aldı ve lansmanda bu liderlik tablosunda 1. sonuç olarak rapor edildi, ayrıca LM Arena'da yaklaşık 1.475 Elo puanıyla kodlama kategorisinde ilk ona girdi. Alibaba'nın iddiası uzun ufuklu aracı çalışmasıdır: birçok adımda sürekli otonom çalıştırma ve yoğun araç kullanımı.
Dürüst okuma: M3, görev düzeyinde sayıları yayınladığı için bugün en şeffaf aracı kodlama kanıtı ile birlikte geliyor. DeepSeek'in gücü, düşük fiyata akıl yürütmeye dayalı kod kalitesidir. Qwen'in gücü ise uzun aracı zincirlerinde bileşik zeka ve dayanıklılıktır. DeepSeek ve Qwen aynı SWE-Bench Pro ve Terminal-Bench görevlerini rapor edene kadar, kendi iş yükünüzü her üçü üzerinden de çalıştırın, bunu sonda ele alıyoruz. Qwen için daha geniş bir öncü eşleşme Qwen 3.7 vs GPT-5.5 vs Opus 4.7 makalesinde bulunuyor.
Bağlam penceresi ve uzun bağlam maliyeti
Üç modelden ikisi 1.000.000 jetonluk bir bağlam penceresi reklamı yapıyor: MiniMax M3 ve Qwen3.7-Max. DeepSeek'in V4-Pro bağlamı burada tekrarlanmadı, bu yüzden onun için bir sayı belirtmeyeceğiz.
Bir milyon jeton yaklaşık 700.000 ila 750.000 kelimeye eşittir. Bu, orta büyüklükte bir depoyu, bir yığın uzun PDF'i veya aylarca süren konuşmayı tek bir istekte tutmak için yeterlidir; manuel bölme veya bakım gerektiren bir alma katmanı olmadan. Tüm depo akıl yürütmesi için birçok alt yapıyı ortadan kaldırır.
İki uyarı bu durumu dürüst tutuyor. Birincisi, büyük bir pencere bir tavan, bir garanti değil. Modeller genellikle pencere doldukça daha az güvenilir bir şekilde bilgi alır ve akıl yürütür ve bu yepyeni sürümler için bağımsız uzun bağlam testleri hala yetersizdir. İkincisi, büyük bağlamlar paraya mal olur. Gönderdiğiniz her jeton faturalandırılır, bu nedenle bir milyon jetonluk bir istem pahalı bir istemdir.
M3'ün MSA mimarisinin önemli olduğu yer burasıdır. MiniMax bunu uzun bağlam verimliliği için tasarlanmış olarak sunuyor; 512K giriş jetonuna kadar standart bir API ücreti ve bu eşiğin üzerinde ayrı bir uzun bağlam ücreti ile. Bu ayrım size ekonomik gerçeği açıkça söylüyor: uzun bağlam, sahip olan her modelde premium bir katmandır. Hangi modeli seçerseniz seçin, pratik savunma aynıdır. Tam pencereyi yalnızca görev gerektirdiğinde kullanın ve gerektirmediğinde agresif bir şekilde kısaltın. Aracı bağlamını az tutmak için somut taktikler aracı jeton maliyetlerini nasıl azaltırsınız makalesinde.
Fiyat ve erişim
Fiyat, bu karşılaştırmanın var olma nedenidir. Batılı bir amiral gemisinde gerçek paraya mal olan aynı iş yükü burada çok daha azına çalışıyor ve bu fark, Çin LLM fiyat savaşı 2026'nın arkasındaki motor.
DeepSeek V4-Pro, üçü arasında en net jeton başına sayıları yayınlıyor. Mayıs 2026 itibarıyla kalıcı standart oranlar:
| Jeton türü | DeepSeek V4-Pro 1M jeton başına oran |
|---|---|
| Giriş (önbellek kaçışı) | 0,435 dolar |
| Giriş (önbellek isabeti) | 0,003625 dolar |
| Çıkış | 0,87 dolar |
Bu çıkış oranı, GPT-5.5 çıktısının maliyetinin kabaca 1/34'ü kadardır. Düşünmeyen V4-Flash varyantı, milyon giriş/çıkış başına 0,14 dolar / 0,28 dolar ile daha da ucuzdur. Yoğun bir kodlama asistanı kullanım günü yaklaşık 1 dolara gelir. Yüksek hacimli aracı trafiği için DeepSeek'i göz ardı etmeyi zorlaştıran sayı budur.
MiniMax M3, tek bir yayınlanmış jeton başına fiyat yerine jeton planları satıyor: Plus 20 dolar, Max 50 dolar ve Ultra 120 dolar. API'si 512K jetona kadar girişler için standart bir oran ve bu eşiğin üzerinde uzun bağlam oranı kullanır. MiniMax kesin bir jeton başına rakam yayınlamadı, bu yüzden bir rakam belirtmeyeceğiz. Plan yapısı, ölçülü faturalandırma yerine öngörülebilir aylık harcama isteyen ekiplere uygundur. Kablolama detayları MiniMax M3 API'sini nasıl kullanırsınız makalesinde.
Qwen 3.7, Max önizlemesinin Mayıs 2026'da yayınlandığı Alibaba Cloud üzerinden jeton başına faturalandırılır. Alibaba, aynı fiyat savaşının bir parçası olarak son Qwen sürümlerini agresif bir şekilde fiyatlandırdı, ancak bir önizleme modelinin kesin oranları değişebilir, bu nedenle canlı sayı için Alibaba Cloud'un güncel model belgelerini kontrol edin.
Erişime gelince, açık ağırlık açısı maliyet tavanını tamamen değiştiriyor. M3'ün yayınlanmış ağırlıkları ve DeepSeek'in açık sürümleri, kendi sunucunuzda barındırabileceğiniz ve sadece donanım için ödeme yapabileceğiniz anlamına gelir, jeton başına hiçbir ölçüm olmaz. Qwen3.7-Max bugün kendi sunucunuzda barındırılamaz çünkü amiral gemisi ağırlıkları yayınlanmamıştır, bu nedenle ona giden her yol Alibaba'nın API'si üzerinden çalışır. Eğer satıcıya bağımlılıktan kaçınmak amaçsa, bu gerçek bir farklılaştırıcıdır.
Hangisini seçmeli
Doğru model, neyi optimize ettiğinize bağlıdır. Önceliğinizi sütunla eşleştirin.
| Önceliğiniz | En uygun | Neden |
|---|---|---|
| Yayınlanmış kıyaslamalarla aracı kodlama | MiniMax M3 | Lansmanda şeffaf SWE-Bench Pro / Terminal-Bench / MCP Atlas sayıları (satıcı tarafından bildirilen) |
| Çok modlu giriş (görüntü, video, bilgisayar kullanımı) | MiniMax M3 | Üçünden yalnızca yerel çok modluluğa sahip olan |
| Yüksek hacimli API trafiğinde en düşük maliyet | DeepSeek V4-Pro | ~0,87$/1M çıkış, daha ucuz Flash varyantı ve önbellek isabeti fiyatlandırması ile |
| Zorlu yeniden yapılandırmalarda akıl yürütmeye dayalı kod kalitesi | DeepSeek V4-Pro | Düşünme zinciri çoklu dosya bağımlılıklarını tek geçişte yakalar |
| Kamusal bir tabloda en yüksek bileşik zeka skoru | Qwen3.7-Max | AA Zeka Endeksi 57, lansmanda #1 olarak bildirildi |
| Uzun ufuklu otonom aracı çalıştırmaları | Qwen3.7-Max veya MiniMax M3 | İkisi de dayanıklılık ve yoğun araç kullanımı sunar; M3 ayrıca MCP Atlas'ı da yayınlar |
| Kendi sunucusunda barındırma / bugün satıcıya bağımlılık yok | MiniMax M3 veya DeepSeek V4-Pro | İkisi de açık ağırlıkları yayınlar; Qwen'in amiral gemisi kapalıdır |
Birkaç basit okuma. Eğer açık ağırlıklar ve aracı kodlama kanıtı ilk iki önceliğinizse, şu anda M3 en net seçimdir, ancak ağırlıklarının ve teknik raporunun lansmanından günler sonra yayınlanacağı ve kıyaslamalarının satıcı tarafından bildirildiği unutulmamalıdır. Eğer yoğun API hacmi kullanıyor ve en düşük faturayı istiyorsanız, DeepSeek V4-Pro'nun fiyatı başroldedir. Eğer en yüksek kamusal bileşik skoru istiyor ve barındırılan bir API'de çalışmaktan rahatsanız, kendi sunucunuzda barındırma ihtiyacınız olmadığı sürece Qwen3.7-Max uygundur.
Kendiniz test edin
Bir liderlik tablosu size bir modelin başkalarının görevlerinde nasıl performans gösterdiğini anlatır. Sizinkilerde nasıl performans gösterdiğini söylemez. Bu üç modelin hepsi bir API sunar ve seçimi netleştirmenin en hızlı yolu, her birine aynı istemleri çalıştırmak ve yanıtları yan yana karşılaştırmaktır.
Bu, Apidog için bir iştir. Her model API'si için bir tane olmak üzere üç ortamla bir Apidog projesi kurun ve her birinin kullandığı OpenAI uyumlu Sohbet Tamamlama şemasını içe aktarın. Sonra şunları yapabilirsiniz:
- M3, V4-Pro ve Qwen3.7-Max'e aynı istem grubunu gönderin ve çıktıları tek bir yerde karşılaştırın.
- Altın yanıtları kaydedin ve kaymayı yakalamak için her istem değişikliğinde tekrar oynatın.
tool_callsvereasoning_contentşekillerini JSON Şema onaylamalarıyla doğrulayın, böylece kötü bir sistem-istem düzenlemesi aracınızı sessizce bozmaz.
Apidog'u indirin, üç ortamı üç model bitiş noktasına yönlendirin ve birkaç dakika içinde çalışan bir karşılaştırma tezgahına sahip olursunuz. En yeni model için API kurulumu detayları MiniMax M3 API'sini nasıl kullanırsınız makalesinde.
Sıkça Sorulan Sorular
2026'da şu anda en iyi açık ağırlıklı kodlama modeli hangisi?
Lansmanda doğrulanabilir aracı kodlama kanıtı için MiniMax M3 önde gidiyor, çünkü SWE-Bench Pro %59.0 ve Terminal-Bench 2.1 %66.0 gibi görev düzeyinde kıyaslamaları yayınladı (satıcı tarafından bildirilen). DeepSeek V4-Pro, değer seçimidir: GPT-5.5'in birkaç puan içinde kodlama yaparken, çıktı fiyatının kabaca 1/34'ü kadar maliyetle. Qwen3.7-Max bileşik bir liderlik tablosunda zirvede ancak henüz açık ağırlıklı değil. Dürüst cevap şudur ki, üçü arasında doğrudan karşılaştırılabilir başa baş kodlama sayıları mevcut değil, bu yüzden taahhütte bulunmadan önce kendi iş yükünüzü çalıştırın.
Üçü de gerçekten açık ağırlıklı mı?
Henüz değil. MiniMax M3 açık ağırlıklıdır, ağırlıkları ve teknik raporu 1 Haziran 2026 lansmanından yaklaşık on gün sonra yayınlanacak. DeepSeek'in R1 ve V3 ailelerinde açık ağırlıkları yayınlama konusunda uzun bir geçmişi var. Çoğu kişinin "Qwen 3.7" derken kastettiği amiral gemisi olan Qwen3.7-Max-Preview, Mayıs 2026 ortası itibarıyla tescilli ve kapalı ağırlıklıdır. Alibaba daha sonra altında bir katmanı açık kaynaklı yapabilir, ancak bunu doğrulanmış değil, makul olarak kabul edin. Ayrıntılar Qwen 3.7 nedir makalesinde.
Hangisi en büyük bağlam penceresine sahip?
MiniMax M3 ve Qwen3.7-Max ikisi de yaklaşık 700.000 ila 750.000 kelimeye denk gelen 1.000.000 jetonluk bir pencere reklamı yapıyor. DeepSeek V4-Pro'nun bağlamı burada belirtilmemiştir. Unutmayın ki büyük bir pencere bir tavan, mükemmel hatırlamanın bir vaadi değildir ve içindeki her jeton faturalandırılır.
Çalıştırması en ucuz olan hangisi?
Yayınlanmış jeton başına oranlarda DeepSeek V4-Pro açık ara liderdir: milyon çıktı jetonu başına yaklaşık 0,87 dolar, daha ucuz düşünmeyen V4-Flash varyantı ise 0,14 dolar / 0,28 dolar. MiniMax M3, yayınlanmış jeton başına fiyat yerine aylık jeton planları ($20 / $50 / $120) satıyor. Qwen3.7-Max, Alibaba Cloud'da jeton başına faturalandırılır. Kendi sunucunuzda barındırabiliyorsanız, açık ağırlıklı modeller marjinal maliyetinizi sadece donanıma düşürür. Daha geniş fiyatlandırma tablosu Çin LLM fiyat savaşı 2026 makalesinde.
MiniMax M3, kodlamada DeepSeek V4-Pro'dan gerçekten daha mı iyi?
Kıyaslama sayıları henüz doğrudan karşılaştırılamaz. M3, lansmanda SWE-Bench Pro ve Terminal-Bench sonuçlarını yayınladı; DeepSeek bu aynı görevler hakkında aynı formatta rapor vermedi. M3'ün bugünkü avantajı yayınlanmış kanıtlar ve çok modluluktur. DeepSeek'in avantajı ise fiyat ve çoklu dosya yeniden yapılandırmalarında güçlü olan bir akıl yürütme zinciridir. Her üçü de OpenAI uyumlu bir API konuşur, bu nedenle adil test, karar vermeden önce kendi deponuzda her birine aynı istemleri çalıştırmaktır.
Kısa versiyon
Üç açık ağırlıklı rakip artık kodlama alanında öncüye ulaştı ve seçim neyi optimize ettiğinize bağlı. Yayınlanmış aracı kodlama kıyaslamaları, 1M bağlam ve çok modluluk istiyorsanız ve ağırlıklarının yayınlanmasını birkaç gün bekleyebilirseniz MiniMax M3'ü seçin. Düşük maliyet ve akıl yürütmeye dayalı kod kalitesi en önemliyse DeepSeek V4-Pro'yu seçin, çünkü jeton başına fiyatı üçü arasında en düşük olanıdır ve ağırlıkları mevcuttur. En yüksek kamusal bileşik skoru istiyorsanız ve barındırılan bir API'de çalışmaktan rahatsanız, amiral gemisinin bugün açık ağırlıklı olmadığını bilerek Qwen3.7-Max'i düşünün.
Kıyaslama sayıları hareket etmeye devam edecek ve M3'ün bazıları hala satıcı tarafından bildirilenlerdir. Kalıcı tavsiye değişmiyor: tüm üç API'ye aynı istemleri tek bir Apidog projesinde çalıştırın, çıktıları ve faturaları izleyin ve kazananı kendi iş yükünüz belirlesin.
