MiniMax M3: O Primeiro Modelo de Codificação de Fronteira de Peso Aberto

O que é MiniMax M3? Um guia claro para o modelo de peso aberto da MiniMax: contexto de 1 milhão de tokens, multimodalidade nativa, SWE-Bench Pro 59% e como acessá-lo.

Ashley Innocent

Ashley Innocent

1 junho 2026

MiniMax M3: O Primeiro Modelo de Codificação de Fronteira de Peso Aberto

Apidog para empresas

Implantação local

SSO & RBAC

Conforme SOC 2

Explorar Apidog Enterprise

MiniMax M3 é um modelo de IA de código aberto (open-weight) que a MiniMax lançou em 1º de junho de 2026. É o primeiro modelo de código aberto a combinar três coisas em um único sistema: codificação de nível de fronteira, uma janela de contexto de até 1.000.000 de tokens e multimodalidade nativa que lida com entrada de imagem e vídeo e pode até operar um computador de mesa.

Essa combinação é a manchete. Muitos modelos fazem uma ou duas dessas coisas bem. O M3 é o primeiro que você pode rodar com seus próprios pesos e que visa fazer todas as três de uma vez. A MiniMax também prometeu publicar os pesos abertos e um relatório técnico completo em aproximadamente 10 dias após o lançamento, então o modelo sobre o qual você lê hoje se tornará algo que você poderá hospedar em breve. Se você acompanhou a corrida de modelos de código aberto através de lançamentos como Qwen 3.7, o M3 é a próxima grande entrada, e os detalhes do lançamento vêm diretamente do anúncio do MiniMax M3.

Este artigo detalha o que é o M3, os benchmarks relatados pela MiniMax, como sua arquitetura mantém os custos de contexto longo baixos, o que você pode construir com ele e como obter acesso.

💡
Se você planeja integrar o M3 a uma aplicação, você vai querer uma maneira de inspecionar suas respostas de API e chamadas de ferramenta; ferramentas como o Apidog tornam essa etapa simples, e voltaremos a isso.
botão

O que torna o M3 diferente

A maioria dos modelos de fronteira força uma compensação. Você pode ter codificação robusta, ou uma enorme janela de contexto, ou entrada multimodal, mas raramente todas as três em um único modelo aberto. A proposta do M3 é que você não precisa mais escolher.

Aqui está a unificação em três vias em termos simples:

O aspecto de código aberto é o que une tudo isso. Quando os pesos são públicos, você pode auto-hospedar para trabalhos sensíveis a dados, ajustar em seu próprio domínio e evitar o aprisionamento de fornecedor por chamada. Combinar essa liberdade com a codificação de fronteira e uma janela de um milhão de tokens é a parte que não existia em um único pacote antes. Para ter uma ideia de como o campo mais amplo está se movendo nessa direção, a guerra de preços de LLMs chineses de 2026 aborda a pressão competitiva que impulsiona modelos como este para o mundo aberto.

Os números que importam

A MiniMax publicou um conjunto de resultados de benchmark no lançamento. Estes são números reportados pelo fornecedor, então trate-os como medições próprias da MiniMax, em vez de pontuações independentes de terceiros. Com essa ressalva, veja como o M3 se posiciona.

O resultado que merece destaque é o SWE-Bench Pro em 59,0%. SWE-Bench Pro é um conjunto difícil e resistente à contaminação de tarefas reais de engenharia de software; você pode ler mais sobre a metodologia no site do projeto SWE-Bench. A MiniMax relata que o M3 supera tanto o GPT-5.5 quanto o Gemini 3.1 Pro e se aproxima do Claude Opus 4.7. Para um modelo de código aberto, isso é uma afirmação forte.

O M3 não está à frente em todos os lugares. No PostTrainBench, ele marca 0,37, ligeiramente atrás do Opus 4.7 (0,42) e do GPT-5.5 (0,39). Uma lacuna honesta no placar parece mais crível do que uma vitória esmagadora.

Um detalhe que a MiniMax ainda não divulgou: contagens de parâmetros e números de parâmetros ativos. Esses números são esperados com o relatório técnico, então por enquanto você não pode calcular comparações exatas de custo por parâmetro. Se você quiser uma análise comparativa direta contra a fronteira fechada, veja MiniMax M3 vs Opus 4.7 vs GPT-5.5.

Arquitetura MSA em português claro

A eficiência do M3 vem da MSA, sigla para MiniMax Sparse Attention (Atenção Esparsa da MiniMax). A atenção padrão compara cada token com todos os outros tokens, então o custo cresce rapidamente à medida que seu contexto se alonga. É isso que torna as janelas de milhões de tokens caras em arquiteturas convencionais.

A atenção esparsa muda a matemática. Em vez de prestar atenção a tudo, cada token atende a um subconjunto selecionado da sequência. A MiniMax relata que isso reduz o cálculo por token para aproximadamente 1/20 de seu modelo de geração anterior. O benefício prático aparece em duas fases da inferência:

Por que isso importa para você? O trabalho de contexto longo é geralmente lento e caro, o que empurra as equipes para soluções de divisão e recuperação. Quando o custo por token cai uma ordem de magnitude, alimentar um repositório inteiro ou uma pilha de documentos longos diretamente no modelo se torna prático em vez de um problema de orçamento. Os ganhos de velocidade também significam menor latência em loops de agente, onde o modelo lê, age e lê novamente várias vezes.

O que você pode realmente construir

O M3 é construído para trabalho de agente de longo prazo, o tipo em que o modelo funciona por um longo período e produz algo concreto. A MiniMax apresentou algumas demonstrações que mostram o alcance:

O invólucro do produto para isso é o MiniMax Code, que adiciona à Equipe de Agentes: fluxos de trabalho multi-estágios, concorrentes e dinamicamente ajustáveis. Um padrão que vale a pena destacar é o loop adversarial “Produtor mais Verificador”, onde um agente gera o trabalho e outro o verifica antes de ser aceito. Esse design de verificador-no-loop tende a reduzir as falhas silenciosas que assolam os agentes de passagem única.

Se você está construindo agentes sobre o M3, a parte difícil raramente é o modelo; é a conexão entre o modelo e suas ferramentas. Esquemas de chamada de ferramenta se desviam, argumentos retornam malformados e uma única resposta ruim pode paralisar um fluxo de trabalho inteiro. É aqui que o teste de API se mostra valioso. Você pode capturar as respostas de chamada de ferramenta do M3 e validar sua estrutura no Apidog, para que você detecte uma chamada de função quebrada antes que ela chegue à produção. Para o lado do design desse trabalho, conexão de ferramentas em fluxos de trabalho de agente: padrões e armadilhas aborda as armadilhas comuns.

Como acessar o M3

Atualmente, a MiniMax tem dois caminhos: planos de token por assinatura e a API.

Os planos de assinatura incluem uma cota mensal de tokens

Para acesso programático, a API usa uma interface de chat-completions estilo OpenAI. A URL base é https://api.minimax.io/v1, você chama POST /chat/completions, e o ID do modelo é MiniMax-M3. A autenticação é um token de portador no cabeçalho:

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

Você pode chamá-lo via HTTP puro, através do SDK da Anthropic (a rota recomendada pela MiniMax) ou através do SDK da OpenAI. A referência oficial da API MiniMax possui o esquema completo.

Dois detalhes de preços a saber. As chamadas de API são cobradas a uma taxa padrão quando sua entrada é de 512K tokens ou menos, e a uma taxa de contexto longo mais alta acima de 512K, então prompts muito grandes custam mais por chamada. Existem também dois níveis de serviço: padrão (o padrão) e prioritário. A MiniMax não publicou um preço exato por token, então confirme as taxas atuais na documentação antes de orçar.

Para uma configuração passo a passo com solicitações funcionando, consulte como usar a API MiniMax M3. Se você preferir experimentá-lo sem pagar, como usar o MiniMax M3 gratuitamente aborda as opções sem custo. Depois de ter uma chave, Baixe o Apidog para enviar sua primeira solicitação e inspecionar o formato da resposta antes de escrever qualquer código de aplicação.

Como ele se compara a outros modelos de código aberto

O M3 chega a um campo lotado de modelos de código aberto, muitos deles de laboratórios chineses que investem pesado em preço e capacidade. Os atuais concorrentes incluem DeepSeek V4-pro, Qwen 3.7, Kimi k2.6 e GLM-5.1. Cada um tem seus próprios pontos fortes em codificação, raciocínio e trabalho multilíngue.

O diferencial do M3 não é uma única pontuação; é o pacote. Poucos modelos de código aberto combinam codificação de fronteira com uma verdadeira janela de 1M de tokens e uso nativo de computador no mesmo modelo. As comparações mais próximas tendem a vencer em um eixo, enquanto o M3 distribui sua aposta entre os três. Dito isso, o relatório técnico e os pesos abertos ainda não foram divulgados, então benchmarks independentes serão o verdadeiro teste. Se você já está executando outro modelo aberto, a visão geral do Qwen 3.7 é um ponto de referência útil para o que o M3 está competindo.

FAQ

O MiniMax M3 é de código aberto? Ele é de 'pesos abertos' (open-weight). A MiniMax prometeu publicar os pesos do modelo e um relatório técnico em aproximadamente 10 dias após o lançamento em 1º de junho de 2026. No momento da escrita, esses pesos ainda não foram divulgados, então você não pode baixar e auto-hospedar hoje. Assim que a MiniMax liberar os pesos, você poderá executar o M3 em sua própria infraestrutura.

Qual é a janela de contexto? Até 1.000.000 de tokens. A arquitetura MSA é o que torna uma janela tão grande acessível, pois reduz o cálculo por token para aproximadamente 1/20 do modelo da geração anterior.

O MiniMax M3 é gratuito? Não diretamente. A MiniMax vende planos de tokens por assinatura a partir de US$ 20/mês (Plus) e acesso à API cobrado por tokens. Não há uma camada gratuita publicada pela própria MiniMax, embora como usar o MiniMax M3 gratuitamente detalhe as opções sem custo.

Como o M3 se compara ao Claude Opus 4.7? Nos benchmarks relatados pela MiniMax, o M3 se aproxima do Opus 4.7 no SWE-Bench Pro (59,0%) e o supera no SVG-Bench, enquanto fica atrás no PostTrainBench (0,37 vs 0,42). Esses são dados do fornecedor, então aguarde testes independentes antes de considerar qualquer número como definitivo.

Quando os pesos são lançados? A MiniMax se comprometeu a lançar tanto os pesos abertos quanto o relatório técnico em cerca de 10 dias após o lançamento em 1º de junho de 2026. O relatório técnico também deverá preencher as contagens de parâmetros, que a MiniMax ainda não divulgou.

O M3 consegue lidar com imagens e vídeos? Sim. O M3 é nativamente multimodal e aceita entrada de imagem e vídeo. Ele também vai um passo além com o uso de computador, operando aplicativos de desktop diretamente em vez de apenas descrever o que está na tela.

A versão resumida

O MiniMax M3 é o primeiro modelo de código aberto a reunir codificação de fronteira, uma janela de contexto de 1M de tokens e multimodalidade nativa em um só lugar. A arquitetura MSA mantém os custos de contexto longo baixos, a pontuação relatada no SWE-Bench Pro o coloca perto da fronteira fechada, e os pesos abertos devem ser lançados em dias. As lacunas honestas, contagens de parâmetros não reveladas e alguns benchmarks onde ele fica atrás, valem a pena monitorar à medida que os resultados independentes chegam. Se você está pronto para construir sobre ele, pegue uma chave de API, teste suas primeiras chamadas e respostas de ferramentas no Apidog, e comece pequeno antes de escalar.

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs