¿Qué es MiniMax M3? El Primer Modelo de Código Abierto de Frontera

¿Qué es MiniMax M3? Una guía clara del modelo de peso abierto de MiniMax: contexto de 1 millón de tokens, multimodalidad nativa, SWE-Bench Pro 59% y cómo acceder a él.

Ashley Innocent

Ashley Innocent

1 June 2026

¿Qué es MiniMax M3? El Primer Modelo de Código Abierto de Frontera

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

MiniMax M3 es un modelo de IA de pesos abiertos que MiniMax lanzó el 1 de junio de 2026. Es el primer modelo de pesos abiertos en combinar tres cosas en un solo sistema: codificación de nivel de vanguardia, una ventana de contexto de hasta 1,000,000 de tokens y multimodalidad nativa que maneja entradas de imagen y video e incluso puede operar una computadora de escritorio.

Esa combinación es el titular. Muchos modelos hacen una o dos de estas cosas bien. M3 es el primero que puedes ejecutar con tus propios pesos y que busca hacer las tres a la vez. MiniMax también ha prometido publicar los pesos abiertos y un informe técnico completo en aproximadamente 10 días desde el lanzamiento, por lo que el modelo sobre el que lees hoy se convierte en algo que puedes autoalojar poco después. Si has seguido la carrera de los modelos de pesos abiertos a través de lanzamientos como Qwen 3.7, M3 es la próxima gran entrada, y los detalles del lanzamiento provienen directamente del anuncio de MiniMax M3.

Este artículo explica qué es M3, los benchmarks reportados por MiniMax, cómo su arquitectura mantiene bajos los costos de contexto largo, qué puedes construir con él y cómo obtener acceso.

💡
Si planeas integrar M3 en una aplicación, querrás una forma de inspeccionar sus respuestas de API y llamadas a herramientas; herramientas como Apidog facilitan ese paso, y volveremos a ello.
botón

Qué hace diferente a M3

La mayoría de los modelos de vanguardia obligan a una compensación. Puedes tener una codificación sólida, o una ventana de contexto enorme, o entrada multimodal, pero rara vez las tres en un solo modelo abierto. La propuesta de M3 es que ya no tienes que elegir.

Aquí está la unificación de tres vías en términos sencillos:

El ángulo de los pesos abiertos es lo que lo une todo. Cuando los pesos son públicos, puedes autoalojar para trabajos sensibles a los datos, ajustar en tu propio dominio y evitar el bloqueo de proveedor por llamada. Combinar esa libertad con la codificación de vanguardia y una ventana de un millón de tokens es la parte que no había existido en un solo paquete antes. Para tener una idea de cómo el campo más amplio se está moviendo en esta dirección, la guerra de precios de LLM chinos de 2026 cubre la presión competitiva que impulsa a modelos como este a ser abiertos.

Los números que importan

MiniMax publicó un conjunto de resultados de benchmarks en el lanzamiento. Estas son cifras reportadas por el proveedor, así que trátalas como las propias mediciones de MiniMax en lugar de puntuaciones de terceros independientes. Con esa advertencia, así es como se posiciona M3.

El resultado que vale la pena destacar es SWE-Bench Pro con un 59.0%. SWE-Bench Pro es una suite difícil y resistente a la contaminación de tareas reales de ingeniería de software; puedes leer más sobre la metodología en el sitio del proyecto SWE-Bench. MiniMax informa que M3 supera tanto a GPT-5.5 como a Gemini 3.1 Pro en él y se acerca a Claude Opus 4.7. Para un modelo de pesos abiertos, esa es una afirmación sólida.

M3 no está por delante en todas partes. En PostTrainBench obtiene un 0.37, ligeramente por detrás de Opus 4.7 (0.42) y GPT-5.5 (0.39). Una brecha honesta en el marcador resulta más creíble que una victoria aplastante.

Un detalle que MiniMax aún no ha revelado: el número de parámetros y las cifras de parámetros activos. Se espera que esos números lleguen con el informe técnico, así que por ahora no se pueden calcular comparaciones exactas de costo por parámetro. Si quieres un desglose cara a cara contra la frontera cerrada, consulta MiniMax M3 vs Opus 4.7 vs GPT-5.5.

Arquitectura MSA en lenguaje sencillo

La eficiencia de M3 proviene de MSA, abreviatura de MiniMax Sparse Attention (Atención Escasa de MiniMax). La atención estándar compara cada token con todos los demás tokens, por lo que el costo crece rápidamente a medida que el contexto se alarga. Eso es lo que hace que las ventanas de un millón de tokens sean costosas en arquitecturas convencionales.

La atención escasa cambia las matemáticas. En lugar de atender a todo, cada token atiende a un subconjunto seleccionado de la secuencia. MiniMax informa que esto reduce el cómputo por token a aproximadamente 1/20 de su modelo de generación anterior. El beneficio práctico se manifiesta en dos fases de inferencia:

¿Por qué te importa esto? El trabajo con contextos largos suele ser lento y costoso, lo que empuja a los equipos a buscar soluciones alternativas de segmentación y recuperación. Cuando el costo por token disminuye en un orden de magnitud, alimentar un repositorio completo o una pila de documentos largos directamente al modelo se vuelve práctico en lugar de un problema de presupuesto. Las aceleraciones también significan una menor latencia en los bucles agenciales, donde el modelo lee, actúa y vuelve a leer muchas veces.

Lo que realmente puedes construir

M3 está diseñado para trabajos agenciales de largo alcance, del tipo en el que el modelo se ejecuta durante un largo período y produce algo concreto. MiniMax ha lanzado algunas demostraciones que muestran el rango:

El envoltorio de producto para esto es MiniMax Code, que agrega lo que el Equipo de Agentes tiene: flujos de trabajo multietapa, concurrentes y dinámicamente ajustables. Un patrón que vale la pena mencionar es el bucle de arnés adversario “Productor más Verificador”, donde un agente genera trabajo y otro lo verifica antes de que sea aceptado. Ese diseño de verificador en el bucle tiende a reducir los fallos silenciosos que afectan a los agentes de una sola pasada.

Si estás construyendo agentes sobre M3, la parte difícil rara vez es el modelo; es la interconexión entre el modelo y tus herramientas. Los esquemas de llamadas a herramientas varían, los argumentos regresan mal formados y una sola respuesta incorrecta puede paralizar todo un flujo de trabajo. Aquí es donde las pruebas de API demuestran su valía. Puedes capturar las respuestas de llamadas a herramientas de M3 y validar su estructura en Apidog, para detectar una llamada a función rota antes de que llegue a producción. Para el lado del diseño de ese trabajo, cableado de herramientas para flujos de trabajo agenciales: patrones y trampas cubre las trampas comunes.

Cómo acceder a M3

Actualmente MiniMax tiene dos vías: planes de tokens por suscripción y la API.

Los planes de suscripción incluyen una asignación mensual de tokens

Para acceso programático, la API utiliza una interfaz de chat-completions al estilo OpenAI. La URL base es https://api.minimax.io/v1, se llama a POST /chat/completions, y el ID del modelo es MiniMax-M3. La autenticación es un token bearer en la cabecera:

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

Puedes llamarlo a través de HTTP sin procesar, a través del SDK de Anthropic (la ruta recomendada por MiniMax), o a través del SDK de OpenAI. La referencia oficial de la API de MiniMax tiene el esquema completo.

Dos detalles de precios a tener en cuenta. Las llamadas a la API se facturan a una tarifa estándar cuando tu entrada es de 512K tokens o menos, y a una tarifa de contexto largo más alta por encima de 512K, por lo que los prompts muy grandes cuestan más por llamada. También hay dos niveles de servicio: estándar (el predeterminado) y prioridad. MiniMax no ha publicado un precio exacto por token, así que confirma las tarifas actuales en la documentación antes de presupuestar.

Para una configuración paso a paso con solicitudes funcionales, consulta cómo usar la API de MiniMax M3. Si prefieres probarlo sin pagar, cómo usar MiniMax M3 gratis cubre las opciones sin costo. Una vez que tengas una clave, Descarga Apidog para enviar tu primera solicitud e inspeccionar la forma de la respuesta antes de escribir cualquier código de aplicación.

Cómo se compara con otros modelos de pesos abiertos

M3 aterriza en un campo abarrotado de modelos de pesos abiertos, muchos de ellos de laboratorios chinos que presionan fuerte en precio y capacidad. Los contendientes actuales incluyen DeepSeek V4-pro, Qwen 3.7, Kimi k2.6 y GLM-5.1. Cada uno tiene sus propias fortalezas en codificación, razonamiento y trabajo multilingüe.

El diferenciador de M3 no es ninguna puntuación individual; es el conjunto. Pocos pares de modelos de pesos abiertos combinan codificación de vanguardia con una verdadera ventana de 1M de tokens y uso nativo de la computadora en el mismo modelo. Las comparaciones más cercanas tienden a ganar en un eje mientras que M3 reparte su apuesta en los tres. Dicho esto, el informe técnico y los pesos abiertos aún no se han publicado, por lo que los benchmarks independientes serán la verdadera prueba. Si ya estás ejecutando otro modelo abierto, la descripción general de Qwen 3.7 es un punto de referencia útil para saber contra qué compite M3.

Preguntas Frecuentes

¿Es MiniMax M3 de código abierto? Es de pesos abiertos. MiniMax ha prometido publicar los pesos del modelo y un informe técnico en aproximadamente 10 días desde el lanzamiento del 1 de junio de 2026. Al momento de escribir, esos pesos aún no están disponibles, por lo que no puedes descargarlos y autoalojarlos hoy. Una vez que MiniMax libere los pesos como código abierto, podrás ejecutar M3 en tu propia infraestructura.

¿Cuál es la ventana de contexto? Hasta 1,000,000 de tokens. La arquitectura MSA es lo que hace que una ventana tan grande sea asequible, ya que reduce el cómputo por token a aproximadamente 1/20 del modelo de generación anterior.

¿Es MiniMax M3 gratuito? No directamente. MiniMax vende planes de tokens por suscripción a partir de $20/mes (Plus) y acceso a la API facturado por tokens. No hay un nivel gratuito publicado por MiniMax, aunque cómo usar MiniMax M3 gratis explica las opciones sin costo disponibles.

¿Cómo se compara M3 con Claude Opus 4.7? Según los benchmarks reportados por MiniMax, M3 se acerca a Opus 4.7 en SWE-Bench Pro (59.0%) y lo supera en SVG-Bench, mientras que lo sigue en PostTrainBench (0.37 vs 0.42). Estas son cifras del proveedor, así que espera a las pruebas independientes antes de considerar cualquier número como definitivo.

¿Cuándo se liberan los pesos? MiniMax se comprometió a lanzar tanto los pesos abiertos como el informe técnico en aproximadamente 10 días desde el lanzamiento del 1 de junio de 2026. El informe técnico también debería incluir el recuento de parámetros, que MiniMax aún no ha revelado.

¿Puede M3 manejar imágenes y video? Sí. M3 es multimodal de forma nativa y acepta entrada tanto de imagen como de video. También va un paso más allá con el uso de computadoras, operando aplicaciones de escritorio directamente en lugar de solo describir lo que hay en pantalla.

La versión corta

MiniMax M3 es el primer modelo de pesos abiertos en combinar codificación de vanguardia, una ventana de contexto de 1M de tokens y multimodalidad nativa en un solo lugar. La arquitectura MSA mantiene bajos los costos de contexto largo, la puntuación reportada en SWE-Bench Pro lo sitúa cerca de la frontera cerrada, y los pesos abiertos se esperan a los pocos días del lanzamiento. Las brechas honestas, el recuento de parámetros no revelado y algunos benchmarks en los que se queda atrás, valen la pena seguir a medida que se conozcan los resultados independientes. Si estás listo para construir sobre él, consigue una clave API, prueba tus primeras llamadas y respuestas de herramientas en Apidog, y comienza poco a poco antes de escalar.

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs