MiniMax M3란? 최초의 오픈 웨이트 프론티어 코딩 모델

MiniMax M3란 무엇인가? MiniMax의 오픈 웨이트 모델에 대한 명확한 안내: 1백만 토큰 컨텍스트, 네이티브 멀티모달리티, SWE-Bench Pro 59%, 그리고 접근 방법.

Ashley Innocent

Ashley Innocent

1 June 2026

MiniMax M3란? 최초의 오픈 웨이트 프론티어 코딩 모델

Apidog 엔터프라이즈

온프레미스 배포

SSO & RBAC

SOC 2 준수

Apidog Enterprise 살펴보기

MiniMax M3는 MiniMax가 2026년 6월 1일에 출시한 오픈 웨이트 AI 모델입니다. 이 모델은 하나의 시스템에 세 가지를 결합한 최초의 오픈 웨이트 모델입니다: 최첨단 코딩, 최대 1,000,000 토큰의 컨텍스트 윈도우, 그리고 이미지 및 비디오 입력을 처리하고 심지어 데스크톱 컴퓨터를 조작할 수 있는 기본 멀티모달 기능입니다.

이러한 조합이 바로 핵심입니다. 많은 모델이 이 중 한두 가지를 잘 수행합니다. M3는 이 세 가지를 동시에 수행하는 것을 목표로 하는, 자체 가중치로 실행할 수 있는 최초의 모델입니다. MiniMax는 또한 출시 후 약 10일 이내에 오픈 웨이트와 전체 기술 보고서를 공개하겠다고 약속했으므로, 오늘 읽으신 모델은 곧 직접 호스팅할 수 있게 됩니다. Qwen 3.7과 같은 출시를 통해 오픈 웨이트 경쟁을 지켜보셨다면, M3는 다음 주요 진입자이며, 출시 세부 정보는 MiniMax M3 발표에서 직접 가져온 것입니다.

이 기사에서는 M3가 무엇인지, MiniMax가 보고한 벤치마크, M3의 아키텍처가 긴 컨텍스트 비용을 절감하는 방법, M3로 만들 수 있는 것, 그리고 M3에 접근하는 방법을 설명합니다.

💡
M3를 애플리케이션에 연결할 계획이라면, M3의 API 응답 및 도구 호출을 검사할 방법이 필요할 것입니다. Apidog와 같은 도구는 이 단계를 간단하게 만들어주며, 이에 대해서는 나중에 다시 설명하겠습니다.
버튼

M3를 차별화하는 요소는 무엇인가요

대부분의 최첨단 모델은 절충을 강요합니다. 강력한 코딩, 거대한 컨텍스트 윈도우, 또는 멀티모달 입력을 가질 수 있지만, 단일 오픈 모델에서 이 세 가지를 모두 갖는 경우는 드뭅니다. M3의 핵심 주장은 더 이상 선택할 필요가 없다는 것입니다.

이 세 가지 통합을 간단히 설명하자면 다음과 같습니다:

오픈 웨이트가 이 모든 것을 하나로 묶는 요소입니다. 가중치가 공개되면 데이터 민감한 작업을 위해 자체 호스팅하고, 자체 도메인에서 미세 조정하며, 호출당 공급업체 종속을 피할 수 있습니다. 이러한 자유를 최첨단 코딩 및 100만 토큰 윈도우와 결합하는 것은 이전에 하나의 패키지로 존재하지 않았던 부분입니다. 더 넓은 분야가 이 방향으로 어떻게 움직이는지 이해하려면, 2026년 중국 LLM 가격 전쟁은 이와 같은 모델을 공개로 밀어붙이는 경쟁 압력을 다룹니다.

중요한 숫자

MiniMax는 출시와 함께 일련의 벤치마크 결과를 발표했습니다. 이들은 공급업체가 보고한 수치이므로, 독립적인 제3자 점수라기보다는 MiniMax 자체 측정치로 간주해야 합니다. 이러한 주의사항을 염두에 두고, M3의 결과는 다음과 같습니다.

주목할 만한 결과는 SWE-Bench Pro에서 59.0%입니다. SWE-Bench Pro는 실제 소프트웨어 엔지니어링 작업을 다루는 어렵고 오염에 강한 스위트입니다. 방법론에 대한 자세한 내용은 SWE-Bench 프로젝트 사이트에서 확인할 수 있습니다. MiniMax는 M3가 GPT-5.5와 Gemini 3.1 Pro를 모두 능가하고 Claude Opus 4.7에 근접한다고 보고합니다. 오픈 웨이트 모델에게는 강력한 주장입니다.

M3가 모든 면에서 앞서는 것은 아닙니다. PostTrainBench에서는 0.37점을 기록하여 Opus 4.7(0.42)과 GPT-5.5(0.39)에 약간 뒤처집니다. 점수판에서 솔직한 격차는 압승보다 더 신뢰할 수 있게 느껴집니다.

MiniMax가 아직 공개하지 않은 한 가지 세부 사항은 매개변수 개수와 활성 매개변수 수치입니다. 이 수치들은 기술 보고서와 함께 공개될 예정이므로, 현재로서는 정확한 매개변수당 비용 비교를 계산할 수 없습니다. 비공개 최첨단 모델과의 직접적인 비교 분석을 원하시면 MiniMax M3 vs Opus 4.7 vs GPT-5.5를 참조하십시오.

간단히 설명하는 MSA 아키텍처

M3의 효율성은 MiniMax Sparse Attention의 약자인 MSA에서 비롯됩니다. 표준 어텐션은 모든 토큰을 다른 모든 토큰과 비교하므로, 컨텍스트가 길어질수록 비용이 빠르게 증가합니다. 이것이 기존 아키텍처에서 100만 토큰 윈도우가 비싼 이유입니다.

희소 어텐션은 계산 방식을 바꿉니다. 모든 것에 주의를 기울이는 대신, 각 토큰은 시퀀스의 선택된 하위 집합에 주의를 기울입니다. MiniMax는 이로 인해 토큰당 컴퓨팅 비용이 이전 세대 모델의 약 1/20로 줄어든다고 보고합니다. 실질적인 이점은 추론의 두 단계에서 나타납니다:

이것이 왜 중요할까요? 긴 컨텍스트 작업은 일반적으로 느리고 비용이 많이 들어, 팀이 청킹 및 검색 해결책으로 눈을 돌리게 합니다. 토큰당 비용이 한 자릿수만큼 떨어지면, 전체 저장소나 긴 문서 스택을 모델에 바로 공급하는 것이 예산 문제가 아닌 실용적인 방법이 됩니다. 속도 향상은 또한 모델이 여러 번 읽고, 행동하고, 다시 읽는 에이전트 루프에서 더 낮은 지연 시간을 의미합니다.

실제로 만들 수 있는 것

M3는 모델이 장시간 실행되어 구체적인 것을 생산하는 장기적인 에이전트 작업을 위해 만들어졌습니다. MiniMax는 다음과 같은 범위를 보여주는 몇 가지 데모를 공개했습니다:

이를 위한 제품 래퍼는 MiniMax Code이며, 여기에 에이전트 팀이 추가됩니다: 다단계, 동시적, 동적으로 조절 가능한 워크플로우. 주목할 만한 한 가지 패턴은 "생산자 + 검증자" 대립형 하네스 루프로, 한 에이전트가 작업을 생성하고 다른 에이전트가 승인되기 전에 이를 확인하는 방식입니다. 이 루프 내 검증자 설계는 단일 패스 에이전트를 괴롭히는 조용한 실패를 줄이는 경향이 있습니다.

M3 위에 에이전트를 구축하고 있다면, 어려운 부분은 모델 자체가 아니라 모델과 도구 사이의 연결(배관)입니다. 도구 호출 스키마가 변경되고, 인수가 잘못된 형식으로 반환되며, 하나의 잘못된 응답이 전체 워크플로우를 중단시킬 수 있습니다. 여기서 API 테스트가 진가를 발휘합니다. M3의 도구 호출 응답을 캡처하고 Apidog에서 구조를 검증하여, 프로덕션에 도달하기 전에 손상된 함수 호출을 잡을 수 있습니다. 해당 작업의 설계 측면에 대해서는 에이전트 워크플로우 도구 연결: 패턴 및 함정에서 일반적인 함정을 다룹니다.

M3에 접근하는 방법

현재 MiniMax는 두 가지 경로를 제공합니다: 구독 토큰 플랜과 API입니다.

구독 플랜은 월별 토큰 허용량을 묶음으로 제공합니다

프로그래밍 방식 접근을 위해 API는 OpenAI 스타일의 채팅 완성 인터페이스를 사용합니다. 기본 URL은 https://api.minimax.io/v1이며, POST /chat/completions를 호출하고, 모델 ID는 MiniMax-M3입니다. 인증은 헤더에 베어러 토큰을 사용합니다:

POST https://api.minimax.io/v1/chat/completions
Authorization: Bearer $API_KEY
Content-Type: application/json

raw HTTP를 통해서나, Anthropic SDK(MiniMax 권장 경로)를 통해서나, OpenAI SDK를 통해서 호출할 수 있습니다. 공식 MiniMax API 레퍼런스에 전체 스키마가 있습니다.

알아야 할 두 가지 가격 책정 세부 정보. API 호출은 입력이 512K 토큰 이하일 때는 표준 요금으로 청구되고, 512K를 초과할 때는 더 높은 장기 컨텍스트 요금으로 청구되므로, 매우 큰 프롬프트는 호출당 비용이 더 많이 듭니다. 또한 두 가지 서비스 계층이 있습니다: 표준(기본값) 및 우선순위. MiniMax는 토큰당 정확한 가격을 공개하지 않았으므로, 예산을 책정하기 전에 문서에서 현재 요금을 확인하십시오.

작동하는 요청을 포함한 단계별 설정은 MiniMax M3 API 사용 방법을 참조하십시오. 비용을 지불하지 않고 사용해보고 싶다면, MiniMax M3를 무료로 사용하는 방법에서 무료 옵션을 다룹니다. 키를 얻었다면, Apidog를 다운로드하여 첫 번째 요청을 보내고 애플리케이션 코드를 작성하기 전에 응답 형식을 검사하십시오.

다른 오픈 웨이트 모델과의 비교

M3는 가격과 기능 면에서 강력하게 밀어붙이는 중국 연구소의 많은 오픈 웨이트 모델들로 붐비는 분야에 등장했습니다. 현재 경쟁 모델로는 DeepSeek V4-pro, Qwen 3.7, Kimi k2.6, 그리고 GLM-5.1이 있습니다. 각 모델은 코딩, 추론, 다국어 작업 전반에 걸쳐 고유한 강점을 가지고 있습니다.

M3의 차별점은 단일 점수가 아니라 번들입니다. 최첨단 코딩, 진정한 100만 토큰 윈도우, 기본 컴퓨터 사용 기능을 동일 모델에 결합한 오픈 웨이트 모델은 거의 없습니다. 가장 근접한 비교 대상은 한 가지 축에서 승리하는 경향이 있는 반면, M3는 세 가지 모두에 걸쳐 강점을 펼칩니다. 그렇다 하더라도, 기술 보고서와 오픈 웨이트는 아직 공개되지 않았으므로, 독립적인 벤치마크가 진정한 시험이 될 것입니다. 이미 다른 오픈 모델을 실행하고 있다면, Qwen 3.7 개요는 M3가 경쟁하는 대상에 대한 유용한 참조점입니다.

자주 묻는 질문

MiniMax M3는 오픈 소스인가요? 오픈 웨이트입니다. MiniMax는 2026년 6월 1일 출시 후 약 10일 이내에 모델 가중치와 기술 보고서를 공개하겠다고 약속했습니다. 이 글을 쓰는 시점에는 아직 가중치가 공개되지 않았으므로, 현재 다운로드하여 자체 호스팅할 수는 없습니다. MiniMax가 가중치를 오픈 소스화하면, 자체 인프라에서 M3를 실행할 수 있게 될 것입니다.

컨텍스트 윈도우는 얼마인가요? 최대 1,000,000 토큰입니다. MSA 아키텍처는 토큰당 컴퓨팅 비용을 이전 세대 모델의 약 1/20로 줄여주므로, 그렇게 큰 윈도우를 경제적으로 사용할 수 있게 합니다.

MiniMax M3는 무료인가요? 직접적으로는 아닙니다. MiniMax는 월 $20(플러스)부터 시작하는 구독 토큰 플랜과 토큰 단위로 청구되는 API 접근을 판매합니다. MiniMax 자체적으로는 공개된 무료 티어가 없지만, MiniMax M3를 무료로 사용하는 방법에서 사용 가능한 무료 경로를 안내합니다.

M3는 Claude Opus 4.7과 어떻게 비교되나요? MiniMax가 보고한 벤치마크에 따르면, M3는 SWE-Bench Pro(59.0%)에서 Opus 4.7에 근접하고 SVG-Bench에서는 능가하며, PostTrainBench(0.37 대 0.42)에서는 뒤처집니다. 이는 공급업체 수치이므로, 어떤 단일 숫자도 확정된 것으로 간주하기 전에 독립적인 테스트를 기다리십시오.

가중치는 언제 공개되나요? MiniMax는 2026년 6월 1일 출시 후 약 10일 이내에 오픈 웨이트와 기술 보고서를 모두 공개하겠다고 약속했습니다. 기술 보고서에는 MiniMax가 아직 공개하지 않은 매개변수 개수도 포함될 것으로 예상됩니다.

M3는 이미지와 비디오를 처리할 수 있나요? 네. M3는 기본적으로 멀티모달이며 이미지와 비디오 입력을 모두 받습니다. 또한 단순히 화면에 있는 것을 설명하는 것을 넘어 데스크톱 애플리케이션을 직접 조작하는 컴퓨터 사용 기능도 한 단계 더 나아갑니다.

요약

MiniMax M3는 최첨단 코딩, 100만 토큰 컨텍스트 윈도우, 기본 멀티모달 기능을 한곳에 모은 최초의 오픈 웨이트 모델입니다. MSA 아키텍처는 긴 컨텍스트 비용을 절감하고, 보고된 SWE-Bench Pro 점수는 비공개 최첨단 모델에 근접하며, 오픈 웨이트는 출시 후 며칠 내에 공개될 예정입니다. 솔직한 격차, 미공개 매개변수 개수, 그리고 일부 벤치마크에서 뒤처지는 부분은 독립적인 결과가 나올 때까지 추적할 가치가 있습니다. M3 위에 구축할 준비가 되었다면, API 키를 얻고, Apidog에서 첫 번째 호출과 도구 응답을 테스트한 후, 확장하기 전에 작게 시작하십시오.

Apidog에서 API 설계-첫 번째 연습

API를 더 쉽게 구축하고 사용하는 방법을 발견하세요