Mistral은 2026년 4월 29일 Medium 3.5를 출시했습니다. API 모델 ID는 mistral-medium-3.5이고, 엔드포인트는 https://api.mistral.ai/v1/chat/completions이며, 요청 형식은 OpenAI 표준과 매우 유사하여 다른 제공업체의 기본 URL을 바꾸는 데 한 줄의 코드만 필요합니다. 주요 특징은 256K 컨텍스트 창, 네이티브 비전, 함수 호출, 24개 언어 지원, SWE-Bench Verified에서 77.6%의 성능을 달성했다는 점입니다. 이러한 수치는 현재 대부분의 팀이 구축하고 있는 에이전트 기반의 코드 중심 작업에서 GPT-5.5 및 DeepSeek V4와 동등한 수준으로 평가됩니다.
이 가이드는 인증, 중요한 모든 매개변수, Python 및 Node 예제, 비전 입력, 도구 호출, JSON 모드, 스트리밍, 오류 처리, 그리고 프롬프트 반복 작업 중 비용을 시각적으로 확인할 수 있는 Apidog 워크플로우를 다룹니다. 유사한 모델 가이드는 DeepSeek V4 API 사용 방법 및 GPT-5.5 API 사용 방법을 참조하십시오.
요약
- 엔드포인트:
POST https://api.mistral.ai/v1/chat/completions. 인증은 표준Authorization헤더의 베어러 토큰입니다. - 모델 ID:
mistral-medium-3.5. 컨텍스트 창: 256K 토큰. 가격: 입력 토큰 100만 개당 $1.5, 출력 토큰 100만 개당 $7.5. - 추론, 비전, 네이티브 함수 호출, 구조화된 JSON 출력 및 24개 언어 지원을 포함하는 128B 덴스 병합 모델입니다.
- 수정된 MIT 라이선스(고수익 기업 예외 조항 포함) 하에
mistralai/Mistral-Medium-3.5-128B로 Hugging Face에 공개 가중치가 게시되어 있습니다. - SWE-Bench Verified: 77.6%. τ³-Telecom: 91.4. 코딩, 명령어 이해 및 도구 사용에 강력합니다.
- 현재 모델과 Medium 3.5를 A/B 테스트하고, 키를 비밀 변수로 저장하고, 호출당 비용 차이를 확인하려면 Apidog를 다운로드하십시오.
Medium 3.5에서 무엇이 바뀌었나요
Medium 3은 올해 초 128K 컨텍스트를 가진 텍스트 전용 모델로 출시되었습니다. Medium 3.5는 전혀 다른 유형입니다. 이것은 Mistral의 첫 플래그십 병합 모델로, 명령어 이해, 추론 및 코딩이 단일 가중치 세트에 내장되어 있어 더 이상 채팅 체크포인트와 추론 체크포인트 중에서 선택할 필요가 없습니다. 비전 기능은 기본 제공되며, 컨텍스트는 256K로 두 배 증가했고, 함수 호출은 별도의 API 표면을 통해 추가되는 대신 모델 수준에서 통합되었습니다.

세 가지 수치가 이번 업그레이드의 핵심입니다. SWE-Bench Verified에서 77.6%를 기록하며 코드 패치 분야의 최고 선도 모델들과 어깨를 나란히 합니다. τ³-Telecom에서 91.4점을 기록하며 다중 턴 에이전트 대화에서 대부분의 범용 모델을 능가합니다. 256K 컨텍스트는 중간 규모의 코드베이스 전체 또는 몇 시간 분량의 스크립트를 잘림 없이 처리할 수 있습니다. 이 수치들은 마케팅을 위한 반올림 오류가 아니며, 모델이 추가 작업 없이 작업을 완료할 수 있는지 여부를 직접적으로 보여줍니다.
가격 변동은 예산 책정 시 고려해야 할 부분입니다. Medium 3은 입력 토큰 100만 개당 $0.40, 출력 토큰 100만 개당 $2.00였습니다. Medium 3.5는 입력 $1.5, 출력 $7.5로 약 4배 인상되었습니다. 이는 병합된 체크포인트 방식과 비전 기능, 더 긴 컨텍스트의 비용입니다. 이전 Medium 3은 대량 처리 옵션으로, Medium 3.5는 “정확한 답변이 필요할 때”의 티어로 취급하십시오.
사전 요구 사항
첫 호출 전에 네 가지를 준비하십시오.
- 결제 수단이 등록된 console.mistral.ai의 Mistral 계정. 잔액이 없으면 호출 시
402 Payment Required가 반환됩니다. - 요금이 청구될 프로젝트 범위에 맞는 API 키. 프로덕션에 배포되는 모든 것에는 계정 키보다 프로젝트 키가 더 안전합니다.
- SDK. Mistral은 Python 및 JavaScript용 공식
mistralai패키지를 게시하며, OpenAI SDK는 기본 URL을 변경하여 동일한 엔드포인트에서 작동합니다. - 터미널 기록을 스팸으로 채우지 않고 요청을 다시 재생할 수 있는 API 클라이언트. 첫 호출에는 curl이 작동합니다. 그 후에는 Apidog를 사용하여 키가 셸 기록에 남지 않도록 하고 요청 본문을 버전 관리하십시오.

키를 한 번 내보내십시오:
export MISTRAL_API_KEY="..."
엔드포인트 및 인증
Mistral의 La Plateforme은 모든 것을 하나의 기본 URL을 통해 노출합니다.
POST https://api.mistral.ai/v1/chat/completions
인증은 Authorization 헤더의 베어러 토큰입니다. 최소한의 유효한 요청은 다음과 같습니다.
curl https://api.mistral.ai/v1/chat/completions \
-H "Authorization: Bearer $MISTRAL_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "mistral-medium-3.5",
"messages": [
{"role": "user", "content": "Explain dense merged checkpoints in two sentences."}
]
}'
성공적인 응답은 choices 배열, prompt_tokens, completion_tokens, total_tokens로 나뉜 usage 블록, 그리고 추적을 위해 전달할 수 있는 id를 포함하는 JSON 본문을 반환합니다. 실패 시에는 code와 message를 포함하는 error 엔벨롭을 반환합니다. 이 형식은 OpenAI 엔벨롭과 충분히 유사하여 기존의 오류 파서가 수정 없이 작동합니다.
요청 매개변수
모든 필드는 비용 또는 동작에 매핑됩니다. mistral-medium-3.5에 대한 매핑은 다음과 같습니다.
| 매개변수 | 유형 | 값 | 참고 |
|---|---|---|---|
model |
string | mistral-medium-3.5 |
필수. |
messages |
array | role/content 쌍 | 필수. OpenAI와 동일한 스키마. |
temperature |
float | 0 ~ 1.5 | Mistral은 일반 용도에 0.7, 코드에 0.3을 권장합니다. |
top_p |
float | 0 ~ 1 | 기본값 1.0. |
max_tokens |
int | 1 ~ 컨텍스트 제한 | 출력 길이를 제한합니다. |
stream |
bool | true 또는 false | SSE 스트리밍을 활성화합니다. |
tools |
array | OpenAI 도구 사양 | 네이티브 함수 호출. |
tool_choice |
string 또는 object | auto, any, none 또는 특정 도구 |
도구 사용을 제어합니다. 참고: required 대신 any를 사용합니다. |
response_format |
object | {"type": "json_object"} 또는 JSON 스키마 |
구조화된 출력. |
random_seed |
int | 임의의 int | 재현성을 위한 설정. 참고: seed가 아닙니다. |
safe_prompt |
bool | true 또는 false | Mistral의 안전 서문을 추가합니다. |
presence_penalty |
float | -2 ~ 2 | 반복되는 주제에 벌칙을 부여합니다. |
frequency_penalty |
float | -2 ~ 2 | 반복되는 토큰에 벌칙을 부여합니다. |
OpenAI에서 마이그레이션할 때 혼동을 줄 수 있는 두 가지 작은 차이점이 있습니다: tool_choice="any"는 “도구 호출 강제”를 의미하며 (OpenAI는 required 사용), 시드 매개변수는 random_seed입니다 (OpenAI는 seed 사용). 다른 모든 것은 동일합니다.
Python 클라이언트
Mistral은 API와 1대1로 일치하는 공식 Python SDK를 제공합니다.
import os
from mistralai import Mistral
client = Mistral(api_key=os.environ["MISTRAL_API_KEY"])
response = client.chat.complete(
model="mistral-medium-3.5",
messages=[
{"role": "system", "content": "Reply in code only."},
{"role": "user", "content": "Write a Rust function that debounces events."},
],
temperature=0.3,
max_tokens=2048,
)
print("Content:", response.choices[0].message.content)
print("Total tokens:", response.usage.total_tokens)
print("Cost estimate (USD):",
response.usage.prompt_tokens * 1.5 / 1_000_000 +
response.usage.completion_tokens * 7.5 / 1_000_000)
이미 OpenAI 형태의 코드베이스가 있는 경우, OpenAI Python SDK는 기본 URL과 모델 ID 두 가지만 변경하여 Mistral 엔드포인트에서 작동합니다.
from openai import OpenAI
client = OpenAI(
api_key=os.environ["MISTRAL_API_KEY"],
base_url="https://api.mistral.ai/v1",
)
response = client.chat.completions.create(
model="mistral-medium-3.5",
messages=[{"role": "user", "content": "Hello, Mistral."}],
)
OpenAI SDK 경로는 공급업체에 독립적인 코드를 실행하는 팀에게 가장 쉬운 방법입니다. 반면 네이티브 mistralai SDK는 Mistral 고유의 기능을 깔끔하게 노출하는 방법이므로, 비전 및 구조화된 출력을 많이 사용할 계획인지에 따라 선택하십시오.
Node 클라이언트
Node에서도 동일한 두 가지 선택지가 있습니다. 네이티브 SDK:
import { Mistral } from "@mistralai/mistralai";
const client = new Mistral({ apiKey: process.env.MISTRAL_API_KEY });
const response = await client.chat.complete({
model: "mistral-medium-3.5",
messages: [
{ role: "user", content: "Explain dense merged checkpoints in plain English." },
],
temperature: 0.7,
});
console.log(response.choices[0].message.content);
console.log("Usage:", response.usage);
기존 코드와의 일관성을 위한 OpenAI SDK 경로:
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.MISTRAL_API_KEY,
baseURL: "https://api.mistral.ai/v1",
});
const response = await client.chat.completions.create({
model: "mistral-medium-3.5",
messages: [{ role: "user", content: "Hello, Mistral." }],
});
스트리밍 응답
stream: true로 설정하고 SSE 청크를 반복하십시오. 형식은 OpenAI와 정확히 일치하며, 누적 추론 추적은 별도의 사이드카 필드에 분리되는 대신 choices[].delta.content에 인터리빙됩니다.
stream = client.chat.stream(
model="mistral-medium-3.5",
messages=[{"role": "user", "content": "Stream a 300-word essay on merged checkpoints."}],
)
for chunk in stream:
delta = chunk.data.choices[0].delta.content or ""
print(delta, end="", flush=True)
터미널 출력의 경우, 동일한 길이의 프롬프트에서 Mistral 스트림 속도는 DeepSeek V4-Pro보다 빠르며, Apidog 응답 뷰어를 통한 비교 실행 결과 GPT-5.5와 거의 동일합니다.
도구 호출
Medium 3.5는 네이티브 함수 호출 기능을 제공합니다. tools 배열에 정의된 함수는 호출 가능해지며, 모델이 호출 시점을 선택합니다.
tools = [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Return the current weather for a city.",
"parameters": {
"type": "object",
"properties": {
"city": {"type": "string"},
"unit": {"type": "string", "enum": ["c", "f"]},
},
"required": ["city"],
},
},
}]
response = client.chat.complete(
model="mistral-medium-3.5",
messages=[{"role": "user", "content": "Weather in Lagos in Celsius?"}],
tools=tools,
tool_choice="auto",
)
tool_call = response.choices[0].message.tool_calls[0]
print(tool_call.function.name, tool_call.function.arguments)
이후에는 함수를 로컬에서 실행하고, 그 결과를 role: "tool" 메시지로 추가한 다음, 루프를 계속하기 위해 API를 다시 호출합니다. 이 패턴은 OpenAI의 도구 사용 루프와 동일합니다. 에이전트 기능은 τ³-Telecom 점수에서 나타나며, 실제로 이는 모델이 도구를 호출할지, 사용자에게 질문할지, 아니면 직접 답변할지 결정해야 하는 다중 턴 워크플로우에서 불필요한 단계를 줄여줍니다.
JSON 모드 및 구조화된 출력
스키마 유효성 검사가 적용된 출력을 위해 response_format에 JSON 스키마를 전달하십시오.
schema = {
"type": "json_schema",
"json_schema": {
"name": "release_note",
"schema": {
"type": "object",
"properties": {
"title": {"type": "string"},
"date": {"type": "string"},
"bullets": {"type": "array", "items": {"type": "string"}},
},
"required": ["title", "date", "bullets"],
"additionalProperties": False,
},
"strict": True,
},
}
response = client.chat.complete(
model="mistral-medium-3.5",
messages=[
{"role": "system", "content": "Reply with a single JSON object matching the schema."},
{"role": "user", "content": "Summarize today's Mistral Medium 3.5 release."},
],
response_format=schema,
)
엄격 모드는 디코딩 시점에 스키마를 강제 적용하므로, 클라이언트 측에서 Pydantic 또는 Zod 파싱 단계를 추가할 필요가 없습니다. 응답은 스키마와 일치하거나 구조화된 오류와 함께 호출이 실패합니다. 어떤 형태든 유효한 JSON만 필요한 마찰이 적은 경우에는 response_format={"type": "json_object"}로 설정하고 클라이언트 측에서 유효성을 검사하십시오.
비전 입력
Medium 3.5의 비전 인코더는 가변적인 이미지 크기와 종횡비를 처리하기 위해 처음부터 훈련되었으므로, 어떤 것도 미리 크기를 조정할 필요가 없습니다. messages 배열에서 텍스트와 함께 이미지 콘텐츠를 전달하십시오.
response = client.chat.complete(
model="mistral-medium-3.5",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "What is in this image and what is it doing wrong?"},
{"type": "image_url", "image_url": "https://example.com/diagram.png"},
],
}],
)
이미지 입력은 입력 토큰과 동일하게 100만 개당 $1.5로 청구됩니다. 이미지당 정확한 토큰 수는 해상도에 따라 달라지며, usage.prompt_tokens 필드에 보고됩니다. 대량 이미지 워크로드의 경우, 확장 전에 이미지당 토큰 비용을 미리 기록하고 압축, 자르기 또는 프레임 건너뛰기 여부를 결정하십시오.
Apidog에서 컬렉션 구축
터미널에서 요청을 다시 재생하면 크레딧이 소모되고 실행 간의 차이점을 알 수 없습니다. 실제 사용에 적합한 워크플로우:
- Apidog를 다운로드하고 프로젝트를 생성하십시오.
- 공유 내보내기에 포함되지 않도록
{{MISTRAL_API_KEY}}가 비밀 변수로 저장된 환경을 추가하십시오. Authorization: Bearer {{MISTRAL_API_KEY}}헤더와 함께{{BASE_URL}}/chat/completions로 POST 요청을 저장하십시오.- 요청을 중복시키지 않고 여러 변형에 대해 A/B 테스트를 할 수 있도록
model,temperature,tool_choice를 매개변수화하십시오. - 응답 뷰어를 사용하여 모든 실행에서
usage를 검사하십시오.prompt_tokens * 1.5 / 1_000_000 + completion_tokens * 7.5 / 1_000_000을 계산하여 호출당 비용이 모든 결과 옆에 표시되도록 작은 응답 후 스크립트를 추가하십시오.
Apidog에서 DeepSeek V4 API 컬렉션을 이미 실행 중인 팀은 이를 복제하여 기본 URL을 https://api.mistral.ai/v1로 변경하고, 모델 ID를 mistral-medium-3.5로 변경한 다음, 몇 분 안에 두 공급자 모두에서 직접 프롬프트를 실행할 수 있습니다. GPT-5.5와 비교하는 경우에도 동일한 패턴이 적용됩니다.
오류 처리
오류 엔벨롭은 OpenAI의 규칙을 밀접하게 따릅니다. 먼저 접하게 될 코드:
| 코드 | 의미 | 해결 방법 |
|---|---|---|
| 400 | 잘못된 요청 | JSON 스키마, 특히 messages와 tools를 검증하십시오. |
| 401 | 유효하지 않은 키 | console.mistral.ai에서 재생성하십시오. |
| 402 | 결제 필요 | 계정을 충전하거나 카드를 추가하십시오. |
| 403 | 모델 허용 안됨 | 키의 프로젝트 범위와 모델 ID 철자를 확인하십시오. |
| 422 | 매개변수 범위 초과 | max_tokens가 컨텍스트를 초과했거나 tool_choice 형식이 잘못되었습니다. |
| 429 | 요청 제한 | 잠시 기다린 후 지수 백오프와 함께 다시 시도하십시오. |
| 500 | 서버 오류 | 한 번 다시 시도하십시오. 반복되면 상태 페이지를 확인하십시오. |
| 503 | 과부하 | Mistral Medium 3으로 대체하거나 30초 기다리십시오. |
429 및 5xx 오류를 지수 백오프와 함께 처리하는 재시도 헬퍼로 호출을 감싸십시오. 4xx 오류는 일시적인 실패가 아니라 논리적 버그이므로 자동으로 재시도하지 마십시오. Apidog의 응답 뷰어는 잘못된 tools 페이로드를 쉽게 찾아낼 수 있는데, 오류 옆의 요청 본문에서 해당 필드가 강조 표시되기 때문입니다.
비용 제어 패턴
Medium 3에서 Medium 3.5로의 4배 가격 인상은 느슨한 라우팅에 불이익을 줍니다. 다섯 가지 패턴으로 비용을 예측 가능하게 유지할 수 있습니다.
- 기본적으로 Medium 3을 사용하고, Medium 3.5로 에스컬레이션. Medium 3에서 저렴한 첫 패스를 실행하고, 저렴한 패스가 낮은 신뢰도를 반환하거나 유효성 검사기를 통과하지 못할 때만 어려운 프롬프트를 3.5로 라우팅하십시오.
max_tokens제한. 대부분의 답변은 2,000개의 출력 토큰에 적합합니다. 256K 컨텍스트 창은 입력 대량을 위한 것이지 출력 대량을 위한 것이 아닙니다. 출력은 100만 개당 $7.5로 비싼 측면입니다.- 시스템 프롬프트를 간결하게 유지. 모든 시스템 프롬프트 토큰은 모든 호출에 대해 청구됩니다. 2K 토큰의 서문을 500 토큰으로 줄이면 대량 엔드포인트에서 입력 비용을 75% 절감할 수 있습니다.
- 모든 호출에서
usage기록.prompt_tokens,completion_tokens및 호출당 예상 USD 비용을 관찰 가능성 스택으로 전송하십시오. 급작스러운 출력 토큰 급증에 대한 경고는 사고의 사슬 영역으로 벗어난 프롬프트를 감지합니다. - 비전을 선택적으로 사용. 이미지 토큰은 빠르게 증가합니다. 전송하기 전에 관련 영역으로 자르고, 질문에 여전히 답변할 수 있는 가장 낮은 해상도로 다운스케일하십시오.
Medium 3.5와 다른 Mistral 티어 비교
2026년 4월 말 기준 Mistral 라인업:
| 모델 | 컨텍스트 | 입력 $/백만 | 출력 $/백만 | 비전 | 최적 용도 |
|---|---|---|---|---|---|
mistral-small |
32K | $0.10 | $0.30 | 아니요 | 대량 분류, 가벼운 채팅 |
mistral-medium-3 |
128K | $0.40 | $2.00 | 아니요 | 대량 처리량, 긴 채팅 |
mistral-medium-3.5 |
256K | $1.5 | $7.5 | 예 | 추론, 코드, 비전, 에이전트 |
mistral-large |
128K | $2.00 | $6.00 | 제한적 | 최첨단 텍스트 추론 |
Medium 3.5는 긴 컨텍스트, 비전 및 병합된 추론 기능을 결합한 유일한 티어입니다. Large 티어는 다른 비용 곡선(더 저렴한 출력, 더 비싼 입력)을 제공하며, 일부 텍스트 전용 벤치마크에서는 3.5를 능가합니다. 티어 이름이 아닌 워크로드에 따라 선택하십시오.
다른 공급자로부터 마이그레이션
마이그레이션은 대부분 기본 URL 변경입니다.
OpenAI에서:
- base_url="https://api.openai.com/v1"
- model="gpt-5.5"
+ base_url="https://api.mistral.ai/v1"
+ model="mistral-medium-3.5"
DeepSeek에서:
- base_url="https://api.deepseek.com/v1"
- model="deepseek-v4-pro"
+ base_url="https://api.mistral.ai/v1"
+ model="mistral-medium-3.5"
주의할 두 가지 함정:
- OpenAI의
tool_choice="required"는 Mistral에서tool_choice="any"가 됩니다. seed는random_seed가 됩니다.
프로덕션 트래픽을 전환하기 전에 기존 테스트 스위트를 통해 변경 사항을 실행하십시오. 더 좋은 방법은 하루 동안 Mistral로 트래픽을 섀도우 모드로 미러링하고, 두 응답을 기록한 다음, 프로모션 전에 Apidog에서 차이점을 비교하는 것입니다.
실제 사용 사례
Medium 3.5가 이미 그 가치를 입증하는 몇 가지 패턴:
- 코드 검토 도우미. 77.6%의 SWE-Bench Verified 점수와 256K 컨텍스트는 모델이 전체 diff와 주변 파일을 봐야 하는 PR 수준 검토에서 강력합니다.
- 긴 PDF에 대한 문서 QA. 256K 컨텍스트는 대부분의 계약, RFP 및 정책 문서를 청크 분할 없이 한 번의 호출로 처리합니다.
- 멀티모달 데이터 추출. 영수증, 스크린샷 또는 다이어그램에서 구조화된 필드를 한 번의 호출로 추출하는 것은 OCR과 별도의 텍스트 모델을 실행하는 것보다 낫습니다.
- 도구 호출을 포함하는 에이전트 루프. 네이티브 함수 호출과 높은 τ³-Telecom 점수는 토큰을 소모하는 “도구 호출 실패, 수정된 JSON으로 재시도” 사이클의 수를 줄여줍니다.
자주 묻는 질문
API에서 Mistral Medium 3.5의 모델 ID는 무엇인가요?mistral-medium-3.5입니다. Hugging Face 체크포인트는 mistralai/Mistral-Medium-3.5-128B로 게시됩니다. vLLM 또는 Unsloth를 사용하여 공개 가중치를 직접 서비스하는 경우 Hugging Face ID를 사용하십시오. 호스팅된 API의 경우 짧은 ID를 사용하십시오.
Medium 3.5는 OpenAI와 호환되나요? 유사하지만 동일하지는 않습니다. 엔드포인트 형식, 헤더, 대부분의 매개변수는 OpenAI와 정확히 일치하므로 OpenAI Python 및 Node SDK는 기본 URL 재정의를 통해 작동합니다. 두 가지 차이점은 tool_choice="any" (OpenAI의 required와 대비)와 random_seed (OpenAI의 seed와 대비)입니다.
Medium 3.5를 로컬에서 실행할 수 있나요? 예. 가중치는 수정된 MIT 라이선스(고수익 기업 예외 조항 포함) 하에 공개됩니다. 128B 매개변수 개수는 상당한 GPU 메모리가 필요함을 의미합니다. unsloth/Mistral-Medium-3.5-128B-GGUF에서 양자화된 GGUF 빌드는 단일 고급 소비자 카드에서 실행됩니다. DeepSeek V4를 로컬에서 실행하는 방법의 패턴이 직접적으로 적용됩니다.
도구 호출과 함께 스트리밍을 지원하나요? 예. 스트리밍은 OpenAI의 스트리밍 도구 호출 형식과 동일한 형태로 delta.tool_calls에 도구 호출 인자 조각을 점진적으로 반환합니다. 스트림이 닫히면 이 조각들이 완전한 JSON 객체로 누적됩니다.
전송 전에 입력 토큰을 어떻게 계산하나요? 정확한 계산을 위해 mistral-common Python 패키지의 토크나이저를 사용하십시오. 이는 API가 사용하는 토크나이저와 동일하므로, 바이트 단위의 계산이 응답의 usage.prompt_tokens와 일치합니다.
프로덕션에서 어떤 컨텍스트 길이를 계획해야 하나요? 256K 창이 상한선이지만, 가격은 선형적으로 증가합니다. 200K 토큰 호출은 모델이 생성을 시작하기도 전에 입력만으로 $0.30가 소요됩니다. 대부분의 프로덕션 워크로드는 32K 미만으로 편안하게 작동하며, 작업에 정말 필요한 경우에만 긴 컨텍스트를 사용하십시오.
무료 티어가 있나요? Mistral은 영구적인 무료 티어를 광고하지 않지만, 새 계정에는 일반적으로 소량의 시험 크레딧이 제공됩니다. 유사한 티어 모델에 대한 지속적인 무료 실험을 위해서는 DeepSeek V4 API를 무료로 사용하는 방법을 참조하십시오.
