Qwen 3.7 Plus est le modèle d'agent multimodal d'Alibaba : texte, image et vidéo en entrée, un contexte de 1 million de jetons et un prix abordable. Puisqu'il n'est disponible qu'en tant qu'API, les questions pratiques sont immédiates. Comment obtenir une clé, comment envoyer une image et quel est son coût ? Ce guide répond à ces trois questions.
Nous aborderons l'accès, l'obtention d'une clé, votre première requête en Python, curl et JavaScript, le format de la charge utile multimodale, la ventilation complète des prix avec des exemples de coûts, et les limites de débit. En chemin, vous utiliserez Apidog pour lancer des requêtes de test, inspecter les réponses brutes et simuler le point d'accès afin que votre application puisse continuer à se développer. Si vous souhaitez d'abord connaître les capacités et les benchmarks, commencez par notre aperçu de Qwen 3.7 Plus ; pour le fleuron textuel uniquement, consultez le guide de l'API Qwen 3.7 de base.
TL;DR
Qwen 3.7 Plus fonctionne via Alibaba Cloud Model Studio sur un point d'accès compatible OpenAI. Vous définissez une URL de base de région, transmettez votre clé en tant que jeton Bearer et appelez /chat/completions avec un ID de modèle qwen3.7-plus. Les requêtes multimodales ajoutent des parties d'image ou de vidéo au contenu du message. La tarification est de 0,40 $ par million de jetons d'entrée et de 1,60 $ par million de jetons de sortie, avec une entrée mise en cache à 0,08 $, soit environ six fois moins cher que Qwen3.7-Max. Il n'y a pas de niveau gratuit permanent, bien que les nouveaux comptes bénéficient d'un quota gratuit unique. Les jetons de vision partagent le budget de contexte, donc les images et les vidéos augmentent votre facture. Confirmez l'ID de modèle exact dans la documentation de Model Studio avant de déployer.
Comment accéder à Qwen 3.7 Plus
Contrairement au fleuron textuel, qui a passé ses premiers jours derrière un aperçu réservé au chat, Plus est une API commerciale dès le premier jour. Deux interfaces sont importantes.

Qwen Chat (chat.qwen.ai). Le moyen le plus rapide d'essayer Plus avec une image. Connectez-vous, choisissez le modèle Plus, déposez une capture d'écran et voyez comment il se base. C'est pour l'évaluation, pas l'intégration.
Alibaba Cloud Model Studio (DashScope). C'est la véritable API. Model Studio expose Plus via un point d'accès compatible OpenAI, de sorte que tout code qui communique déjà avec le SDK OpenAI peut l'appeler en échangeant l'URL de base et la clé.
Une limite importante à prendre en compte : Plus est propriétaire. Il n'y a pas de poids ou de modèles ouverts à télécharger, vous ne pouvez donc pas l'auto-héberger ou l'exécuter en mode air-gapped. Si c'est une exigence, notre aperçu de Qwen 3.7 Plus couvre les compromis en détail.
| Méthode | Accès API | Coût | Idéal pour |
|---|---|---|---|
| Qwen Chat (chat.qwen.ai) | Non | Gratuit, limité en débit | Évaluation rapide avec des images |
| Model Studio (DashScope) | Oui, compatible OpenAI | Paiement par jeton | Intégration en production |
| Auto-hébergement | Non | n/a | Non disponible ; les poids sont fermés |
Obtenir une clé API Qwen 3.7 Plus
L'accès se fait via un compte Alibaba Cloud.
- Créez un compte Alibaba Cloud et ouvrez la console Model Studio (
modelstudio.console.alibabacloud.com). - Activez Model Studio pour votre compte et votre région. Les clés sont spécifiques à la région, donc une clé de Singapour ne s'authentifiera pas à Pékin.
- Ouvrez la section des clés API et générez une clé. Elle ressemble à
sk-suivi d'une chaîne de caractères. - Copiez-la une seule fois et stockez-la comme un mot de passe.
Votre région détermine votre URL de base :
| Région | URL de base |
|---|---|
| Singapour | https://dashscope-intl.aliyuncs.com/compatible-mode/v1 |
| États-Unis (Virginie) | https://dashscope-us.aliyuncs.com/compatible-mode/v1 |
| Pékin (Chine) | https://dashscope.aliyuncs.com/compatible-mode/v1 |
Gardez la clé hors du contrôle de version. Utilisez une variable d'environnement :
# macOS / Linux
export DASHSCOPE_API_KEY="sk-your-key-here"
# Windows PowerShell
setx DASHSCOPE_API_KEY "sk-your-key-here"
Votre première requête : Python, curl et JavaScript
Le point d'accès est compatible OpenAI, vous pouvez donc utiliser le SDK OpenAI officiel pointé vers l'URL de base DashScope, ou un appel HTTP brut. L'ID du modèle est qwen3.7-plus, mais confirmez la chaîne actuelle dans la liste des modèles de Model Studio avant de déployer, car les identifiants peuvent changer.
Python avec le SDK OpenAI
Installez avec pip install openai, puis :
import os
from openai import OpenAI
client = OpenAI(
api_key=os.environ["DASHSCOPE_API_KEY"],
base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[{"role": "user", "content": "Résumez le modèle de tarification de Qwen 3.7 Plus en deux phrases."}],
)
print(resp.choices[0].message.content)
curl
curl "https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3.7-plus",
"messages": [{"role": "user", "content": "Bonjour depuis l\'API Qwen 3.7 Plus."}]
}'
JavaScript
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.DASHSCOPE_API_KEY,
baseURL: "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
});
const resp = await client.chat.completions.create({
model: "qwen3.7-plus",
messages: [{ role: "user", content: "Bonjour depuis l'API Qwen 3.7 Plus." }],
});
console.log(resp.choices[0].message.content);
Envoyer des images et des vidéos
La raison d'utiliser Plus plutôt que Max est l'entrée multimodale. Vous passez le contenu visuel comme des parties supplémentaires dans le tableau content du message, le même format que celui utilisé par l'API de vision d'OpenAI.
resp = client.chat.completions.create(
model="qwen3.7-plus",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Quel bouton soumet ce formulaire ? Donnez les coordonnées en pixels."},
{"type": "image_url", "image_url": {"url": "https://example.com/screenshot.png"}},
],
}],
)
Vous pouvez passer une image sous forme d'URL publique ou d'URI de données base64. La vidéo suit le même modèle avec une partie vidéo. C'est ce qui alimente le comportement de « GUI-grounding » : donnez une capture d'écran à Plus, et il renvoie des actions structurées comme click at (x=487, y=232). Les noms exacts des parties vidéo peuvent différer selon la région, alors consultez la documentation de compatibilité OpenAI pour le schéma actuel.
Tarification
Plus est tarifé comme un niveau multimodal économique. Voici comment il se compare au fleuron textuel.
| Modèle | Entrée / 1M | Sortie / 1M | Entrée en cache / 1M |
|---|---|---|---|
| Qwen 3.7 Plus | $0.40 | $1.60 | $0.08 |
| Qwen 3.7 Max | $2.50 | $7.50 | $0.25 |
C'est environ six fois moins cher que Max pour l'entrée. Il n'y a pas de niveau gratuit permanent, mais les nouveaux comptes Model Studio reçoivent un quota de jetons gratuit unique (généralement dans la région de Singapour) pour évaluer le modèle avant que la facturation ne passe au paiement à l'usage. Notez que l'ancienne méthode gratuite Qwen OAuth a été retirée le 15 avril 2026, ne vous basez donc pas dessus. Les chiffres officiels se trouvent sur la page de tarification de Model Studio et le guide du quota gratuit ; pour des moyens sans coût d'essayer la famille élargie, consultez notre guide Qwen 3.7 gratuit.
Ce que coûtent réellement les requêtes
Le texte est bon marché. La vision est l'endroit où la facture augmente, car les images et les vidéos sont converties en jetons qui partagent le même tarif par jeton et le même budget de contexte de 1 million. Une capture d'écran haute résolution peut représenter quelques milliers de jetons, et les images vidéo s'accumulent rapidement.
| Requête | Jetons d'entrée | Jetons de sortie | Coût approximatif |
|---|---|---|---|
| Requête texte uniquement | 10 000 | 2 000 | ~0,007 $ |
| Une capture d'écran 1080p + prompt | ~1 500 | 300 | ~0,001 $ |
| Vidéo de 30s échantillonnée à 2 ips | ~77 000 | 500 | ~0,032 $ |
Les chiffres de jetons par image sont approximatifs et dépendent de la résolution et du taux d'échantillonnage, mais la leçon est la suivante : un agent textuel sur Plus ne coûte presque rien, tandis qu'une charge de travail gourmande en vidéo peut coûter 30 fois plus cher par appel. Réduisez la taille des captures d'écran et échantillonnez la vidéo avec parcimonie. Pour une stratégie de coût plus large, consultez nos notes sur la réduction des coûts de jetons d'agent et la guerre des prix des LLM chinois de 2026 qui a placé Plus à ce prix initialement.
Limites de débit et erreurs
Model Studio applique des limites de débit par compte en requêtes par minute et en jetons par minute, et les plafonds dépendent de votre niveau de compte et de votre région plutôt que d'un chiffre unique publié. Vérifiez la page de quota dans la console pour connaître vos limites actuelles, et demandez une augmentation si vous les atteignez.
Gérez les échecs courants :
- 401 Non autorisé : clé incorrecte, ou clé d'une mauvaise région pour votre URL de base.
- 429 Trop de requêtes : vous avez atteint la limite de débit. Attendez et réessayez avec un délai exponentiel.
- 400 Mauvaise requête : généralement une charge utile multimodale mal formée, une image trop grande ou un dépassement de contexte une fois les jetons de vision comptabilisés.
Enveloppez les appels dans une tentative de réessai avec un délai exponentiel en cas de 429 et 5xx, et validez la taille de l'image avant l'envoi.
Tester et simuler l'API avec Apidog
Les requêtes multimodales sont faciles à mal faire. Vous encodez des images en base64, imbriquez des tableaux de contenu et lisez des plans d'action structurés, souvent à l'intérieur d'une boucle d'appel d'outils. Examiner cela dans un terminal devient vite lassant.

Apidog vous offre un véritable espace de travail pour cela. Envoyez des requêtes Qwen 3.7 Plus avec des parties d'image et de vidéo, inspectez la réponse JSON brute, stockez votre clé Model Studio par environnement afin de ne jamais la coller dans le code, et simulez le point d'accès afin que votre frontend se construise pendant que vous ajustez les invites. Lorsque Plus enchaîne des appels d'outils à travers une exécution d'agent GUI-et-CLI, le débogueur d'agent IA d'Apidog affiche la séquence complète afin que vous puissiez trouver où une exécution a échoué.
Téléchargez Apidog pour tester, déboguer et simuler l'API Qwen 3.7 Plus avant qu'elle n'atteigne la production.
FAQ
Existe-t-il un niveau gratuit pour l'API Qwen 3.7 Plus ? Pas de niveau gratuit permanent. Les nouveaux comptes Alibaba Cloud Model Studio reçoivent un quota de jetons gratuit unique pour évaluation, généralement dans la région de Singapour, puis la facturation passe au paiement à l'usage.
Quel est l'ID du modèle ? qwen3.7-plus sur Model Studio. Étant donné que les identifiants peuvent changer, confirmez la chaîne actuelle dans la liste des modèles de Model Studio avant de déployer.
Comment le coût des images et des vidéos est-il calculé ? Le contenu visuel est converti en jetons facturés au tarif d'entrée standard. Une capture d'écran 1080p peut coûter quelques milliers de jetons, et la vidéo ajoute des jetons par image échantillonnée, de sorte que les charges utiles multimédias importantes dominent la facture.
En quoi l'API est-elle différente de Qwen 3.7 Max ? Même forme compatible OpenAI et mêmes URL de base. Plus accepte les parties d'image et de vidéo dans le contenu du message et coûte environ six fois moins cher ; Max est uniquement textuel et conserve un léger avantage sur les benchmarks purement textuels.
Puis-je auto-héberger Qwen 3.7 Plus ? Non. Les poids sont fermés, il ne fonctionne donc que via Alibaba Cloud Model Studio.
Quelle URL de base dois-je utiliser ? Celle correspondant à la région où vous avez créé votre clé : Singapour, États-Unis (Virginie) ou Pékin. Une clé ne s'authentifiera pas auprès du point d'accès d'une région différente.
En résumé
Appeler Qwen 3.7 Plus revient à échanger l'URL de base et la clé sur le SDK OpenAI, en ajoutant des parties d'image ou de vidéo lorsque vous avez besoin de vision. La tarification est véritablement bon marché pour le texte et évolue avec votre charge utile visuelle, donc la discipline réside dans le nombre de pixels que vous envoyez, et non dans l'API elle-même. Obtenez une clé, envoyez votre première requête multimodale et testez l'ensemble du flux dans Apidog avant de l'intégrer en production.
