Qu'est-ce que Qwen 3.7 ? Le Nouveau Modèle d'IA Phare d'Alibaba

Ashley Innocent

Ashley Innocent

21 May 2026

Qu'est-ce que Qwen 3.7 ? Le Nouveau Modèle d'IA Phare d'Alibaba

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

L'équipe Qwen d'Alibaba vient de lancer son nouveau fleuron, et la communauté de l'IA y prête attention. Qwen3.7-Max a fait son apparition dans un classement public avant même que quiconque en dehors d'Alibaba ne lui donne un nom, puis a été officiellement dévoilé lors du Sommet Alibaba Cloud 2026 quelques jours plus tard. C'est un modèle de raisonnement conçu pour l'ère des agents : exécution de tâches à long terme, une fenêtre contextuelle d'un million de tokens et une première place dans au moins un classement majeur d'intelligence.

Si vous développez des logiciels, un nouveau modèle de pointe n'est pas une nouvelle abstraite. Vous finirez par le connecter derrière votre propre API, valider ses réponses et simuler sa sortie pendant que votre application prend forme. C'est exactement à cela que sert Apidog ; cet article se concentre sur le modèle lui-même, afin que vous sachiez si Qwen 3.7 a sa place dans votre pile technologique. Tout ce qui suit provient de l'annonce d'Alibaba et de reportages indépendants, et là où un chiffre est encore non confirmé, nous le précisons clairement.

TL;DR

Qwen 3.7 est la nouvelle famille de modèles d'IA phares d'Alibaba, dirigée par Qwen3.7-Max-Preview, un modèle de raisonnement propriétaire avec une fenêtre contextuelle d'un million de tokens et un mode de réflexion étendu. Il a obtenu un score de 57 sur l'indice d'intelligence d'Artificial Analysis, rapporté comme le résultat n°1 de ce classement public, et environ 1 475 Elo sur le classement textuel LM Arena. À la mi-mai 2026, la variante Max est disponible en avant-première uniquement, avec un accès API en cours de déploiement sur Alibaba Cloud ; aucun modèle Qwen 3.7 à poids ouverts n'avait encore été publié.

Qu'est-ce que Qwen 3.7 ?

Qwen 3.7 est la dernière génération de grands modèles de langage de Qwen, la division IA de l'entreprise technologique chinoise Alibaba. La sortie phare est Qwen3.7-Max-Preview, décrit par Alibaba comme son modèle d'agent le plus avancé et le plus complet à ce jour.

Le nom "Max" indique le niveau supérieur. Au cours des récentes générations de Qwen, Alibaba a livré un modèle Max phare aux côtés de variantes plus petites et plus accessibles. Qwen3.7-Max-Preview est un modèle de raisonnement, ce qui signifie qu'il résout un problème étape par étape avant de répondre, plutôt que de produire une réponse en une seule passe. Cette approche de réflexion étendue est désormais la norme à la pointe de la technologie ; elle échange un peu de vitesse et de coût en tokens contre des résultats plus solides en mathématiques difficiles, en codage et en logique multi-étapes.

Deux dates sont importantes ici. Le modèle est apparu pour la première fois dans le classement textuel LM Arena vers le 14 mai 2026, listé sous un nom de prévisualisation avant qu'Alibaba n'ait rien annoncé publiquement. L'annonce formelle a eu lieu lors du Sommet Alibaba Cloud 2026 le 20 mai, le modèle étant disponible sur la plateforme API d'Alibaba le 19 mai. Ainsi, la version que la plupart des gens peuvent atteindre aujourd'hui porte le suffixe "-Preview" ; il s'agit d'une version préliminaire, et les spécificités peuvent changer avant une version stable.

Le cadrage de la communication d'Alibaba est axé sur les agents. Qwen3.7-Max est présenté moins comme un chatbot et plus comme un moteur pour le travail autonome : écriture et débogage de code, automatisation des flux de travail de bureau et exécution de longues chaînes de tâches avec une supervision minimale. Nous verrons ce que cela signifie en pratique plus loin.

La gamme de variantes Qwen 3.7

C'est là que l'honnêteté est importante, car Qwen 3.7 n'a que quelques jours et une grande partie d'internet spécule.

Ce qui est confirmé :

Ce qui n'est pas confirmé :

Le modèle des versions précédentes est instructif sans être une promesse. Alibaba s'est orienté vers le maintien de son meilleur modèle propriétaire tout en rendant open source le niveau inférieur ; cela donne aux développeurs un accès gratuit et auto-hébergeable à un modèle solide et réserve le modèle phare aux revenus API payants. Si Qwen 3.7 suit ce modèle, attendez-vous à des poids de niveau intermédiaire ouverts à terme, mais traitez toute taille ou date spécifique que vous voyez en ligne comme une spéculation jusqu'à ce qu'Alibaba la confirme.

La conclusion prudente : quand quelqu'un dit « Qwen 3.7 » aujourd'hui, il entend presque certainement Qwen3.7-Max-Preview, et ce modèle est à poids fermés.

La fenêtre contextuelle d'un million de tokens

Qwen3.7-Max-Preview dispose d'une fenêtre contextuelle d'un million de tokens, selon Artificial Analysis. C'est la quantité de texte que le modèle peut contenir en mémoire de travail à la fois : votre invite, tous les documents que vous collez, la conversation jusqu'à présent et la réponse qu'il génère.

Un million de tokens représente environ 700 000 à 750 000 mots anglais. Concrètement, cela suffit pour faire tenir un référentiel de code de taille moyenne, une pile de longs PDF ou des mois d'historique de chat dans une seule requête. Le modèle peut raisonner sur tout cela sans que vous ayez à fragmenter manuellement l'entrée ou à construire une couche de récupération.

Deux mises en garde maintiennent cette honnêteté. Premièrement, une grande fenêtre contextuelle est un plafond, pas une garantie ; les modèles récupèrent et raisonnent souvent de manière moins fiable à mesure que la fenêtre se remplit, et les tests indépendants de contexte long pour Qwen 3.7 sont encore rares. Deuxièmement, les grands contextes coûtent de l'argent. Chaque token que vous envoyez est facturé, donc une invite d'un million de tokens est une invite coûteuse. Utilisez la fenêtre complète lorsque la tâche l'exige vraiment, et réduisez-la agressivement lorsque ce n'est pas le cas.

Un contexte d'un million de tokens n'est plus rare à la pointe de la technologie. Les fleurons actuels d'OpenAI, Google et Anthropic annoncent tous des fenêtres contextuelles autour ou au-dessus de la barre du million de tokens, donc Qwen 3.7 correspond au marché ici plutôt que de le devancer.

Mode de raisonnement et de réflexion étendue

Qwen3.7-Max-Preview est un modèle de raisonnement, et cela façonne la façon dont vous l'utilisez.

Lorsque vous lui soumettez un problème difficile, le modèle génère d'abord une chaîne de pensée : une séquence interne d'étapes où il planifie, vérifie son travail et corrige le cap avant de s'engager sur une réponse finale. Sur des interfaces comme Qwen Chat, cela apparaît comme un mode « Réflexion » que vous pouvez activer pour voir la trace de raisonnement du modèle.

Le coût de ceci est visible dans les données. Lorsque Artificial Analysis a effectué son évaluation de l'indice d'intelligence, Qwen3.7-Max a généré environ 97 millions de tokens, bien au-dessus de la moyenne d'environ 24 millions de tokens pour les modèles sur ce benchmark. Les modèles de raisonnement sont verbeux par conception ; ils pensent à voix haute, et chaque token de réflexion est un token que vous payez et attendez.

Ce compromis a une forme pratique. Pour un appel de classification rapide ou une courte réécriture, toute cette délibération est un gaspillage. Pour une refonte épineuse, une preuve multi-étapes ou une tâche d'agent qui doit planifier plusieurs coups à l'avance, le raisonnement supplémentaire est ce qui rend le modèle utile. Adaptez le mode au travail.

C'est également important lorsque vous testez le modèle. Le résultat du raisonnement est plus long et plus variable qu'une simple complétion, de sorte que vos assertions doivent cibler la réponse finale plutôt que la formulation exacte de la trace de réflexion. Une configuration pratique pour cela, y compris comment inspecter chaque appel de modèle, est couverte dans le guide sur comment utiliser l'API Qwen 3.7.

Benchmarks Qwen 3.7 : où il se situe

Les chiffres de benchmark pour un modèle aussi nouveau doivent être lus avec prudence. Certains proviennent de tiers indépendants, d'autres des propres tests d'Alibaba, et une version préliminaire peut évoluer avant la sortie. Voici ce qui a été rapporté à la mi-mai 2026, avec les sources indiquées.

Indice d'intelligence d'Artificial Analysis

L'indice d'intelligence d'Artificial Analysis est un score composite qui combine des évaluations de raisonnement, de connaissances, de mathématiques et de codage en un seul chiffre. Qwen3.7-Max a obtenu un score de 57 sur cet indice, selon Artificial Analysis. Cela a été rapporté comme un bond de cinq points par rapport au score de 52 de la version précédente Qwen 3.6 Max Preview, et Artificial Analysis l'a classé comme le résultat n°1 parmi 218 modèles classés sur son classement public.

C'est une solide performance. La mise en garde est celle mentionnée ci-dessus : l'indice récompense les modèles qui réfléchissent longuement, Qwen 3.7 est très verbeux, et un seul chiffre composite masque beaucoup de détails.

Elo textuel LM Arena

LM Arena classe les modèles selon les préférences humaines. Les gens comparent deux réponses de modèles anonymes et votent pour la meilleure ; ces votes produisent une évaluation Elo, le même système utilisé aux échecs. Qwen3.7-Max-Preview est entré dans le classement textuel LM Arena avec un Elo d'environ 1 475, le plaçant à environ la 13e place au classement général dans l'arène textuelle, selon la couverture du classement. Il s'est classé plus haut dans des catégories spécifiques, notamment dans le top dix pour les mathématiques et le codage.

L'Elo et l'indice d'intelligence mesurent des choses différentes. L'indice d'intelligence est la justesse évaluée par tâche ; l'Elo est la réponse que les humains ont préférée. Un modèle peut être en tête de l'un et au milieu du peloton sur l'autre, ce qui correspond à peu près à l'image de Qwen 3.7 : un score composite en tête de classement, un classement respectable mais non dominant en termes de préférence humaine.

Affirmations de raisonnement et d'agent

L'annonce d'Alibaba a mis en évidence des résultats d'agent : Qwen3.7-Max maintenant l'exécution autonome de tâches pendant 35 heures et gérant plus de 1 000 appels d'outils en une seule exécution sans baisse de performance. Des rapports indépendants sur la génération précédente ont également placé le raisonnement de Qwen près du sommet du domaine sur des questions scientifiques de niveau supérieur. Traitez les chiffres d'agents de première partie comme des revendications de fournisseur jusqu'à ce que des tiers les reproduisent ; ils décrivent la force prévue du modèle, qui est un travail long et intensif en outils.

Comment Qwen 3.7 se compare à GPT-5.5, Claude Opus 4.7 et Gemini 3.5

Voici une comparaison côte à côte des modèles de pointe actuels. Les chiffres vérifiés sont cités ; les valeurs non confirmées ou non divulguées sont marquées afin que vous ne soyez pas induit en erreur.

Spécification Qwen3.7-Max-Preview GPT-5.5 Claude Opus 4.7 Gemini 3.5
Fournisseur Alibaba (Qwen) OpenAI Anthropic Google DeepMind
Type Modèle de raisonnement Modèle de raisonnement Modèle de raisonnement Modèle de raisonnement
Fenêtre contextuelle 1M de tokens ~1M de tokens ~1M de tokens (fourchette rapportée) ~1M+ de tokens
Poids Propriétaire Propriétaire Propriétaire Propriétaire
Indice d'Intelligence AA 57 (rapporté #1) Non spécifié ici Non spécifié ici Non spécifié ici
Phase de lancement Préversion Stable Stable Stable
Mode de raisonnement / réflexion Oui Oui Oui Oui
Principale force Tâches d'agent à long terme Agents autonomes, utilisation d'outils Code de qualité production Contexte long, efficacité des coûts

Quelques lectures honnêtes de ce tableau.

Sur l'intelligence composite brute, le score rapporté de 57 de Qwen3.7-Max sur l'indice d'intelligence d'Artificial Analysis l'a placé en tête de ce classement spécifique au lancement. C'est un résultat réel, mais il s'agit d'un seul benchmark, et les fleurons occidentaux mènent chacun des évaluations différentes qui ne sont pas toutes capturées par un seul indice.

Les différences plus claires concernent l'adéquation. Les comparaisons indépendantes de la génération actuelle décrivent généralement Claude Opus 4.7 comme le meilleur choix pour l'expédition de code de production, GPT-5.5 comme le leader pour les agents autonomes et le travail d'utilisation informatique, et Gemini 3.5 comme l'option de coût et de long contexte. La proposition de Qwen 3.7 se rapproche le plus de la voie des agents, avec les angles supplémentaires d'une tarification API compétitive et le bilan plausible d'Alibaba de rendre open-source un niveau inférieur au fleuron.

Le facteur décisif pour la plupart des équipes est l'accès, pas un classement. Les fleurons occidentaux sont stables et disponibles dans le monde entier aujourd'hui ; Qwen3.7-Max est en préversion uniquement avec un accès API toujours en cours de déploiement. Pour une comparaison plus complète et chiffrée une fois que les choses se seront calmées, consultez Qwen 3.7 vs GPT-5.5 vs Opus 4.7. Si votre liste restreinte inclut la gamme de Google, l'explication sur ce qu'est Gemini 3.5 et la comparaison dans Gemini 3.5 vs GPT-5.5 vs Opus 4.7 couvrent ce côté. Et si vous suivez le domaine plus large des modèles chinois, le résumé de ce qu'est ERNIE 5.1 vous donne le fleuron concurrent de Baidu.

Comment accéder à Qwen 3.7 aujourd'hui

À la mi-mai 2026, il existe deux voies pratiques, plus une à surveiller.

Qwen Chat. Le moyen le plus rapide d'essayer le modèle est l'interface de chat officielle sur chat.qwen.ai. Un compte gratuit vous donne accès avec des limites d'utilisation, et vous pouvez activer le mode Réflexion pour observer le raisonnement du modèle. C'est le bon point de départ pour se familiariser avant de s'engager sur du code.

API Alibaba Cloud. Qwen3.7-Max a été lancé sur la plateforme API d'Alibaba le 19 mai 2026, Alibaba décrivant un accès API plus large comme étant en cours de déploiement. Pour les récentes versions de Qwen, le modèle phare a été servi via la plateforme de modèles d'Alibaba Cloud ; consultez la documentation actuelle des modèles d'Alibaba Cloud pour le nom exact du point de terminaison et la tarification, car la disponibilité et les tarifs d'un modèle en préversion peuvent changer d'une semaine à l'autre. Pour un guide étape par étape sur la configuration des appels et la gestion de la sortie de raisonnement, le guide dédié sur comment utiliser l'API Qwen 3.7 vous guidera.

Poids ouverts. Si vous espérez auto-héberger, la réponse honnête est : pas encore. Aucun modèle Qwen 3.7 à poids ouverts n'avait été expédié à la mi-mai 2026. Si Alibaba suit son modèle récent de rendre open source le niveau inférieur au fleuron, des poids de taille moyenne téléchargeables pourraient arriver plus tard ; d'ici là, toutes les routes vers Qwen 3.7 passent par le service hébergé d'Alibaba. Les options gratuites et budgétaires à mesure qu'elles émergent sont suivies dans le guide sur la façon d' utiliser Qwen 3.7 gratuitement.

Quelle que soit la voie que vous empruntez, le modèle réside derrière une API, et votre application communique avec cette API. La conception de ces requêtes, la simulation des réponses pendant la construction et le test de l'intégration avant le lancement sont les domaines où une plateforme comme Apidog s'intègre. Téléchargez Apidog et configurez une collection de requêtes Qwen 3.7 en quelques minutes.

Conclusion

Qwen 3.7 est une entrée sérieuse à la frontière de l'IA, et il est arrivé rapidement. La version courte :

Si Qwen 3.7 figure sur votre liste restreinte, l'étape suivante consiste à l'intégrer dans une application réelle et à prouver que l'intégration tient. Apidog vous permet de concevoir la requête API, de simuler les réponses du modèle pendant que vous construisez, d'exécuter des tests automatisés sur le point de terminaison en direct et d'inspecter chaque appel. Téléchargez Apidog et transformez un titre de benchmark en quelque chose que vous avez réellement livré.

bouton

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API