Gemini 3.5 Flash : Le Nouveau Modèle Rapide de Google Expliqué

Ashley Innocent

Ashley Innocent

20 May 2026

Gemini 3.5 Flash : Le Nouveau Modèle Rapide de Google Expliqué

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Google a lancé Gemini 3.5 Flash le 19 mai 2026. C'est la variante rapide et économique de la nouvelle famille 3.5, et c'est le seul modèle de cette famille que vous pouvez utiliser aujourd'hui. Gemini 3.5 Pro est annoncé pour juin 2026, mais Flash est ce qui a été lancé en premier, et c'est celui qui compte pour la plupart des charges de travail en production actuellement.

Flash est le modèle que Google a conçu pour les charges de travail qui s'exécutent réellement en 2026 : boucles d'agents longues, automatisation de terminaux, codage multifichier, analyse de documents multimodaux et chat en continu. Il fonctionne environ 4 fois plus vite que les autres modèles de pointe pour les jetons de sortie et coûte moins de la moitié de ce qu'ils coûtent par tâche.

Ce guide explique ce qu'est Gemini 3.5 Flash, ce qui est réellement nouveau, les chiffres des benchmarks, comment y accéder et comment il s'intègre au reste de votre pile, y compris Apidog pour tester les points de terminaison de l'IA.

Faits saillants sur Gemini 3.5 Flash

Pour une répartition complète des prix, y compris les limites de la version gratuite et les scénarios de coûts réels, consultez notre guide de tarification Gemini 3.5 Flash.

Quoi de neuf avec 3.5 Flash par rapport à 3 et 3.1

Gemini 3.5 Flash s'appuie sur les lignes Gemini 3 Flash et Gemini 3.1 Pro avec cinq améliorations concrètes :

  1. L'exécution d'agent devient plus précise. Flash gère des chaînes de tâches plus longues sans perdre le fil. Les appels d'outils s'effectuent dans le bon ordre. Le dispatch de sous-agents fonctionne comme une capacité de première classe, et non comme une solution de contournement.
  2. La sortie de code est plus dense. Les refactorisations multifichiers, les tâches de refactorisation à long terme et les flux de travail basés sur la CLI sont les domaines où Flash s'améliore clairement par rapport à la ligne 3.x.
  3. La génération graphique est devenue réelle. Les interfaces utilisateur web interactives, les SVG riches et les diagrammes intégrés proviennent directement du modèle. Vous n'avez plus besoin de passer par un modèle d'image séparé pour les graphiques intégrés.
  4. La vitesse de sortie augmente. Google affirme environ 4 fois plus de jetons/seconde que les autres modèles de pointe. Cela change la façon dont vous construisez les UX de streaming.
  5. Les garde-fous de sécurité se sont élargis. Des mesures de sécurité cybernétiques et CBRN plus robustes, ainsi que des outils d'interprétabilité qui expliquent pourquoi le modèle a refusé ou redirigé une requête.

Le schéma est cohérent. Google optimise Flash pour les charges de travail d'agent en production, pas seulement pour le chat. C'est la même direction qu'ont prise OpenAI et Anthropic avec GPT-5.5 et Claude Opus 4.7.

Benchmarks de Gemini 3.5 Flash

Flash surclasse largement sa catégorie. Les chiffres du tableau publié par Google :

Benchmark Ce qu'il teste Gemini 3.5 Flash
Terminal-Bench 2.1 Flux de travail CLI à long terme 76,2 %
MCP Atlas Coordination multi-outils 83,6 %
CharXiv Reasoning Interprétation de graphiques et de diagrammes 84,2 %
GDPval-AA Valeur agentique générale 1656 Elo
MRCR v2 (contexte 1M) Récupération de contexte long En tête du tableau de Google

Là où Flash mène visiblement : le raisonnement sur les graphiques, le travail d'agent multi-outils, la récupération de contexte long.

Là où il ne domine pas : SWE-Bench Verified pur est encore une lutte serrée entre Opus 4.7 et GPT-5.5. Si votre seule métrique est la correction de bugs en un seul coup, ces fleurons restent en avance. Si vous vous souciez des longues exécutions d'agents à faible coût, Flash prend le dessus.

Pour une analyse comparative plus approfondie, consultez Gemini 3.5 Flash vs GPT-5.5 vs Opus 4.7.

La famille de modèles Gemini 3.5

Gemini 3.5 Flash (disponible dès maintenant)

Flash est la variante clé. Il est immédiatement disponible via AI Studio, l'API Gemini, l'application Gemini, le mode IA dans la recherche, Antigravity, Android Studio et Gemini Enterprise.

Les prix annoncés le jour du lancement sont d'environ 1,50 $ pour 1M de jetons d'entrée et 9,00 $ pour 1M de jetons de sortie. C'est nettement plus élevé que le 3.1 Flash-Lite de l'année dernière, mais toujours beaucoup moins cher que les concurrents de niveau Pro. Consultez le guide de tarification complet pour le mode batch, l'entrée en cache et les tarifs Vertex.

Où Flash excelle :

Gemini 3.5 Pro (déploiement en juin 2026)

Pro est annoncé mais n'est pas encore livré. Google le positionne comme le fleuron agentique : la variante que vous utilisez lorsque le budget de la tâche comprend un travail autonome de plusieurs heures, des recherches approfondies ou le summum du classement. Attendez-vous à ce que les prix de Pro se rapprochent des tarifs affichés pour GPT-5.5 et Opus 4.7.

Tant que Pro n'est pas livré, Flash prend le relais. La bonne nouvelle : Flash est déjà crédible sur les benchmarks agentiques, vous n'avez donc pas à attendre pour commencer à construire.

Qu'en est-il de Nano ?

Google n'a pas lancé de variante 3.5 Nano. L'inférence sur appareil repose toujours sur la ligne 3.1 Flash-Lite. Attendez-vous à une annonce de 3.5 Nano plus proche du prochain cycle Pixel.

Où vous pouvez utiliser Gemini 3.5 Flash

Six surfaces ont été livrées le jour du lancement :

  1. Application Gemini : déploiement mondial, niveaux gratuit et payant
  2. Mode IA dans la recherche Google : réponses et suivis
  3. Google Antigravity : la plateforme d'agents de Google pour l'automatisation par l'utilisateur final
  4. API Gemini : le point d'entrée développeur via AI Studio
  5. Android Studio : assistance au codage au niveau de l'IDE pour les développeurs Android
  6. Gemini Enterprise + Plateforme d'agents : runtime d'agent géré pour une utilisation à l'échelle de l'organisation

La surface la plus récente est Gemini Spark, un agent personnel qui fonctionne 24h/24 et 7j/7 sur votre compte. Spark utilise Flash en coulisses et se connecte à votre contexte Gmail, Agenda et Drive.

Les agents d'information au sein de la recherche sont également nouveaux, de petits assistants autonomes qui regroupent les mises à jour sur les sujets que vous suivez sans que vous ayez à relancer de requêtes.

Comment commencer à utiliser Gemini 3.5 Flash

Vous avez quatre voies possibles. Chacune correspond à un cas d'utilisation différent.

1. Application Gemini (la voie du chat)

Ouvrez gemini.google.com, choisissez « 3.5 Flash » dans le sélecteur de modèle, et le tour est joué. L'interface de l'application couvre la plupart des charges de travail occasionnelles : recherche, écriture, ébauches de code, analyse d'images.

2. Google AI Studio (la voie de développement gratuite)

Rendez-vous sur ai.google.dev, connectez-vous, et vous obtiendrez une clé API avec un quota journalier gratuit. Flash est disponible sur le niveau gratuit à environ 1 500 requêtes par jour au lancement.

Si vous avez déjà utilisé l'API Google Gemini, le schéma est identique. Définissez GEMINI_API_KEY, pointez le SDK vers gemini-3.5-flash, envoyez votre requête. Consultez notre guide de la clé API Gemini gratuite pour le pas-à-pas, ou notre guide gratuit spécifique à Flash pour les cinq voies gratuites.

3. API Gemini en production

Les charges de travail en production passent par le même point de terminaison avec un compte facturé. La tarification par jeton de Flash suit le modèle standard entrée/sortie et se situe bien en dessous des concurrents phares. Voir Comment utiliser l'API Gemini 3.5 Flash pour des exemples de code complets en Python, Node et curl, ainsi que des modèles de streaming, d'utilisation d'outils et multimodaux.

Lorsque vous l'intégrez à votre pile, testez correctement le point de terminaison. Apidog gère le cycle complet requête/réponse pour les points de terminaison REST et de streaming de Flash dans un seul espace de travail, utile lorsque vous devez vérifier les appels d'outils ou les charges utiles multimodales de bout en bout.

4. Gemini Enterprise (la voie gérée)

Pour les organisations, la plateforme d'agents Gemini Enterprise intègre Flash avec des journaux d'audit, la résidence des données et le runtime de la plateforme d'agents. C'est la voie que la plupart des grandes équipes choisiront une fois qu'elles auront prototypé sur l'API développeur.

Ce pour quoi Gemini 3.5 Flash est réellement bon

Après une journée de tests publics, les tendances sont claires :

Boucles d'agents longues à faible coût. La recherche web en plusieurs étapes avec des appels d'outils s'exécute plus longtemps avant de dériver. Le score MCP Atlas de 83,6 % en est la preuve pratique. Flash choisit le bon outil plus souvent, se remet mieux des erreurs d'outil et ne tourne pas en boucle sur la même étape.

Raisonnement sur les graphiques et les documents. CharXiv à 84,2 % signifie que les rapports réels et les PDF deviennent traitables. Si vous avez créé manuellement des pipelines d'extraction de graphiques, Flash les regroupe en appels uniques.

Génération d'interfaces utilisateur interactives. Demandez un tableau de bord, obtenez du HTML fonctionnel + des widgets interactifs en un seul passage. Le bond de qualité graphique par rapport à 3.1 Flash-Lite est l'amélioration la plus visible.

Charges de travail de production sensibles aux coûts. « Moins de la moitié du coût des autres modèles de pointe » est la formulation de Google pour les tâches d'agent. Même en tenant compte des calculs marketing, le coût par tâche de Flash pour une longue exécution d'agent est sensiblement inférieur à celui d'Opus 4.7 ou GPT-5.5. Les chiffres sont dans notre analyse des prix.

Ce pour quoi Flash n'est pas encore excellent

Aucun modèle n'est une solution miracle. Trois points faibles honnêtes au premier jour :

Comment tester correctement Gemini 3.5 Flash

Deux choses importent lorsque vous intégrez un nouveau modèle dans une pile de production : la stabilité de la forme de la réponse et la justesse de l'appel d'outil.

Construisez un petit banc d'évaluation :

  1. Épinglez un ensemble d'invites représentatives
  2. Exécutez-les sur gemini-3.5-flash et votre modèle actuel
  3. Évaluez la latence, le coût des jetons et le succès de la tâche en aval
  4. Surveillez les dérives de schéma d'appel d'outil entre les versions mineures

Pour les étapes 1 et 3, Apidog vous fournit une suite de tests enregistrée pour les points de terminaison de l'API Flash, y compris le streaming. Vous pouvez rejouer les mêmes invites sur différentes versions de modèle et comparer les sorties. Téléchargez Apidog si vous souhaitez configurer cela localement.

Conseils de migration de Gemini 3.1 vers 3.5 Flash

Si vous êtes déjà sur 3.1, la migration consiste en un changement de chaîne de modèle d'une seule ligne dans la plupart des SDK. Quelques détails méritent d'être signalés :

Pour des notes de migration plus approfondies, le guide de l'API Google Gemini 3 couvre le modèle SDK en détail.

FAQ

Quand Gemini 3.5 Pro sera-t-il disponible ? Google a annoncé « un déploiement le mois prochain » le 19 mai 2026. Attendez-vous à une disponibilité générale en juin 2026 via AI Studio, l'API Gemini et Gemini Enterprise. D'ici là, Flash est la seule variante 3.5 que vous pouvez appeler.

Gemini 3.5 Flash est-il gratuit ? Oui, avec des quotas quotidiens. Le niveau standard de l'application Gemini et AI Studio avec une clé API vous donnent tous deux accès à Flash sans paiement. Consultez notre guide gratuit Flash et Obtenir l'API Gemini illimitée gratuite pour les cinq voies gratuites.

Gemini 3.5 Flash prend-il en charge l'appel de fonctions ? Oui. L'appel d'outils et le dispatch de sous-agents sont de première classe. Le score MCP Atlas de 83,6 % en est la preuve principale.

Comment Flash se compare-t-il à Opus 4.7 et GPT-5.5 ? Flash est en tête sur le coût, la vitesse de sortie et le raisonnement sur les graphiques. Opus 4.7 conserve une légère avance sur SWE-Bench Pro et l'écriture de longs textes. GPT-5.5 l'emporte sur l'efficacité des jetons. Consultez la comparaison à trois pour une analyse charge de travail par charge de travail.

Puis-je exécuter Gemini 3.5 Flash localement ? Non. Il n'y a pas de version open-weights. Pour l'inférence locale, consultez plutôt les meilleurs LLM locaux de 2026.

Gemini 3.5 Flash fonctionne-t-il avec Cursor ? Oui, via l'API Gemini standard. Le schéma est le même que pour Gemini 3.0 Pro avec Cursor.

Quel est le nom du modèle d'API pour Flash ? gemini-3.5-flash. Utilisez cette chaîne dans le SDK ou le point de terminaison REST.

Ce que cela signifie pour votre pile

Si vous exécutez une fonctionnalité IA en production aujourd'hui, voici la version courte :

Quel que soit le chemin que vous empruntez, traitez le modèle comme un composant d'un pipeline qui nécessite des tests de bout en bout. Apidog couvre spécifiquement le côté test pour l'API Gemini ; le reste de la boucle, la conception des invites, le câblage des outils, la scriptation d'évaluation, vous incombe.

Pratiquez le Design-first d'API dans Apidog

Découvrez une manière plus simple de créer et utiliser des API

Gemini 3.5 Flash : Le Nouveau Modèle Rapide de Google Expliqué