Gemini 3.5 Flash a été lancé le 19 mai 2026, et Google a maintenu le niveau d'accès gratuit. Flash est accessible dès aujourd'hui via une clé API gratuite ; Pro arrive en juin. Si vous souhaitez utiliser Flash sans débourser un centime, voici les cinq voies qui fonctionnent réellement.
Ce guide se concentre spécifiquement sur la configuration pratique de Flash. À la fin, vous aurez une clé gratuite, des exemples de code fonctionnels et une idée claire des limites.

Résumé rapide
| Voie | Ce que vous obtenez | Limite |
|---|---|---|
| Application Gemini | Chat complet + saisie d'images sur Flash | Plafond quotidien de messages sur le niveau gratuit |
| Aire de jeux Google AI Studio | Interface web pour essayer Flash avec un contrôle brut des paramètres | Pas de quota strict dans l'interface |
| Clé API AI Studio | Accès REST/SDK à gemini-3.5-flash |
~1 500 requêtes/jour |
| Crédits pour nouveau compte Vertex AI | Accès Flash de qualité production | 300 $ de crédit, 90 jours |
| CLI Gemini | Accès au terminal à Flash avec connexion Google | 1 000 requêtes quotidiennes |
Chaque voie présente des compromis. La bonne dépend de si vous construisez, automatisez ou essayez simplement Flash.
Voie 1 : Application Gemini (la voie sans configuration)
Si vous voulez simplement discuter avec Gemini 3.5 Flash, c'est la voie la plus rapide.
- Allez sur gemini.google.com
- Connectez-vous avec un compte Google
- Dans le sélecteur de modèle, choisissez 3.5 Flash
- Commencez à discuter

L'application gère le texte, la saisie d'images, le téléchargement de fichiers et l'édition de documents de type Canvas. Les utilisateurs du niveau gratuit bénéficient d'un plafond quotidien de messages qui se réinitialise chaque jour. Si vous l'atteignez, vous attendez ou mettez à niveau.
Là où l'application excelle :
- Recherche et rédaction où vous n'avez pas besoin de script
- Analyse d'images sans configuration API
- Comparaison côte à côte avec d'autres modèles de chat gratuits
Là où elle ne vous aide pas :
- Construire des logiciels avec Flash intégré
- Traitement par lots
- Tout ce qui nécessite une réponse programmable
Voie 2 : Google AI Studio (aire de jeux du navigateur)
Google AI Studio est l'aire de jeux pour développeurs. C'est gratuit, basé sur le web, et cela vous donne un contrôle brut sur chaque paramètre de Flash.
- Ouvrez aistudio.google.com
- Connectez-vous
- Cliquez sur Créer une nouvelle invite ou choisissez un modèle de démarrage
- Dans le menu déroulant du modèle, choisissez
gemini-3.5-flash - Tapez votre invite et cliquez sur Exécuter

Ce que vous pouvez faire ici et que l'application Gemini ne peut pas :
- Régler la température, top-K, top-P
- Définir les instructions système
- Tester la sortie structurée en mode JSON
- Exécuter des invites multimodales avec plusieurs images
- Obtenir le code Python/Node équivalent pour votre invite
- Exporter l'invite vers un appel d'API Flash
AI Studio ne facture pas l'utilisation basée sur le navigateur. C'est la meilleure voie gratuite pour l'ingénierie d'invites avant de vous engager dans la construction.
Voie 3 : Clé API gratuite Gemini 3.5 Flash (la voie de la construction)
C'est ce que la plupart des développeurs veulent. Le même compte AI Studio qui alimente l'aire de jeux émet également une clé API gratuite qui fonctionne avec gemini-3.5-flash.
Obtenir la clé
- Dans AI Studio, cliquez sur Obtenir une clé API dans le panneau de navigation gauche
- Choisissez ou créez un projet
- Cliquez sur Créer une clé API
- Copiez-la et enregistrez-la en lieu sûr

C'est tout. Pas de carte de crédit. Pas d'appel de vérification. La clé commence à fonctionner immédiatement avec Flash. Un guide complet étape par étape est disponible dans notre guide de la clé API Gemini gratuite.
Quotas du niveau gratuit pour Flash
En mai 2026, le niveau gratuit de Google pour gemini-3.5-flash s'établit approximativement à :
- 1 500 requêtes par jour
- 1 million de tokens par minute
- 15 requêtes par minute
Les chiffres peuvent changer ; consultez la page des tarifs de Google pour connaître le plafond actuel avant de construire du code de production autour. Pour le calcul complet des tarifs lorsque vous dépassez le niveau gratuit, consultez notre répartition des tarifs Flash.
Utiliser la clé Flash
Trois exemples rapides pour confirmer que cela fonctionne.
Python :
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Give me three startup ideas for API tooling in 2026."
)
print(response.text)
Node.js :
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Give me three startup ideas for API tooling in 2026.",
});
console.log(response.text);
curl :
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{"contents":[{"parts":[{"text":"Hello Gemini 3.5 Flash"}]}]}'
Pour la configuration complète incluant le streaming et les appels d'outils, consultez notre guide de l'API Gemini 3.5 Flash.
Tester les requêtes Flash gratuites dans Apidog
Si vous comptez utiliser 1 500 requêtes Flash par jour, vous voulez vous assurer que chacune fait un travail utile. Apidog vous offre un espace de travail où vous pouvez enregistrer le point de terminaison Flash, stocker votre clé gratuite comme variable d'environnement et rejouer les requêtes sans réécrire curl à chaque fois.

Le déroulement :
- Téléchargez Apidog
- Créez une nouvelle requête, collez le curl ci-dessus
- Déplacez la clé API dans les variables d'environnement d'Apidog
- Enregistrez la requête, ajoutez des assertions de réponse
- Exécutez-la dans le cadre d'un scénario de test lorsque vous modifiez les invites
L'avantage : vous ne consommez pas accidentellement votre quota Flash quotidien en déboguant la même requête défectueuse cinq fois. Apidog met en cache l'historique des réponses pour vous.
Voie 4 : Crédits pour nouveau compte Vertex AI
Si vous créez un tout nouveau compte Google Cloud, vous obtenez 300 $ de crédits valables 90 jours. Ces crédits couvrent le point de terminaison Gemini 3.5 Flash hébergé par Vertex AI, qui est le même modèle mais avec des contrôles de niveau organisationnel.
Comment l'utiliser :
- Inscrivez-vous sur cloud.google.com et confirmez le crédit de 300 $
- Activez l'API Vertex AI
- Créez un compte de service, donnez-lui le rôle
aiplatform.user - Téléchargez les identifiants JSON
- Appelez Flash via le SDK Vertex AI
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project="your-project-id", location="us-central1")
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")
print(response.text)
Vertex n'a pas le même plafond de requêtes par jour que le niveau gratuit d'AI Studio. Vous êtes plutôt limité par le crédit en dollars. Au tarif de Flash d'environ 1,50 $ / 9 $ par million de tokens, 300 $ peuvent durer longtemps, potentiellement des semaines d'utilisation modérée.
Ce à quoi il faut faire attention :
- Le crédit expire dans 90 jours ; le crédit inutilisé est perdu
- La conversion automatique en compte payant se produit à l'expiration, désactivez-la si vous ne voulez pas de surprises
- Vertex nécessite plus de configuration qu'AI Studio, alors prenez cela en compte dans votre calendrier
Voie 5 : CLI Gemini (la voie du terminal)
La CLI Gemini est le client terminal open source de Google. Elle s'authentifie avec votre compte Google et vous donne un quota quotidien de 1 000 requêtes sur le niveau gratuit de Gemini, sans clé API requise.
Installer et exécuter :
# Installer
npm install -g @google/gemini-cli
# Exécuter
gemini
# Dans la CLI, choisissez gemini-3.5-flash
C'est la voie la plus simple pour le script Flash ad-hoc depuis votre terminal. Elle sert également d'alternative gratuite à Claude Code pour le travail de codage, car elle peut lire des fichiers et exécuter des outils.
Là où la CLI excelle :
- Scripts rapides où vous colleriez autrement dans une interface de chat
- Flux de travail de recherche + résumé de base de code
- Quota quotidien distinct de votre quota de clé API
Là où elle ne vous aide pas :
- Intégrations de production (utilisez plutôt la voie de la clé API)
- Charges de travail nécessitant un contrôle de streaming HTTP brut
Voie 6 (bonus) : OpenRouter et passerelles illimitées
Plusieurs passerelles tierces agrègent l'accès aux modèles d'IA et acheminent des appels Flash gratuits ou quasi gratuits via leur service. Ce modèle est abordé dans notre article Obtenir une API Gemini gratuite illimitée.
Mises en garde rapides :
- La qualité varie ; certaines passerelles ralentissent agressivement
- Vos invites passent par un tiers, n'envoyez pas de données sensibles
- Certaines acceptent les paiements en crypto-monnaie ou d'autres solutions de contournement
Considérez cela comme une solution de secours, pas une pile principale. Pour de véritables constructions, restez avec AI Studio ou Vertex.
Quelle voie Flash gratuite devriez-vous choisir ?
Un arbre de décision simple :
- Vous voulez juste discuter ? Application Gemini
- Élaborer des invites ? Aire de jeux AI Studio
- Construire des logiciels ? Clé API AI Studio
- Besoin d'un quota plus élevé et d'un nouveau compte GCP ? Crédits Vertex AI
- Écrire des scripts depuis votre terminal ? CLI Gemini
- Voulez une mise à l'échelle brute et ne craignez pas les tiers ? OpenRouter et similaires
La plupart des développeurs finissent par en utiliser deux ensemble : la clé AI Studio pour la construction principale, plus les crédits Vertex pour les tests de charge.
Flash gratuit vs payant : quand passer à la version supérieure
Le niveau gratuit est généreux. La plupart des projets secondaires ne le dépassent jamais. Trois signes indiquant qu'il est temps de passer à Flash payant :
- Vous atteignez le plafond de 1 500 requêtes/jour plusieurs jours de suite. Mettez à niveau. Flash payant est suffisamment bon marché pour que le temps de développement passé à esquiver les quotas coûte plus cher.
- Vous avez besoin d'un débit plus élevé par minute. Le niveau gratuit est limité à 15 requêtes/minute ; les niveaux payants vont beaucoup plus haut.
- Vous avez besoin de la résidence des données ou de journaux d'audit. Passez à Vertex AI sur un compte facturé.
Pour le calcul des tarifs payants (taux par jeton, remise par lot, scénarios de coûts réels), consultez notre guide des tarifs Gemini 3.5 Flash.
Comparez également le calcul de la mise à niveau avec les modèles voisins. GPT-5.5 et Claude Opus 4.7 ont tous deux leurs propres voies gratuites avec des limites différentes ; parfois, la réponse la moins chère est de mélanger les fournisseurs pour différentes charges de travail. La comparaison à trois explique où chacun d'eux l'emporte.
Conseils pour étirer le niveau gratuit de Flash
Cinq petites habitudes qui font durer plus longtemps 1 500 requêtes/jour :
- Mettez agressivement en cache. Les requêtes idempotentes devraient atteindre votre cache, pas l'API.
- Utilisez le mode batch pour le travail en volume. Le mode batch de l'API Gemini vous offre une réduction de 50 % sur les tâches non en temps réel ; il est également compté sur un quota séparé.
- Utilisez une sortie structurée. Une invite de schéma JSON fait en un seul appel ce qu'un analyseur de regex sur du texte libre fait en trois.
- Pré-validez les entrées dans Apidog. Les assertions d'Apidog détectent les requêtes mal formées avant qu'elles ne consomment du quota.
- Choisissez Flash plutôt que Pro par défaut. Lorsque Pro arrivera, il aura des quotas plus stricts. Restez sur Flash pour le travail de routine.
FAQ
Gemini 3.5 Flash est-il vraiment gratuit ? Oui, avec des plafonds. L'application Gemini, AI Studio et la clé API AI Studio vous donnent tous accès gratuitement à Flash avec des quotas quotidiens. Des niveaux payants existent pour un débit plus élevé.
Ai-je besoin d'une carte de crédit pour obtenir une clé Flash gratuite ? Non. Le niveau gratuit d'AI Studio ne nécessite pas de carte. Vertex AI exige une carte pour le crédit de 300 $, mais vous ne serez facturé qu'après avoir mis à niveau.
Puis-je utiliser la clé Flash gratuite en production ? Techniquement oui, mais le plafond de 1 500 requêtes/jour sera rapidement atteint. Pour la production, passez à un compte facturé ou à Vertex AI.
Gemini 3.5 Pro sera-t-il également gratuit ? Google a historiquement étendu l'accès gratuit aux modèles Pro en GA. Attendez-vous à Pro sur AI Studio gratuitement avec des quotas plus stricts le mois prochain.
Puis-je utiliser Flash gratuit dans Cursor ou VS Code ? Oui, les deux prennent en charge les clés API personnalisées. Le modèle est le même que notre tutoriel Gemini 3.0 Pro avec Cursor, il suffit de remplacer la chaîne du modèle par gemini-3.5-flash.
Existe-t-il des journaux d'utilisation sur le niveau gratuit ? Oui. Ouvrez AI Studio, cliquez sur votre projet et consultez l'onglet Activité.
Quel est le piège ? Deux choses. Premièrement, le niveau gratuit peut utiliser vos invites pour améliorer les modèles de Google (désactivation dans les paramètres d'AI Studio). Deuxièmement, les limites de débit du niveau gratuit peuvent changer sans préavis, ne pariez pas une date limite de lancement sur elles.
Un projet de démarrage pour tester le niveau gratuit de Flash
Choisissez quelque chose de concret. Créez une petite API qui prend une URL, récupère la page et utilise Flash pour la résumer.
import os, requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Connectez-le dans Apidog pour tester la requête/réponse complète, puis déployez-le sur Cloud Run ou votre hébergement de choix. Si vous pouvez livrer cela, vous comprenez le chemin Flash gratuit de bout en bout.
