Gemini 3.5 Flash se lanzó el 19 de mayo de 2026, y Google mantuvo vivo el nivel de acceso gratuito. Flash se puede invocar desde una clave API gratuita hoy mismo; Pro llegará en junio. Si quieres usar Flash sin pagar un céntimo, aquí tienes los cinco caminos que realmente funcionan.
Esta guía se centra específicamente en la configuración práctica de Flash. Al final, tendrás una clave gratuita, ejemplos de código funcionales y una idea clara de dónde están los límites.

Resumen rápido
| Ruta | Qué obtienes | Límite |
|---|---|---|
| Aplicación Gemini | Chat completo + entrada de imágenes en Flash | Límite diario de mensajes en el nivel gratuito |
| Entorno de pruebas de Google AI Studio | Interfaz de usuario web para probar Flash con control de parámetros en bruto | Sin cuota estricta en la interfaz de usuario |
| Clave API de AI Studio | Acceso REST/SDK a gemini-3.5-flash |
~1.500 solicitudes/día |
| Créditos de nueva cuenta de Vertex AI | Acceso a Flash de grado de producción | 300 $ de crédito, 90 días |
| CLI de Gemini | Acceso a Flash desde la terminal con inicio de sesión de Google | 1.000 solicitudes diarias |
Cada ruta tiene sus ventajas y desventajas. La correcta depende de si estás construyendo, automatizando o simplemente probando Flash.
Ruta 1: Aplicación Gemini (la ruta sin configuración)
Si solo quieres hablar con Gemini 3.5 Flash, este es el camino más rápido.
- Ve a gemini.google.com
- Inicia sesión con una cuenta de Google
- En el selector de modelos, elige 3.5 Flash
- Empieza a chatear

La aplicación maneja texto, entrada de imágenes, carga de archivos y edición de documentos estilo Canvas. Los usuarios del nivel gratuito tienen un límite diario de mensajes que se restablece cada día. Si lo alcanzas, esperas o actualizas tu plan.
Donde la aplicación brilla:
- Investigación y escritura donde no necesitas programar nada
- Análisis de imágenes sin configuración de API
- Comparación lado a lado con otros modelos de chat gratuitos
Donde no ayuda:
- Construir software con Flash en el bucle
- Procesamiento por lotes
- Cualquier cosa que necesite una respuesta programable
Ruta 2: Google AI Studio (entorno de pruebas en navegador)
Google AI Studio es el entorno de pruebas para desarrolladores. Es gratuito, basado en la web y te da control total sobre cada parámetro de Flash.
- Abre aistudio.google.com
- Inicia sesión
- Haz clic en Crear nuevo prompt o elige uno de los iniciales
- En el menú desplegable del modelo, elige
gemini-3.5-flash - Escribe tu prompt y haz clic en Ejecutar

Cosas que puedes hacer aquí y que la aplicación Gemini no puede:
- Ajustar temperatura, top-K, top-P
- Establecer instrucciones del sistema
- Probar la salida estructurada en modo JSON
- Ejecutar prompts multimodales con varias imágenes
- Obtener el código Python/Node equivalente para tu prompt
- Exportar el prompt a una llamada a la API de Flash
AI Studio no cobra por el uso basado en navegador. Es la mejor ruta gratuita para la ingeniería de prompts antes de comprometerte a construir.
Ruta 3: Clave API gratuita de Gemini 3.5 Flash (la ruta de construcción)
Esta es la que la mayoría de los desarrolladores quieren. La misma cuenta de AI Studio que impulsa el entorno de pruebas también emite una clave API gratuita que funciona con gemini-3.5-flash.
Obtén la clave
- En AI Studio, haz clic en Obtener clave API en el panel de navegación izquierdo
- Elige o crea un proyecto
- Haz clic en Crear clave API
- Cópiala y guárdala en un lugar seguro

Eso es todo. Sin tarjeta de crédito. Sin llamada de verificación. La clave empieza a funcionar inmediatamente con Flash. Consulta el tutorial paso a paso completo en nuestra guía de clave API gratuita de Gemini.
Cuotas del nivel gratuito para Flash
A partir de mayo de 2026, el nivel gratuito de Google para gemini-3.5-flash se sitúa aproximadamente en:
- 1.500 solicitudes por día
- 1M de tokens por minuto
- 15 solicitudes por minuto
Los números pueden cambiar; consulta la página de precios de Google para conocer el límite actual antes de construir código de producción en torno a él. Para el cálculo completo de precios cuando superes el nivel gratuito, consulta nuestro desglose de precios de Flash.
Usa la clave de Flash
Tres ejemplos rápidos para confirmar que funciona.
Python:
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Give me three startup ideas for API tooling in 2026."
)
print(response.text)
Node.js:
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Give me three startup ideas for API tooling in 2026.",
});
console.log(response.text);
curl:
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{"contents":[{"parts":[{"text":"Hello Gemini 3.5 Flash"}]}]}'
Para la configuración completa, incluyendo streaming y llamadas a herramientas, consulta nuestra guía de la API de Gemini 3.5 Flash.
Prueba solicitudes Flash del nivel gratuito en Apidog
Si vas a quemar 1.500 solicitudes Flash al día, querrás asegurarte de que cada una haga un trabajo útil. Apidog te proporciona un espacio de trabajo donde puedes guardar el endpoint de Flash, almacenar tu clave gratuita como variable de entorno y repetir solicitudes sin reescribir curl cada vez.

El flujo:
- Descarga Apidog
- Crea una nueva solicitud, pega el curl de arriba
- Mueve la clave API a las variables de entorno de Apidog
- Guarda la solicitud, añade aserciones de respuesta
- Ejecútalo como parte de un escenario de prueba cuando cambies los prompts
El beneficio: no agotas accidentalmente tu cuota diaria de Flash depurando la misma solicitud rota cinco veces. Apidog te almacena el historial de respuestas.
Ruta 4: Créditos de nueva cuenta de Vertex AI
Si creas una cuenta nueva de Google Cloud, obtienes 300 $ en créditos válidos por 90 días. Esos créditos cubren el endpoint de Gemini 3.5 Flash alojado en Vertex AI, que es el mismo modelo pero con controles de nivel organizacional.
Cómo usarlo:
- Regístrate en cloud.google.com y confirma los 300 $ de crédito
- Habilita la API de Vertex AI
- Crea una cuenta de servicio, dale el rol
aiplatform.user - Descarga las credenciales JSON
- Llama a Flash a través del SDK de Vertex AI
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project="your-project-id", location="us-central1")
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")
print(response.text)
Vertex no tiene el mismo límite de solicitudes diarias que el nivel gratuito de AI Studio. Estás limitado por el crédito en dólares. Con Flash a aproximadamente 1,50 $ / 9 $ por 1M de tokens, 300 $ rinden mucho, posiblemente semanas de uso moderado.
A qué debes prestar atención:
- El crédito caduca en 90 días; el crédito no utilizado se pierde
- La conversión automática a pago ocurre al expirar, desactívala si no quieres sorpresas
- Vertex requiere más configuración que AI Studio, así que tenlo en cuenta en tu cronograma
Ruta 5: CLI de Gemini (la ruta de la terminal)
La CLI de Gemini es el cliente de terminal de código abierto de Google. Se autentica con tu cuenta de Google y te da una cuota diaria de 1.000 solicitudes contra el nivel gratuito de Gemini, sin necesidad de clave API.
Instala y ejecuta:
# Instalar
npm install -g @google/gemini-cli
# Ejecutar
gemini
# Dentro de la CLI, elige gemini-3.5-flash
Esta es la ruta más fácil para scripts ad-hoc de Flash desde tu terminal. También funciona como una alternativa gratuita a Claude Code para el trabajo de codificación, ya que puede leer archivos y ejecutar herramientas.
Donde la CLI brilla:
- Scripts rápidos donde de otro modo pegarías en una interfaz de chat
- Flujos de trabajo de búsqueda y resumen de código base
- Cuota diaria separada de tu cuota de clave API
Donde no ayuda:
- Integraciones de producción (usa la ruta de la clave API en su lugar)
- Cargas de trabajo que necesitan control de streaming HTTP en bruto
Ruta 6 (extra): OpenRouter y pasarelas ilimitadas
Varias pasarelas de terceros agregan acceso a modelos de IA y dirigen llamadas a Flash gratuitas o casi gratuitas a través de su servicio. El patrón se cubre en nuestra publicación Obtén la API de Gemini gratuita ilimitada.
Advertencias rápidas:
- La calidad varía; algunas pasarelas limitan agresivamente el tráfico
- Tus prompts pasan por un tercero, no envíes datos sensibles
- Algunos aceptan pagos en criptomonedas u otras soluciones alternativas
Considera esto como una copia de seguridad, no como una pila principal. Para proyectos reales, quédate con AI Studio o Vertex.
¿Qué ruta gratuita de Flash deberías elegir?
Un árbol de decisión simple:
- ¿Solo quieres chatear? Aplicación Gemini
- ¿Ingeniería de prompts? Entorno de pruebas de AI Studio
- ¿Desarrollando software? Clave API de AI Studio
- ¿Necesitas una cuota más alta y tienes una cuenta GCP nueva? Créditos de Vertex AI
- ¿Creando scripts desde tu terminal? CLI de Gemini
- ¿Quieres una escala bruta y no te importan los terceros? OpenRouter y similares
La mayoría de los desarrolladores terminan usando dos juntos: la clave de AI Studio para la construcción principal, más los créditos de Vertex para pruebas de estrés.
Flash gratuito vs. de pago: cuándo actualizar
El nivel gratuito es generoso. La mayoría de los proyectos paralelos nunca lo superan. Tres señales de que es hora de pasar a Flash de pago:
- Estás alcanzando el límite de 1.500 solicitudes/día varios días seguidos. Actualiza. Flash de pago es lo suficientemente barato como para que el tiempo de desarrollo dedicado a esquivar cuotas cueste más.
- Necesitas un mayor rendimiento por minuto. El nivel gratuito limita a 15 RPM; los niveles de pago van mucho más alto.
- Necesitas residencia de datos o registros de auditoría. Muévete a Vertex AI en una cuenta facturada.
Para el cálculo de precios de pago (tarifas por token, descuento por lotes, escenarios de costos en el mundo real), consulta nuestra guía de precios de Gemini 3.5 Flash.
Compara también el cálculo de actualización con modelos vecinos. GPT-5.5 y Claude Opus 4.7 tienen sus propias rutas gratuitas con diferentes límites; a veces la respuesta más barata es mezclar proveedores para diferentes cargas de trabajo. La comparación a tres bandas desglosa dónde gana cada uno.
Consejos para estirar el nivel gratuito de Flash
Cinco pequeños hábitos que hacen que 1.500 solicitudes/día duren más:
- Almacena en caché agresivamente. Las consultas idempotentes deben ir a tu caché, no a la API.
- Usa el modo por lotes para trabajo masivo. El modo por lotes de la API de Gemini te da un 50% de descuento en trabajos no en tiempo real; también cuenta contra una cuota separada.
- Usa salida estructurada. Un prompt de esquema JSON hace en una sola llamada lo que el análisis de expresiones regulares en texto de forma libre hace en tres.
- Prevalida las entradas en Apidog. Las aserciones de Apidog detectan solicitudes mal formadas antes de que consuman la cuota.
- Elige Flash sobre Pro por defecto. Cuando llegue Pro, tendrá cuotas más estrictas. Quédate en Flash para el trabajo rutinario.
Preguntas frecuentes
¿Es Gemini 3.5 Flash realmente gratuito? Sí, con límites. La aplicación Gemini, AI Studio y la clave API de AI Studio te dan acceso a Flash de forma gratuita con cuotas diarias. Existen niveles de pago para un mayor rendimiento.
¿Necesito una tarjeta de crédito para obtener una clave Flash gratuita? No. El nivel gratuito de AI Studio no requiere tarjeta. Vertex AI sí requiere una tarjeta para el crédito de 300 $, pero no se te cobrará hasta que actualices tu plan.
¿Puedo usar la clave Flash gratuita en producción? Técnicamente sí, pero el límite de 1.500 solicitudes/día se alcanzará rápidamente. Para producción, cambia a una cuenta facturada o a Vertex AI.
¿Será Gemini 3.5 Pro gratuito también? Históricamente, Google ha extendido el acceso de nivel gratuito a los modelos Pro en la Disponibilidad General (GA). Espera Pro en AI Studio de forma gratuita con cuotas más estrictas el próximo mes.
¿Puedo usar Flash gratuito en Cursor o VS Code? Sí, ambos admiten claves API personalizadas. El patrón es el mismo que en nuestro tutorial de Gemini 3.0 Pro con Cursor, solo cambia la cadena del modelo a gemini-3.5-flash.
¿Existen registros de uso en el nivel gratuito? Sí. Abre AI Studio, haz clic en tu proyecto y consulta la pestaña Actividad.
¿Cuál es la trampa? Dos cosas. Primero, el nivel gratuito puede usar tus prompts para mejorar los modelos de Google (puedes optar por no participar en la configuración de AI Studio). Segundo, los límites de tasa del nivel gratuito pueden cambiar sin previo aviso, no apuestes una fecha límite de lanzamiento a ellos.
Un proyecto de inicio para probar el nivel gratuito de Flash
Elige algo concreto. Construye una pequeña API que tome una URL, obtenga la página y use Flash para resumirla.
import os, requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Conéctalo en Apidog para probar la solicitud/respuesta completa, luego despliégalo en Cloud Run o en tu alojamiento preferido. Si puedes enviar eso, entiendes la ruta gratuita de Flash de principio a fin.
