¿Qué es Gemini 3.5 Flash? Explicación del Nuevo Modelo Rápido de Google

Ashley Innocent

Ashley Innocent

20 May 2026

¿Qué es Gemini 3.5 Flash? Explicación del Nuevo Modelo Rápido de Google

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

Google lanzó Gemini 3.5 Flash el 19 de mayo de 2026. Es la variante rápida y de bajo costo de la nueva familia 3.5, y es el único modelo de esa familia que puedes usar hoy. Gemini 3.5 Pro está anunciado para junio de 2026, pero Flash fue lo primero en llegar, y es el que importa para la mayoría de las cargas de trabajo de producción en este momento.

Flash es el modelo que Google construyó para las cargas de trabajo que realmente se ejecutan en 2026: bucles de agentes largos, automatización de terminales, codificación de múltiples archivos, análisis multimodal de documentos y chat en streaming. Funciona aproximadamente 4 veces más rápido que otros modelos de vanguardia en tokens de salida y cuesta menos de la mitad de lo que cuestan por tarea.

Esta guía explica qué es Gemini 3.5 Flash, qué hay realmente de nuevo, los números de referencia, cómo acceder a él y cómo encaja junto al resto de tu pila, incluyendo Apidog para probar puntos finales de IA.

Datos rápidos sobre Gemini 3.5 Flash

Para el desglose completo de precios, incluidos los límites del nivel gratuito y los escenarios de costos reales, consulta nuestra guía de precios de Gemini 3.5 Flash.

Novedades de 3.5 Flash frente a 3 y 3.1

Gemini 3.5 Flash se basa en las líneas Gemini 3 Flash y Gemini 3.1 Pro con cinco mejoras concretas:

  1. La ejecución agéntica es más precisa. Flash maneja cadenas de tareas más largas sin perder el hilo. Las llamadas a herramientas se ejecutan en el orden correcto. El despacho de subagentes funciona como una capacidad de primera clase, no como una solución temporal.
  2. La salida de código es más densa. Las refactorizaciones de múltiples archivos, los trabajos de refactorización a largo plazo y los flujos de trabajo impulsados por CLI son donde Flash mejora claramente sobre la línea 3.x.
  3. La generación de gráficos se hizo realidad. La interfaz de usuario web interactiva, los SVG enriquecidos y los diagramas en línea salen directamente del modelo. Ya no es necesario pasar por un modelo de imagen separado para los gráficos en línea.
  4. La velocidad de salida se dispara. Google afirma aproximadamente 4 veces más tokens/segundo que otros modelos de vanguardia. Esto cambia la forma en que construyes la UX de streaming.
  5. Se ampliaron las barreras de seguridad. Salvaguardias cibernéticas y CBRN más sólidas, además de herramientas de interpretabilidad que explican por qué el modelo rechazó o redirigió una solicitud.

El patrón es consistente. Google está optimizando Flash para cargas de trabajo de agentes de producción, no solo para chat. Esa es la misma dirección que tomaron OpenAI y Anthropic con GPT-5.5 y Claude Opus 4.7.

Benchmarks de Gemini 3.5 Flash

Flash rinde muy por encima de su categoría. Los números de la tabla publicada por Google:

Benchmark Qué evalúa Gemini 3.5 Flash
Terminal-Bench 2.1 Flujos de trabajo CLI de largo alcance 76.2%
MCP Atlas Coordinación multi-herramienta 83.6%
CharXiv Reasoning Interpretación de gráficos y diagramas 84.2%
GDPval-AA Valor agéntico general 1656 Elo
MRCR v2 (1M context) Recuperación de contexto largo Cima de la tabla de Google

Donde Flash destaca visiblemente: razonamiento de gráficos, trabajo agéntico multi-herramienta, recuperación de contexto largo.

Donde no domina: el SWE-Bench Verified puro sigue siendo una carrera ajustada entre Opus 4.7 y GPT-5.5. Si tu única métrica son las correcciones de errores de un solo intento, esos buques insignia aún se adelantan. Si te importan las ejecuciones de agentes largas a bajo costo, Flash toma la delantera.

Para un desglose más profundo de los tres, consulta Gemini 3.5 Flash vs GPT-5.5 vs Opus 4.7.

La familia de modelos Gemini 3.5

Gemini 3.5 Flash (disponible ahora)

Flash es la variante de trabajo. Está disponible inmediatamente a través de AI Studio, la API de Gemini, la aplicación Gemini, el Modo IA en Búsqueda, Antigravity, Android Studio y Gemini Enterprise.

El precio reportado el día del lanzamiento ronda los $1.50 por cada 1M de tokens de entrada y $9.00 por cada 1M de tokens de salida. Eso es notablemente superior al 3.1 Flash-Lite del año pasado, pero sigue siendo mucho más barato que los competidores de nivel Pro. Consulta la guía completa de precios para el modo por lotes, la entrada en caché y las tarifas de Vertex.

Donde Flash brilla:

Gemini 3.5 Pro (lanzamiento en junio de 2026)

Pro está anunciado pero aún no se ha lanzado. Google lo está posicionando como el buque insignia agéntico: la variante que ejecutas cuando el presupuesto de la tarea incluye trabajo autónomo de varias horas, investigación profunda o la cima absoluta de la clasificación. Se espera que el precio de Pro se acerque más a las tarifas de lista de GPT-5.5 y Opus 4.7.

Hasta que Pro se lance, Flash soporta la carga. La buena noticia: Flash ya es creíble en los benchmarks agénticos, así que no tienes que esperar para empezar a construir.

¿Qué pasa con Nano?

Google no lanzó una variante 3.5 Nano. La inferencia en el dispositivo todavía se ejecuta en la línea 3.1 Flash-Lite. Espera un anuncio de 3.5 Nano más cerca del próximo ciclo de Pixel.

Dónde puedes usar Gemini 3.5 Flash

Seis plataformas se lanzaron el día del estreno:

  1. Aplicación Gemini: lanzamiento global, tanto en niveles gratuitos como de pago
  2. Modo IA en la Búsqueda de Google: respuestas y seguimientos
  3. Google Antigravity: la plataforma de agentes de Google para la automatización del usuario final
  4. API de Gemini: el punto de entrada para desarrolladores a través de AI Studio
  5. Android Studio: asistencia de codificación a nivel de IDE para desarrolladores de Android
  6. Gemini Enterprise + Plataforma de Agentes: entorno de ejecución de agentes gestionado para uso en toda la organización

La superficie más nueva es Gemini Spark, un agente personal que se ejecuta 24/7 en tu cuenta. Spark utiliza Flash internamente y se conecta a tu contexto de Gmail, Calendar y Drive.

Los agentes de información dentro de la Búsqueda también son nuevos, pequeños ayudantes autónomos que recopilan actualizaciones sobre temas que sigues sin que tengas que volver a consultarlos.

Cómo empezar a usar Gemini 3.5 Flash

Tienes cuatro caminos reales. Cada uno se asigna a un caso de uso diferente.

1. Aplicación Gemini (el camino del chat)

Abre gemini.google.com, elige "3.5 Flash" en el selector de modelos y listo. La interfaz de la aplicación cubre la mayoría de las cargas de trabajo casuales: investigación, escritura, bocetos de código, análisis de imágenes.

2. Google AI Studio (el camino de desarrollo gratuito)

Dirígete a ai.google.dev, inicia sesión y obtendrás una clave de API con una cuota diaria gratuita. Flash está en el nivel gratuito con aproximadamente 1,500 solicitudes por día en el lanzamiento.

Si ya usaste la API de Google Gemini antes, el patrón es idéntico. Configura GEMINI_API_KEY, apunta el SDK a gemini-3.5-flash, envía tu solicitud. Consulta nuestra guía de claves de API de Gemini gratuitas para el paso a paso, o nuestra guía gratuita específica de Flash para las cinco rutas gratuitas.

3. API de Gemini en producción

Las cargas de trabajo de producción se enrutan a través del mismo punto final con una cuenta facturada. El precio por token de Flash sigue el modelo estándar de entrada/salida y se sitúa muy por debajo de los competidores insignia. Consulta Cómo usar la API de Gemini 3.5 Flash para obtener ejemplos de código completos en Python, Node y curl, además de patrones de streaming, uso de herramientas y multimodales.

Cuando lo conectes a tu pila, prueba el punto final correctamente. Apidog maneja el ciclo completo de solicitud/respuesta para los puntos finales REST y de streaming de Flash en un único espacio de trabajo, útil cuando necesitas verificar llamadas a herramientas o cargas útiles multimodales de extremo a extremo.

4. Gemini Enterprise (el camino gestionado)

Para las organizaciones, la Plataforma de Agentes Gemini Enterprise incluye Flash con registros de auditoría, residencia de datos y el tiempo de ejecución de la Plataforma de Agentes. Este es el camino que la mayoría de los grandes equipos elegirán una vez que hayan prototipado en la API para desarrolladores.

Para qué es realmente bueno Gemini 3.5 Flash

Después de un día de pruebas públicas, los patrones son claros:

En qué Flash todavía no es tan bueno

Ningún modelo es una bala de plata. Tres puntos débiles honestos el primer día:

Cómo probar Gemini 3.5 Flash correctamente

Dos cosas importan cuando incorporas un nuevo modelo a una pila de producción: la estabilidad de la forma de respuesta y la corrección de las llamadas a herramientas.

Crea un pequeño arnés de evaluación:

  1. Fija un conjunto de prompts representativos
  2. Ejecútalos contra gemini-3.5-flash y tu modelo actual
  3. Califica la latencia, el costo de los tokens y el éxito de la tarea posterior
  4. Observa la desviación del esquema de llamadas a herramientas entre versiones menores

Para los pasos 1 y 3, Apidog te ofrece una suite de pruebas grabada para los puntos finales de la API Flash, incluido el streaming. Puedes reproducir los mismos prompts en diferentes versiones del modelo y comparar las salidas. Descarga Apidog si quieres configurarlo localmente.

Consejos de migración de Gemini 3.1 a 3.5 Flash

Si ya estás en 3.1, la migración es un cambio de cadena de modelo de una sola línea en la mayoría de los SDKs. Algunos detalles que vale la pena destacar:

Para notas de migración más profundas, la guía de la API de Google Gemini 3 cubre el patrón del SDK en detalle.

Preguntas Frecuentes

Qué significa esto para tu pila

Si hoy ejecutas una función de IA en producción, aquí tienes la versión corta:

Sea cual sea el camino que tomes, trata el modelo como un componente en una pipeline que necesita pruebas de extremo a extremo. Apidog cubre la parte de pruebas específicamente para la API de Gemini; el resto del bucle, el diseño de prompts, la conexión de herramientas, la escritura de scripts de evaluación, corre por tu cuenta.

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs

¿Qué es Gemini 3.5 Flash? Explicación del Nuevo Modelo Rápido de Google