Cómo usar la nueva API Gemini 2.5 06-05 Pro

La última iteración de la familia de modelos Gemini de Google, lanzada en vista previa el 5 de junio de 2025, aporta capacidades excepcionales a los desarrolladores. Esta API te permite construir aplicaciones avanzadas y multimodales que procesan texto, imágenes, vídeo y más, mientras sobresalen en tareas de razonamiento y codificación. Ya sea que busques crear aplicaciones web interactivas, analizar conjuntos de datos complejos o automatizar flujos de trabajo, esta guía te acompaña a través del proceso con precisión.

💡

Antes de continuar, ¡optimiza tus pruebas e integración de API con Apidog! Descarga Apidog gratis para simplificar el envío de solicitudes, la depuración de respuestas y la gestión de flujos de trabajo para la API Pro **Gemini 2.5 06-05**. Es el compañero perfecto para desarrolladores que trabajan con modelos de IA de vanguardia. ¡Empieza hoy mismo!

botón

Ahora, exploremos la configuración, los ajustes y los casos de uso prácticos para aprovechar todo el potencial de esta potente API.

¿Qué es la API Pro Gemini 2.5 06-05?

La API Pro **Gemini 2.5 06-05**, desarrollada por Google DeepMind, representa un pináculo en la tecnología de IA multimodal. Lanzada como una vista previa actualizada el 5 de junio de 2025, este modelo se basa en versiones anteriores, ofreciendo un rendimiento superior en tareas de codificación, razonamiento y creatividad. Cuenta con una ventana de contexto de 1 millón de tokens (con 2 millones en el horizonte), lo que le permite manejar extensas bases de código, documentos y entradas multimedia como imágenes y vídeos.

Además, la API destaca en los benchmarks, liderando la clasificación de WebDev Arena con un salto de 24 puntos Elo a 1470 y obteniendo un 84,8% en VideoMME para la comprensión de vídeo. Sus capacidades de razonamiento brillan en matemáticas, ciencia y codificación, lo que la hace ideal para desarrolladores que crean aplicaciones sofisticadas. A continuación, configuraremos tu entorno para empezar a usar esta API de forma eficaz.

Requisitos previos para usar la API Pro Gemini 2.5 06-05

Antes de empezar, asegúrate de que tu entorno de desarrollo cumple estos requisitos:

**Cuenta de Google**: Regístrate o inicia sesión en accounts.google.com para acceder a Google AI Studio.
**Clave de API**: Genera una clave a través de Google AI Studio para la autenticación.
**Python 3.7+**: Instala Python desde python.org si aún no está presente.
**Entorno virtual**: Aísla las dependencias para una gestión limpia del proyecto.
**Bibliotecas**: Instala el paquete google-generativeai para interactuar con la API.
**Apidog**: Opcional, pero recomendado para probar y depurar solicitudes de API.

Primero, instala Python y configura un entorno virtual. Ejecuta estos comandos en tu terminal:

python -m venv gemini_env
source gemini_env/bin/activate  # En Windows: gemini_env\Scripts\activate

Luego, instala la biblioteca requerida:

pip install google-generativeai

Una vez completados estos pasos, estás listo para configurar la API. Avancemos a la autenticación y configuración.

Configuración de la autenticación para la API Pro Gemini 2.5 06-05

Para usar la API Pro **Gemini 2.5 06-05**, autentica tus solicitudes con una clave de API. Sigue estos pasos para empezar:

**Navega a Google AI Studio**: Abre tu navegador y ve a aistudio.google.com.

**Inicia sesión**: Usa las credenciales de tu cuenta de Google para iniciar sesión.

**Genera clave de API**: Localiza la opción "Get API key" (Obtener clave de API) en el panel. Haz clic, sigue las indicaciones y copia la clave generada. Guárdala de forma segura; nunca la compartas públicamente.

Haz clic, sigue las indicaciones y copia la clave generada. Guárdala de forma segura; nunca la compartas públicamente.

**Establece variable de entorno**: Por seguridad, establece la clave como una variable de entorno. En tu terminal, ejecuta:

export GEMINI_API_KEY='your_api_key_here'  # En Windows: set GEMINI_API_KEY=your_api_key_here

Ahora, inicializa el cliente en Python. Aquí tienes una configuración básica:

import os
from google import genai

# Retrieve API key from environment variable
API_KEY = os.environ.get("GEMINI_API_KEY")
client = genai.Client(api_key=API_KEY)

Con la autenticación configurada, estás listo para enviar solicitudes. A continuación, exploraremos cómo realizar tu primera llamada a la API con el modelo **Gemini 2.5 06-05**.

Realizando tu primera llamada a la API con Gemini 2.5 06-05

Probemos la API Pro **Gemini 2.5 06-05** con una simple solicitud basada en texto. Este ejemplo pide al modelo que explique un concepto básico. Usa este código Python:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a text request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Explain how a neural network works in simple terms."
)

# Print the response
print(response.text)

Este código envía una solicitud POST al endpoint de la API, apuntando al modelo **Gemini 2.5 06-05**. La respuesta explica las redes neuronales en un lenguaje claro y conciso. Espera una salida como:

Una red neuronal es un modelo computacional inspirado en el cerebro humano. Consiste en capas de nodos (neuronas) que procesan datos de entrada, ajustan pesos basándose en patrones y producen una salida, como una predicción o clasificación.

Para verificar la funcionalidad, prueba esta solicitud en Apidog. Crea un nuevo proyecto, establece el método HTTP en POST, introduce la URL del endpoint (encuéntrala en la documentación de Google AI Studio), añade la cabecera Authorization: Bearer YOUR_API_KEY e incluye el payload JSON:

{
    "model": "gemini-2.5-pro-preview-06-05",
    "contents": "Explain how a neural network works in simple terms."
}

Haz clic en “Send” (Enviar) en Apidog para verificar la respuesta, el código de estado y el tiempo. Esto confirma que tu configuración funciona. Ahora, avancemos a las capacidades multimodales.

Aprovechando las características multimodales de Gemini 2.5 06-05

La API Pro **Gemini 2.5 06-05** destaca por sus capacidades multimodales, procesando texto, imágenes y vídeo. Esta sección te muestra cómo usar estas características de forma eficaz.

Procesamiento de texto e imagen

Combina prompts de texto con imágenes para tareas como el análisis de imágenes. Sube una imagen (por ejemplo, una foto de scones) y pide al modelo que la describa. Aquí tienes el código:

from google import genai
from google.genai.types import HttpOptions, Part

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a text and image request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents=[
        "Describe this image in detail.",
        Part.from_uri(
            file_uri="gs://cloud-samples-data/generative-ai/image/scones.jpg",
            mime_type="image/jpeg"
        )
    ]
)

# Print the response
print(response.text)

El modelo podría responder:

La imagen muestra una vista plana de scones de arándanos sobre papel de horno. Seis scones triangulares, de color dorado-marrón, están dispuestos en un patrón circular, con arándanos frescos esparcidos alrededor. La textura parece desmenuzable, típica de scones bien horneados.

Asegúrate de que tu imagen sea accesible a través de una URI de Google Cloud Storage o súbela directamente si es compatible. Esta capacidad es adecuada para aplicaciones como el comercio electrónico o el análisis de contenido.

Comprensión de vídeo

El modelo **Gemini 2.5 06-05** destaca en la comprensión de vídeo, obteniendo un 84,8% en el benchmark VideoMME. Envía una URL de YouTube o un archivo de vídeo con un prompt para analizar el contenido. Por ejemplo:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a video request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents=[
        "Create a spec for a learning app based on this video.",
        "https://www.youtube.com/watch?v=example_video"
    ]
)

# Print the response
print(response.text)

Esto genera una especificación detallada para una aplicación de aprendizaje interactiva, aprovechando el contenido del vídeo. La API procesa hasta 6 horas de vídeo con una ventana de contexto de 2 millones de tokens en la configuración de resolución de medios “baja”, equilibrando coste y rendimiento.

Una vez dominadas las características multimodales, abordemos la asistencia a la codificación a continuación.

Codificación con la API Pro Gemini 2.5 06-05

La API Pro **Gemini 2.5 06-05** domina las tareas de codificación, liderando la clasificación de WebDev Arena con una puntuación Elo de 1470. Genera, edita y depura código en lenguajes como Python, JavaScript y más. Así es como puedes usarla:

Generación de código

Solicita una función, como una calculadora de la secuencia de Fibonacci. Prueba esto:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a coding request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Write a Python function to calculate the Fibonacci sequence up to n terms."
)

# Print the response
print(response.text)

La salida podría ser:

def fibonacci(n):
    if n <= 0:
        return []
    elif n == 1:
        return [0]
    sequence = [0, 1]
    for i in range(2, n):
        sequence.append(sequence[i-1] + sequence[i-2])
    return sequence

# Example usage
print(fibonacci(10))  # Output: [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

Esta función es eficiente y correcta, mostrando las capacidades de razonamiento del modelo.

Depuración y optimización

Envía código existente para su análisis. Por ejemplo:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a debugging request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Debug this code for errors and suggest improvements: def fib(n): if n == 0: return 0 elif n == 1: return 1 else: return fib(n-1) + fib(n-2)"
)

# Print the response
print(response.text)

El modelo podría responder:

n

def fib(n):
    if n < 0:
        raise ValueError("Input must be non-negative")
    if n == 0:
        return 0
    elif n == 1:
        return 1
    a, b = 0, 1
    for _ in range(2, n + 1):
        a, b = b, a + b
    return b

Mejoras: Se añadió manejo de errores para entradas negativas; se reemplazó la recursión por iteración para una complejidad temporal O(n); se usó desempaquetado de tuplas para mayor claridad.

Esto mejora significativamente el rendimiento. Ahora, exploremos casos de uso avanzados.

Casos de uso avanzados para la API Pro Gemini 2.5 06-05

La API Pro **Gemini 2.5 06-05** desbloquea aplicaciones sofisticadas. Considera estos escenarios:

**Desarrollo de aplicaciones web**: Genera HTML, CSS y JavaScript para interfaces de usuario interactivas. Pide a la API: "Crea una aplicación de dictado con una animación de interfaz de micrófono y diseño responsivo". Entrega código funcional, adaptando estilos de referencias de diseño.
**De vídeo a aplicaciones de aprendizaje**: Analiza un tutorial de YouTube y crea una especificación para una aplicación interactiva, luego genera el código. Esto es adecuado para plataformas educativas.
**Análisis de bases de código**: Sube un ZIP de tu proyecto. La API, con su enorme ventana de contexto, revisa dependencias, sugiere correcciones y optimiza la lógica.

Para probarlos, usa Apidog para simular respuestas de la API y validar la funcionalidad. La transición a las mejores prácticas garantiza resultados óptimos.

Mejores prácticas para la API Pro Gemini 2.5 06-05

Maximiza la API Pro **Gemini 2.5 06-05** con estos consejos:

**Elabora prompts claros**: Especifica las tareas con precisión, por ejemplo, "Genera una función Python para ordenar una lista, manejando duplicados".
**Ajusta parámetros**: Establece thinking_budget para tareas complejas (por ejemplo, 1024 tokens) para equilibrar calidad y latencia.
**Prueba a fondo**: Usa Apidog para enviar solicitudes, verificar códigos de estado y refinar payloads.
**Protege las claves**: Almacena las claves de API en variables de entorno, no en el código.
**Monitoriza el uso**: Rastrea los límites de tasa en Google AI Studio para evitar interrupciones.

Siguiendo estos consejos, garantizas la eficiencia y fiabilidad. Concluyamos.

Conclusión: Aprovechando la API Pro Gemini 2.5 06-05

La API Pro **Gemini 2.5 06-05** permite a los desarrolladores crear aplicaciones de vanguardia. Desde la configuración y autenticación hasta el procesamiento multimodal y la codificación, esta guía te equipa para aprovechar su poder. Su liderazgo en WebDev Arena, su sólida comprensión de vídeo y sus capacidades de razonamiento la convierten en un punto de inflexión. Empieza a construir hoy mismo: experimenta en Google AI Studio, integra con Vertex AI o prueba en la aplicación Gemini. Con la práctica, crearás soluciones innovadoras sin esfuerzo.

botón