Cómo usar Gemini 3 Pro gratis con Ollama

Ashley Innocent

Ashley Innocent

19 November 2025

Cómo usar Gemini 3 Pro gratis con Ollama

Apidog para empresas

Despliegue local

SSO & RBAC

Conforme con SOC 2

Explorar Apidog Enterprise

Gemini 3 Pro ya está disponible en el nivel gratuito de Ollama, y los desarrolladores lo notaron de inmediato. Ya no necesitas una suscripción pagada a Cloud Max o Pro para experimentar con uno de los modelos multimodales más capaces disponibles. Además, esta integración lleva el razonamiento de vanguardia de Gemini 3 Pro directamente al familiar flujo de trabajo de Ollama que millones ya utilizan para modelos locales.

💡
Consejo rápido para probar la API: Cuando trabajes con la clave API de Gemini (necesaria para el acceso gratuito), descarga Apidog gratis. Simplifica las pruebas de solicitudes, la simulación de endpoints y la depuración de flujos de autenticación mucho mejor que raw curl o Postman en escenarios complejos.

A continuación, exploraremos qué cambió, cómo configurarlo y cómo maximizar el rendimiento en hardware de consumo.

¿Qué cambió con Gemini 3 Pro en Ollama?

Ollama inicialmente restringió Gemini 3 Pro a los planes de pago de Ollama Cloud. Sin embargo, el 18 de noviembre de 2025, la cuenta oficial de Ollama anunció que el modelo ahora aparece en el nivel gratuito junto con los niveles Pro y Max.

Ahora ejecutas un solo comando:

ollama run gemini-3-pro-preview

Este comando descarga y ejecuta el modelo sin cargos adicionales. Además, el modelo admite una ventana de contexto de 1 millón de tokens, entradas multimodales nativas (texto, imágenes, audio, video) y capacidades de agente avanzadas.

Tabla comparativa de acceso a Gemini 3 Pro en los niveles de Ollama
Nivel Acceso a Gemini 3 Pro Límites de velocidad (aprox.) Costo
Gratuito Sí (vista previa) Moderado $0
Pro Más alto Pagado
Max El más alto Mayor pago

Este cambio democratiza el acceso. En consecuencia, desarrolladores independientes, investigadores y aficionados obtienen el mismo razonamiento de nivel de frontera que antes requería suscripciones empresariales.

Requisitos previos antes de empezar

Necesitas instalar la última versión de Ollama — La versión 0.3.12 o superior maneja los modelos alojados en la nube sin problemas. Descarga desde https://ollama.com/download.

Descarga la última versión de Ollama

Paso a paso: Ejecutando Gemini 3 Pro Preview en el nivel gratuito

Sigue estos pasos exactos para iniciar el modelo.

Primero, abre tu terminal y verifica que Ollama se esté ejecutando:

ollama --version

Deberías ver la versión 0.3.12 o superior.

Segundo, descarga y ejecuta el modelo directamente:

ollama run gemini-3-pro-preview
Ejecuta Gemini 3 Pro Preview en Ollama

Ollama detecta automáticamente tu elegibilidad para el nivel gratuito y se conecta al backend de Google a través de tu clave API (almacenada de forma segura después de la primera ejecución). Además, la primera ejecución solicita la clave si no la tiene.

Tercero, prueba la interacción básica:

>>> Explica el entrelazamiento cuántico en términos simples pero con rigor matemático.

El modelo responde con explicaciones claras, a menudo incluyendo ecuaciones con formato LaTeX.

Ejemplo de respuesta de Gemini 3 Pro con ecuaciones LaTeX

Además, puedes subir imágenes o documentos directamente en herramientas como Open WebUI.

Probando la API de Gemini directamente con Apidog

A veces necesitas acceso directo al endpoint de Gemini para scripting o integración. Apidog sobresale aquí porque admite la generación automática de solicitudes, variables de entorno y validación de respuestas.

Interfaz de Apidog mostrando cómo probar la API de Gemini

Así es como se prueba el mismo modelo a través del endpoint oficial:

Abre Apidog y crea una nueva solicitud.

Establece el método en POST y la URL en:

https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent

Agrega el parámetro de consulta: key=TU_CLAVE_API

En el cuerpo (JSON), usa:

{
  "contents": [{
    "parts": [{
      "text": "Compara Gemini 3 Pro con GPT-4o en puntos de referencia de razonamiento."
    }]
  }]
}

Envía la solicitud.

Apidog formatea automáticamente la respuesta, resalta el uso de tokens y te permite guardar la solicitud como una colección. Este enfoque resulta invaluable cuando encadenas llamadas o construyes agentes.

Capacidades multimodales: Visión, audio y video

Gemini 3 Pro destaca por su procesamiento multimodal nativo. Por ejemplo, le puedes proporcionar la URL de una imagen o un archivo local:

ollama run gemini-3-pro-preview
>>> (sube una imagen de un diagrama de circuito)
Explica este esquema y sugiere mejoras para la eficiencia.

El modelo analiza el diagrama, identifica los componentes y propone optimizaciones. De manera similar, puedes procesar fotogramas de video o transcripciones de audio en la misma sesión.

En la práctica, los desarrolladores reportan un rendimiento superior en tareas de comprensión de documentos en comparación con el anterior Gemini 1.5 Pro, especialmente con PDFs que mezclan texto e imágenes.

Benchmarks de rendimiento y pruebas en el mundo real

Pruebas independientes realizadas el 18 de noviembre de 2025, muestran que Gemini 3 Pro logra:

Además, la velocidad de salida en el nivel gratuito promedia 45-60 tokens/segundo para prompts solo de texto, lo que rivaliza con los niveles de pago de modelos competidores.

Puedes lograr respuestas aún más rápidas utilizando la interfaz Open WebUI o integrando a través del endpoint compatible con OpenAI que Ollama expone.

Integrando Gemini 3 Pro en aplicaciones

Ollama expone una API compatible con OpenAI en http://localhost:11434/v1. Por lo tanto, puedes apuntar cualquier proyecto de LangChain, LlamaIndex o Haystack a ella:

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="ollama",  # clave ficticia
)

response = client.chat.completions.create(
    model="gemini-3-pro-preview",
    messages=[{"role": "user", "content": "Escribe un endpoint FastAPI para autenticación de usuario."}]
)
print(response.choices[0].message.content)

Esta compatibilidad significa que puedes intercambiar Gemini 3 Pro sin reescribir bases de código construidas para modelos GPT.

Limitaciones del nivel gratuito que debes conocer

El acceso gratuito incluye límites de velocidad generosos pero finitos. Los usuarios intensivos alcanzan los límites de 50 a 100 solicitudes por minuto, dependiendo de la región y la carga. Además, el modelo sigue alojado en la nube, por lo que la latencia depende de tu conexión (típicamente 800-1500 ms TTF).

Para un uso ilimitado, actualiza a Ollama Pro o Max, pero la mayoría de los desarrolladores encuentran que el nivel gratuito es suficiente para prototipos y trabajo diario.

Tabla de limitaciones del nivel gratuito de Ollama

Uso avanzado: Llamada a funciones y uso de herramientas

Gemini 3 Pro soporta la llamada a funciones de forma nativa. Define herramientas en tu Modelfile o a través de la API:

{
  "tools": [{
    "type": "function",
    "function": {
      "name": "get_weather",
      "description": "Obtener el clima actual",
      "parameters": { ... }
    }
  }]
}

El modelo decide cuándo llamar a tus funciones, habilitando flujos de trabajo de agente como la navegación web o consultas a bases de datos.

Solución de problemas comunes

Por qué esto es importante para los desarrolladores en 2025

Ahora tienes acceso a inteligencia de nivel de frontera con cero costo de infraestructura. Esto nivela drásticamente el campo de juego. Equipos pequeños construyen agentes sofisticados, investigadores evalúan el modelo SOTA más reciente y aficionados exploran la IA multimodal, todo sin la necesidad de aprobación de presupuesto.

Además, combinar esto con herramientas como Apidog para la gestión de API acelera los ciclos de desarrollo de días a horas.

Conclusión: Comienza a usar Gemini 3 Pro hoy mismo

Ejecuta ollama run gemini-3-pro-preview ahora mismo y experimenta la diferencia por ti mismo. Google y Ollama acaban de eliminar la mayor barrera para la experimentación avanzada con IA.

Descarga Apidog gratis hoy mismo para potenciar tu flujo de trabajo de prueba de API, ya sea que estés depurando solicitudes de Gemini o construyendo aplicaciones full-stack alrededor de Ollama.

El futuro de la IA abierta y accesible ha llegado. Solo necesitas un comando para unirte a él.

botón

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs