Gemini 3 Pro ya está disponible en el nivel gratuito de Ollama, y los desarrolladores lo notaron de inmediato. Ya no necesitas una suscripción pagada a Cloud Max o Pro para experimentar con uno de los modelos multimodales más capaces disponibles. Además, esta integración lleva el razonamiento de vanguardia de Gemini 3 Pro directamente al familiar flujo de trabajo de Ollama que millones ya utilizan para modelos locales.
A continuación, exploraremos qué cambió, cómo configurarlo y cómo maximizar el rendimiento en hardware de consumo.
¿Qué cambió con Gemini 3 Pro en Ollama?
Ollama inicialmente restringió Gemini 3 Pro a los planes de pago de Ollama Cloud. Sin embargo, el 18 de noviembre de 2025, la cuenta oficial de Ollama anunció que el modelo ahora aparece en el nivel gratuito junto con los niveles Pro y Max.
Ahora ejecutas un solo comando:
ollama run gemini-3-pro-preview
Este comando descarga y ejecuta el modelo sin cargos adicionales. Además, el modelo admite una ventana de contexto de 1 millón de tokens, entradas multimodales nativas (texto, imágenes, audio, video) y capacidades de agente avanzadas.

| Nivel | Acceso a Gemini 3 Pro | Límites de velocidad (aprox.) | Costo |
|---|---|---|---|
| Gratuito | Sí (vista previa) | Moderado | $0 |
| Pro | Sí | Más alto | Pagado |
| Max | Sí | El más alto | Mayor pago |
Este cambio democratiza el acceso. En consecuencia, desarrolladores independientes, investigadores y aficionados obtienen el mismo razonamiento de nivel de frontera que antes requería suscripciones empresariales.
Requisitos previos antes de empezar
Necesitas instalar la última versión de Ollama — La versión 0.3.12 o superior maneja los modelos alojados en la nube sin problemas. Descarga desde https://ollama.com/download.

Paso a paso: Ejecutando Gemini 3 Pro Preview en el nivel gratuito
Sigue estos pasos exactos para iniciar el modelo.
Primero, abre tu terminal y verifica que Ollama se esté ejecutando:
ollama --version
Deberías ver la versión 0.3.12 o superior.
Segundo, descarga y ejecuta el modelo directamente:
ollama run gemini-3-pro-preview

Ollama detecta automáticamente tu elegibilidad para el nivel gratuito y se conecta al backend de Google a través de tu clave API (almacenada de forma segura después de la primera ejecución). Además, la primera ejecución solicita la clave si no la tiene.
Tercero, prueba la interacción básica:
>>> Explica el entrelazamiento cuántico en términos simples pero con rigor matemático.
El modelo responde con explicaciones claras, a menudo incluyendo ecuaciones con formato LaTeX.

Además, puedes subir imágenes o documentos directamente en herramientas como Open WebUI.
Probando la API de Gemini directamente con Apidog
A veces necesitas acceso directo al endpoint de Gemini para scripting o integración. Apidog sobresale aquí porque admite la generación automática de solicitudes, variables de entorno y validación de respuestas.

Así es como se prueba el mismo modelo a través del endpoint oficial:
Abre Apidog y crea una nueva solicitud.
Establece el método en POST y la URL en:
https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent
Agrega el parámetro de consulta: key=TU_CLAVE_API
En el cuerpo (JSON), usa:
{
"contents": [{
"parts": [{
"text": "Compara Gemini 3 Pro con GPT-4o en puntos de referencia de razonamiento."
}]
}]
}
Envía la solicitud.
Apidog formatea automáticamente la respuesta, resalta el uso de tokens y te permite guardar la solicitud como una colección. Este enfoque resulta invaluable cuando encadenas llamadas o construyes agentes.
Capacidades multimodales: Visión, audio y video
Gemini 3 Pro destaca por su procesamiento multimodal nativo. Por ejemplo, le puedes proporcionar la URL de una imagen o un archivo local:
ollama run gemini-3-pro-preview
>>> (sube una imagen de un diagrama de circuito)
Explica este esquema y sugiere mejoras para la eficiencia.
El modelo analiza el diagrama, identifica los componentes y propone optimizaciones. De manera similar, puedes procesar fotogramas de video o transcripciones de audio en la misma sesión.
En la práctica, los desarrolladores reportan un rendimiento superior en tareas de comprensión de documentos en comparación con el anterior Gemini 1.5 Pro, especialmente con PDFs que mezclan texto e imágenes.
Benchmarks de rendimiento y pruebas en el mundo real
Pruebas independientes realizadas el 18 de noviembre de 2025, muestran que Gemini 3 Pro logra:
- MMLU-Pro: 88.2%
- GPQA Diamond: 82.7%
- LiveCodeBench: 74.1%
- MMMU (multimodal): 78.5%
Además, la velocidad de salida en el nivel gratuito promedia 45-60 tokens/segundo para prompts solo de texto, lo que rivaliza con los niveles de pago de modelos competidores.
Puedes lograr respuestas aún más rápidas utilizando la interfaz Open WebUI o integrando a través del endpoint compatible con OpenAI que Ollama expone.
Integrando Gemini 3 Pro en aplicaciones
Ollama expone una API compatible con OpenAI en http://localhost:11434/v1. Por lo tanto, puedes apuntar cualquier proyecto de LangChain, LlamaIndex o Haystack a ella:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="ollama", # clave ficticia
)
response = client.chat.completions.create(
model="gemini-3-pro-preview",
messages=[{"role": "user", "content": "Escribe un endpoint FastAPI para autenticación de usuario."}]
)
print(response.choices[0].message.content)
Esta compatibilidad significa que puedes intercambiar Gemini 3 Pro sin reescribir bases de código construidas para modelos GPT.
Limitaciones del nivel gratuito que debes conocer
El acceso gratuito incluye límites de velocidad generosos pero finitos. Los usuarios intensivos alcanzan los límites de 50 a 100 solicitudes por minuto, dependiendo de la región y la carga. Además, el modelo sigue alojado en la nube, por lo que la latencia depende de tu conexión (típicamente 800-1500 ms TTF).
Para un uso ilimitado, actualiza a Ollama Pro o Max, pero la mayoría de los desarrolladores encuentran que el nivel gratuito es suficiente para prototipos y trabajo diario.

Uso avanzado: Llamada a funciones y uso de herramientas
Gemini 3 Pro soporta la llamada a funciones de forma nativa. Define herramientas en tu Modelfile o a través de la API:
{
"tools": [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Obtener el clima actual",
"parameters": { ... }
}
}]
}
El modelo decide cuándo llamar a tus funciones, habilitando flujos de trabajo de agente como la navegación web o consultas a bases de datos.
Solución de problemas comunes
- Error 401/403: Regenera tu clave API de Gemini y ejecuta
ollama runnuevamente para volver a autenticar. - Modelo no encontrado: Actualiza Ollama (
ollama update) y vuelve a intentarlo. - Respuestas lentas: Cambia a una conexión por cable o úsalo durante las horas de menor actividad.
- Fallo multimodal: Asegúrate de usar la última versión de Ollama y sube archivos a través de clientes compatibles (Open WebUI funciona mejor).
Por qué esto es importante para los desarrolladores en 2025
Ahora tienes acceso a inteligencia de nivel de frontera con cero costo de infraestructura. Esto nivela drásticamente el campo de juego. Equipos pequeños construyen agentes sofisticados, investigadores evalúan el modelo SOTA más reciente y aficionados exploran la IA multimodal, todo sin la necesidad de aprobación de presupuesto.
Además, combinar esto con herramientas como Apidog para la gestión de API acelera los ciclos de desarrollo de días a horas.
Conclusión: Comienza a usar Gemini 3 Pro hoy mismo
Ejecuta ollama run gemini-3-pro-preview ahora mismo y experimenta la diferencia por ti mismo. Google y Ollama acaban de eliminar la mayor barrera para la experimentación avanzada con IA.
Descarga Apidog gratis hoy mismo para potenciar tu flujo de trabajo de prueba de API, ya sea que estés depurando solicitudes de Gemini o construyendo aplicaciones full-stack alrededor de Ollama.
El futuro de la IA abierta y accesible ha llegado. Solo necesitas un comando para unirte a él.
