Gemini 3 Pro est disponible sur le niveau gratuit d'Ollama, et les développeurs l'ont immédiatement remarqué. Vous n'avez plus besoin d'un abonnement payant Cloud Max ou Pro pour expérimenter l'un des modèles multimodaux les plus performants disponibles. De plus, cette intégration apporte la capacité de raisonnement de pointe de Gemini 3 Pro directement dans le flux de travail familier d'Ollama que des millions d'utilisateurs utilisent déjà pour les modèles locaux.
Ensuite, vous explorerez ce qui a changé, comment le configurer et comment maximiser les performances sur le matériel grand public.
Qu'est-ce qui a changé avec Gemini 3 Pro sur Ollama ?
Ollama avait initialement restreint Gemini 3 Pro aux plans Cloud payants d'Ollama. Cependant, le 18 novembre 2025, le compte officiel d'Ollama a annoncé que le modèle apparaît désormais sur le niveau gratuit, aux côtés des niveaux Pro et Max.
Vous exécutez maintenant une seule commande :
ollama run gemini-3-pro-preview
Cette commande télécharge et exécute le modèle sans barrières de facturation supplémentaires. De plus, le modèle prend en charge une fenêtre contextuelle de 1 million de tokens, des entrées multimodales natives (texte, images, audio, vidéo) et des capacités agentiques avancées.

| Niveau | Accès Gemini 3 Pro | Limites de débit (approx.) | Coût |
|---|---|---|---|
| Gratuit | Oui (préversion) | Modéré | 0 $ |
| Pro | Oui | Plus élevé | Payant |
| Max | Oui | Le plus élevé | Plus cher |
Ce changement démocratise l'accès. Par conséquent, les développeurs indépendants, les chercheurs et les amateurs bénéficient du même niveau de raisonnement de pointe qui nécessitait auparavant des abonnements d'entreprise.
Prérequis avant de commencer
Vous devez installer la dernière version d'Ollama — La version 0.3.12 ou plus récente gère les modèles hébergés dans le cloud de manière transparente. Téléchargez depuis https://ollama.com/download.

Pas à pas : Exécuter Gemini 3 Pro Preview sur le niveau gratuit
Suivez ces étapes exactes pour lancer le modèle.
Tout d'abord, ouvrez votre terminal et vérifiez qu'Ollama est en cours d'exécution :
ollama --version
Vous devriez voir la version 0.3.12 ou supérieure.
Deuxièmement, téléchargez et exécutez le modèle directement :
ollama run gemini-3-pro-preview

Ollama détecte automatiquement votre éligibilité au niveau gratuit et se connecte au backend de Google via votre clé API (stockée en toute sécurité après la première exécution). De plus, la première exécution vous invite à saisir la clé si elle n'est pas présente.
Troisièmement, testez l'interaction de base :
>>> Explain quantum entanglement in simple terms but with mathematical rigor.
Le modèle répond avec des explications claires, incluant souvent des équations formatées en LaTeX.

De plus, vous pouvez télécharger des images ou des documents directement dans des outils comme Open WebUI.
Tester l'API Gemini directement avec Apidog
Vous avez parfois besoin d'un accès direct au point d'extrémité Gemini pour le scriptage ou l'intégration. Apidog excelle ici car il prend en charge la génération automatique de requêtes, les variables d'environnement et la validation des réponses.

Voici comment tester le même modèle via le point d'extrémité officiel :
Ouvrez Apidog et créez une nouvelle requête.
Définissez la méthode sur POST et l'URL sur :
https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent
Ajoutez le paramètre de requête : key=YOUR_API_KEY
Dans le corps (JSON), utilisez :
{
"contents": [{
"parts": [{
"text": "Compare Gemini 3 Pro to GPT-4o on reasoning benchmarks."
}]
}]
}
Envoyez la requête.
Apidog formate automatiquement la réponse, met en évidence l'utilisation des tokens et vous permet d'enregistrer la requête en tant que collection. Cette approche s'avère inestimable lorsque vous enchaînez des appels ou construisez des agents.
Capacités multimodales : Vision, Audio et Vidéo
Gemini 3 Pro se distingue par son traitement multimodal natif. Par exemple, vous pouvez lui fournir une URL d'image ou un fichier local :
ollama run gemini-3-pro-preview
>>> (upload image of a circuit diagram)
Explain this schematic and suggest improvements for efficiency.
Le modèle analyse le diagramme, identifie les composants et propose des optimisations. De même, vous pouvez traiter des images vidéo ou des transcriptions audio dans la même session.
En pratique, les développeurs rapportent des performances supérieures pour les tâches de compréhension de documents par rapport à l'ancien Gemini 1.5 Pro, en particulier avec les PDF combinant texte et images.
Benchmarks de performance et tests réels
Des tests indépendants menés le 18 novembre 2025 montrent que Gemini 3 Pro atteint :
- MMLU-Pro : 88,2 %
- GPQA Diamond : 82,7 %
- LiveCodeBench : 74,1 %
- MMMU (multimodal) : 78,5 %
De plus, la vitesse de sortie sur le niveau gratuit est en moyenne de 45 à 60 tokens/seconde pour les invites textuelles uniquement, ce qui rivalise avec les niveaux payants des modèles concurrents.
Vous obtenez des réponses encore plus rapides en utilisant l'interface Open WebUI ou en l'intégrant via le point d'extrémité compatible OpenAI qu'Ollama expose.
Intégration de Gemini 3 Pro dans les applications
Ollama expose une API compatible OpenAI à l'adresse http://localhost:11434/v1. Par conséquent, vous pouvez y pointer n'importe quel projet LangChain, LlamaIndex ou Haystack :
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="ollama", # dummy key
)
response = client.chat.completions.create(
model="gemini-3-pro-preview",
messages=[{"role": "user", "content": "Write a FastAPI endpoint for user auth."}]
)
print(response.choices[0].message.content)
Cette compatibilité signifie que vous pouvez remplacer des modèles GPT par Gemini 3 Pro sans réécrire les bases de code.
Limitations du niveau gratuit que vous devriez connaître
L'accès gratuit comprend des limites de débit généreuses mais finies. Les utilisateurs intensifs atteignent des plafonds d'environ 50 à 100 requêtes par minute, selon la région et la charge. De plus, le modèle reste hébergé dans le cloud, donc la latence dépend de votre connexion (généralement 800 à 1500 ms TTF).
Pour une utilisation illimitée, passez à Ollama Pro ou Max, mais la plupart des développeurs trouvent le niveau gratuit suffisant pour le prototypage et le travail quotidien.

Utilisation avancée : Appel de fonctions et utilisation d'outils
Gemini 3 Pro prend en charge l'appel de fonctions natif. Définissez des outils dans votre Modelfile ou via l'API :
{
"tools": [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get current weather",
"parameters": { ... }
}
}]
}
Le modèle décide ensuite quand appeler vos fonctions, permettant des workflows agentiques comme la navigation web ou les requêtes de base de données.
Dépannage des problèmes courants
- Erreur 401/403 : Régénérez votre clé API Gemini et exécutez
ollama runà nouveau pour vous réauthentifier. - Modèle introuvable : Mettez à jour Ollama (
ollama update) et réessayez. - Réponses lentes : Passez à une connexion filaire ou utilisez pendant les heures creuses.
- Échec du multimodal : Assurez-vous d'utiliser la dernière version d'Ollama et de télécharger les fichiers via les clients pris en charge (Open WebUI fonctionne le mieux).
Pourquoi cela compte pour les développeurs en 2025
Vous accédez désormais à une intelligence de pointe sans coût d'infrastructure. Cela égalise considérablement les chances. Les petites équipes construisent des agents sophistiqués, les chercheurs se mesurent au dernier modèle SOTA, et les amateurs explorent l'IA multimodale, le tout sans approbation budgétaire.
De plus, la combinaison de cela avec des outils comme Apidog pour la gestion des API accélère les cycles de développement de jours en heures.
Conclusion : Commencez à utiliser Gemini 3 Pro dès aujourd'hui
Exécutez ollama run gemini-3-pro-preview dès maintenant et constatez la différence par vous-même. Google et Ollama viennent de lever la plus grande barrière à l'expérimentation avancée en IA.
Téléchargez Apidog gratuitement dès aujourd'hui pour dynamiser votre workflow de test d'API, que vous déboguiez des requêtes Gemini ou que vous construisiez des applications full-stack autour d'Ollama.
L'avenir de l'IA ouverte et accessible est arrivé. Vous n'avez besoin que d'une seule commande pour y prendre part.
