Comment exécuter OpenClaw avec Ollama ?

EN BREF

Ollama est le moyen le plus simple d'exécuter des modèles d'IA puissants localement. Combiné à OpenClaw, il crée un assistant IA gratuit et axé sur la confidentialité qui rivalise avec les alternatives payantes. Ce guide vous expliquera comment configurer Ollama, choisir le bon modèle et l'intégrer à OpenClaw pour votre assistant IA personnel.

Introduction

Exécuter l'IA localement était autrefois une activité de passionné, nécessitant une configuration complexe et du matériel coûteux. Ollama a changé cela. Avec une simple commande d'installation et une API intuitive, Ollama rend l'exécution de modèles d'IA localement accessible à tous.

ollama lance openclaw --modèle qwen3.5:35b

Lorsqu'il est associé à OpenClaw, vous obtenez un assistant IA puissant qui :

Ne coûte rien à l'utilisation (après la configuration initiale)
Garde vos données 100 % privées
Fonctionne hors ligne une fois les modèles téléchargés
Offre un contrôle total de la personnalisation

Ce guide couvre tout ce dont vous avez besoin pour commencer.

Pourquoi utiliser Ollama avec OpenClaw

Avantages de l'IA locale

Confidentialité : Vos conversations ne quittent jamais votre machine
Pas de coûts d'API : Payez une fois pour le matériel, utilisez-le de manière illimitée
Accès hors ligne : Fonctionne sans internet
Contrôle total : Personnalisez les modèles et les invites
Pas de limites de débit : Utilisez autant que vous le souhaitez

Pourquoi Ollama

Ollama se distingue pour plusieurs raisons :

Installation simple : Une seule commande pour démarrer
Bibliothèque de modèles : Plus de 100 modèles disponibles
Multiplateforme : Fonctionne sur macOS, Linux, Windows
API-first : Intégration facile avec OpenClaw
Développement actif : Mises à jour régulières et nouveaux modèles

Prérequis

Avant de commencer, assurez-vous d'avoir :

Exigences matérielles

Taille du modèle	RAM minimale	RAM recommandée
Paramètres 7B	8 Go	16 Go
Paramètres 14B	16 Go	32 Go
Paramètres 32B	32 Go	64 Go
Paramètres 70B	64 Go	128 Go

Exigences logicielles

macOS 10.15+, Linux, ou Windows 10+
Accès administrateur/root pour l'installation
Connexion Internet pour les téléchargements initiaux
Familiarité avec la ligne de commande

Ce dont vous aurez besoin

Un ordinateur répondant aux exigences de RAM
Internet pour le téléchargement des modèles
Du temps pour les téléchargements initiaux des modèles (varie selon la taille et la connexion)

Installation d'Ollama

Installation sur macOS

La méthode la plus simple utilise Homebrew :

brew install ollama

Ou utilisez le script d'installation officiel :

curl -fsSL https://ollama.ai/install.sh | sh

Installation sur Linux

# Utilisation du script d'installation (recommandé)
curl -fsSL https://ollama.ai/install.sh | sh

# Ou téléchargez le binaire directement
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Installation sur Windows

Téléchargez l'installateur
Exécutez l'installateur
Suivez les instructions à l'écran

Vérification de l'installation

ollama --version

Vous devriez voir une sortie comme ollama version 0.15.0 ou plus récente.

Démarrage du service Ollama

Ollama fonctionne comme un service d'arrière-plan :

# Vérifier si Ollama est en cours d'exécution
ollama list

# Démarrer Ollama si non exécuté
ollama serve

Vérifier si ollama est en cours d'exécution avec la commande ollama list

Choisir le bon modèle

Ollama prend en charge plus de 100 modèles. Voici comment choisir :

Par cas d'utilisation

Cas d'utilisation	Modèles recommandés
Conversation générale	Qwen3.5, Llama 3.2, Mistral
Assistance au codage	Qwen3.5-Coder, DeepSeek-Coder
Raisonnement/mathématiques	DeepSeek-R1, Qwen3.5
Matériel plus petit	Phi3.5, Gemma2.2B

Par matériel

RAM disponible	Recommandé
8 Go	Modèles 7B (Qwen3.5, Llama3.2, Mistral)
16 Go	Modèles 8-14B
32 Go	Modèles 14-32B
64 Go+	Modèles 70B+

Modèles populaires en 2026

Qwen3.5 — Excellente performance globale, raisonnement solide, bon pour le codage. Le choix le plus populaire pour OpenClaw en 2026.

DeepSeek-R1 — Modèle de raisonnement open-source qui rivalise avec GPT-4 sur les tâches de mathématiques et de logique. Idéal pour la résolution de problèmes complexes.

Mistral — Léger mais capable. Excellent pour les systèmes avec une RAM limitée.

Installation des modèles

Téléchargement des modèles

# Installer Qwen3.5 (recommandé pour la plupart des utilisateurs)
ollama pull qwen2.5:7b

# Ou le dernier Qwen3
ollama pull qwen3:7b

# DeepSeek-R1 pour les tâches de raisonnement
ollama pull deepseek-r1:7b

# Llama 3.2
ollama pull llama3.2:7b

# Mistral
ollama pull mistral:7b

Étiquettes de modèles

Les modèles sont disponibles en différentes tailles :

# Différentes tailles de paramètres
ollama pull qwen2.5:3b    # Plus petit, plus rapide
ollama pull qwen2.5:7b    # Équilibré
ollama pull qwen2.5:14b   # Plus capable

Affichage des modèles installés

ollama list

Cela affiche tous les modèles téléchargés et leurs tailles.

Exécution et test des modèles

Mode interactif

# Discuter avec le modèle
ollama run qwen2.5:7b

Saisissez votre message et appuyez sur Entrée. Tapez /bye pour quitter.

Mode API

Ollama exécute un serveur API sur le port 11434 par défaut :

# Point de terminaison de génération
curl http://localhost:11434/api/generate -d {
  "model": "qwen2.5:7b",
  "prompt": "Hello, how are you?",
  "stream": false
}

Utilisation de la bibliothèque Python

from ollama import Client

client = Client()
response = client.chat(
    model='qwen2.5:7b',
    messages=[
        {'role': 'user', 'content': 'Hello!'}
    ]
)
print(response['message']['content'])

Test avec Apidog

Avant de vous connecter à OpenClaw, testez votre configuration Ollama à l'aide d'Apidog :

Créez une nouvelle requête dans Apidog
Définissez la méthode sur POST
Saisissez l'URL : http://localhost:11434/api/generate
Ajoutez l'en-tête : Content-Type: application/json

5. Ajoutez un corps :

{
  "model": "qwen3-coder",
  "prompt": "What is 2 + 2?",
  "stream": false
}

Ajouter un corps à une requête dans Apidog

Cela vérifie que votre configuration Ollama fonctionne avant l'intégration avec OpenClaw.

Intégration d'Ollama avec OpenClaw

Connectons maintenant Ollama à OpenClaw.

Méthode 1 : Configuration rapide

# Configurez OpenClaw pour utiliser Ollama avec votre modèle
openclaw models set ollama/qwen2.5:7b

Méthode 2 : Variables d'environnement

# Configurer le point de terminaison Ollama
export OLLAMA_HOST=http://localhost:11434

# Définir le modèle par défaut
export OLLAMA_MODEL=qwen2.5:7b

Méthode 3 : Fichier de configuration

Créez ou modifiez ~/.openclaw/config.yaml :

models:
  default: ollama/qwen2.5:7b

ollama:
  host: http://localhost:11434
  model: qwen2.5:7b
  temperature: 0.7
  top_p: 0.9

Vérification de l'intégration

# Vérifier le statut du modèle OpenClaw
openclaw models status

# Tester avec un message
openclaw chat "Hello!"

Vous devriez recevoir une réponse de votre modèle local.

Options de configuration

Affinez votre configuration Ollama + OpenClaw :

Température

Contrôle la créativité vs la précision :

ollama:
  temperature: 0.7    # 0.0 = précis, 1.0 = créatif

Top-P et Top-K

Contrôle la diversité de la réponse :

ollama:
  top_p: 0.9         # Échantillonnage de noyau
  top_k: 40          # Sélection de jetons

Longueur du contexte

Pour des conversations plus longues :

ollama:
  context_size: 4096  # La valeur par défaut est souvent 2048 ou 4096

Invite système

Personnalisez le comportement du modèle :

ollama:
  system_prompt: |
    Vous êtes un assistant de codage utile.
    Fournissez des exemples de code clairs et concis.
    Expliquez les concepts simplement.

Basculer entre les modèles

Un avantage d'Ollama est la facilité de basculement entre les modèles :

# Passer à DeepSeek-R1 pour le raisonnement
openclaw models set ollama/deepseek-r1:7b

# Passer à Qwen-Coder pour les tâches de codage
openclaw models set ollama/qwen2.5-coder:7b

# Revenir au modèle général
openclaw models set ollama/qwen2.5:7b

Configuration de plusieurs modèles

Configurez plusieurs modèles dans config.yaml :

models:
  default: ollama/qwen2.5:7b
  coding: ollama/qwen2.5-coder:7b
  reasoning: ollama/deepseek-r1:7b

Puis basculez entre eux :

openclaw models set coding
openclaw models set reasoning

Dépannage

Le modèle ne se charge pas

Problème : Erreurs de mémoire insuffisante

Solutions :

Utilisez un modèle plus petit (7B au lieu de 14B)
Fermez les autres applications pour libérer de la RAM
Vérifiez la mémoire disponible avec free -h (Linux) ou Moniteur d'activité (Mac)

Réponses lentes

Problème : Les réponses prennent trop de temps

Solutions :

Utilisez un modèle plus petit
Activez l'accélération GPU (si disponible)
Réduisez la taille du contexte
Utilisez un stockage SSD pour les fichiers de modèle

Connexion refusée

Problème : OpenClaw ne peut pas se connecter à Ollama

Solutions :

# Vérifier qu'Ollama est en cours d'exécution
ollama serve

# Vérifier le port
curl http://localhost:11434

Modèle introuvable

Problème : Le modèle n'existe pas dans Ollama

Solutions :

# Télécharger le modèle
ollama pull qwen2.5:7b

# Vérifier les modèles disponibles
ollama list

Conclusion

Vous disposez désormais d'un assistant IA puissant et privé fonctionnant localement. Ollama + OpenClaw offre des capacités qui coûteraient 20 $+/mois avec des alternatives cloud, le tout fonctionnant sur du matériel que vous contrôlez.

Ce que vous pouvez faire maintenant :

Discutez avec votre IA via plusieurs plateformes
Basculer entre les modèles en fonction des tâches
Personnalisez les invites pour des comportements spécialisés
Exécutez hors ligne une fois les modèles téléchargés

La seule limite est votre matériel.

Prochaines étapes :

Expérimentez avec différents modèles
Essayez Qwen3.5, DeepSeek-R1 et d'autres
Personnalisez vos invites système
Explorez les compétences d'OpenClaw sur ClawHub

Prêt à créer des applications IA professionnelles ? Téléchargez Apidog gratuitement et testez vos intégrations IA avec une interface visuelle conçue pour les développeurs.

bouton

FAQ

Quel est le meilleur modèle Ollama pour OpenClaw ?

Qwen3.5 est actuellement le plus populaire — performance équilibrée avec de bonnes capacités de raisonnement et de codage. DeepSeek-R1 excelle dans les tâches de raisonnement si c'est votre priorité.

Puis-je exécuter plusieurs modèles Ollama à la fois ?

Oui, mais chaque modèle nécessite de la RAM. Une configuration typique exécute un modèle à la fois, en basculant selon les besoins.

Ai-je besoin d'un GPU ?

Non, Ollama fonctionne sur CPU. L'accélération GPU le rend plus rapide mais n'est pas obligatoire. Les modèles plus petits (7B) fonctionnent raisonnablement bien sur CPU.

Comment mettre à jour les modèles ?

ollama pull model-name

Ollama se met à jour automatiquement si une version plus récente est disponible.

Puis-je utiliser mes propres modèles affinés ?

Oui, importez des modèles personnalisés à l'aide de la fonctionnalité d'importation d'Ollama. Consultez la documentation d'Ollama pour plus de détails.