OpenClaw mit Ollama ausführen: Anleitung & Tutorial

TL;DR

Ollama ist der einfachste Weg, leistungsstarke KI-Modelle lokal auszuführen. In Kombination mit OpenClaw entsteht ein kostenloser, datenschutzorientierter KI-Assistent, der kostenpflichtigen Alternativen in nichts nachsteht. Diese Anleitung führt Sie durch die Einrichtung von Ollama, die Auswahl des richtigen Modells und die Integration mit OpenClaw für Ihren persönlichen KI-Assistenten.

Einleitung

KI lokal auszuführen war einst eine Beschäftigung für Hobbyisten, die eine komplexe Einrichtung und teure Hardware erforderte. Ollama hat das geändert. Mit einem einfachen Installationsbefehl und einer intuitiven API macht Ollama die lokale Ausführung von KI-Modellen für jedermann zugänglich.

ollama launch openclaw --model qwen3.5:35b

In Verbindung mit OpenClaw erhalten Sie einen leistungsstarken KI-Assistenten, der:

Im Betrieb kostenlos ist (nach der Ersteinrichtung)
Ihre Daten zu 100 % privat hält
Offline funktioniert, sobald Modelle heruntergeladen sind
Umfassende Anpassungsoptionen bietet

Dieser Leitfaden deckt alles ab, was Sie für den Einstieg benötigen.

Warum Ollama mit OpenClaw verwenden

Vorteile lokaler KI

Datenschutz: Ihre Konversationen verlassen Ihren Computer nie
Keine API-Kosten: Einmal für Hardware bezahlen, unbegrenzt nutzen
Offline-Zugriff: Funktioniert ohne Internet
Volle Kontrolle: Modelle und Prompts anpassen
Keine Ratenbegrenzung: So viel nutzen, wie Sie möchten

Warum Ollama

Ollama zeichnet sich aus mehreren Gründen aus:

Einfache Installation: Ein Befehl genügt für den Start
Modellbibliothek: Über 100 Modelle verfügbar
Plattformübergreifend: Funktioniert unter macOS, Linux, Windows
API-orientiert: Einfache Integration mit OpenClaw
Aktive Entwicklung: Regelmäßige Updates und neue Modelle

Voraussetzungen

Stellen Sie vor dem Start sicher, dass Sie Folgendes haben:

Hardware-Anforderungen

Modellgröße	Mindest-RAM	Empfohlener RAM
7B Parameter	8GB	16GB
14B Parameter	16GB	32GB
32B Parameter	32GB	64GB
70B Parameter	64GB	128GB

Software-Anforderungen

macOS 10.15+, Linux oder Windows 10+
Administrator-/Root-Zugriff für die Installation
Internetverbindung für anfängliche Downloads
Vertrautheit mit der Kommandozeile

Was Sie benötigen werden

Einen Computer, der die RAM-Anforderungen erfüllt
Internet zum Herunterladen von Modellen
Zeit für die anfänglichen Modelldownloads (variiert je nach Größe und Verbindung)

Ollama installieren

macOS-Installation

Die einfachste Methode verwendet Homebrew:

brew install ollama

Oder verwenden Sie das offizielle Installationsskript:

curl -fsSL https://ollama.ai/install.sh | sh

Linux-Installation

# Installationsskript verwenden (empfohlen)
curl -fsSL https://ollama.ai/install.sh | sh

# Oder die Binärdatei direkt herunterladen
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Windows-Installation

Laden Sie den Installer herunter
Führen Sie den Installer aus
Folgen Sie den Anweisungen auf dem Bildschirm

Installation überprüfen

ollama --version

Sie sollten eine Ausgabe wie ollama version 0.15.0 oder neuer sehen.

Ollama-Dienst starten

Ollama läuft als Hintergrunddienst:

# Überprüfen, ob Ollama läuft
ollama list

# Ollama starten, falls nicht aktiv
ollama serve

Überprüfen, ob Ollama mit dem Befehl Ollama list läuft

Das richtige Modell auswählen

Ollama unterstützt über 100 Modelle. So wählen Sie aus:

Nach Anwendungsfall

Anwendungsfall	Empfohlene Modelle
Allgemeine Konversation	Qwen3.5, Llama 3.2, Mistral
Programmierunterstützung	Qwen3.5-Coder, DeepSeek-Coder
Argumentation/Mathematik	DeepSeek-R1, Qwen3.5
Kleinere Hardware	Phi3.5, Gemma2.2B

Nach Hardware

Verfügbarer RAM	Empfohlen
8GB	7B-Modelle (Qwen3.5, Llama3.2, Mistral)
16GB	8-14B-Modelle
32GB	14-32B-Modelle
64GB+	70B+-Modelle

Beliebte Modelle im Jahr 2026

Qwen3.5 — Hervorragende Allround-Leistung, starke Argumentation, gut zum Programmieren. Die beliebteste Wahl für OpenClaw im Jahr 2026.

DeepSeek-R1 — Open-Source-Argumentationsmodell, das GPT-4 bei Mathematik- und Logikaufgaben Konkurrenz macht. Ideal für komplexe Problemlösungen.

Mistral — Leichtgewichtig, aber leistungsfähig. Hervorragend für Systeme mit begrenztem RAM.

Modelle installieren

Modelle herunterladen

# Qwen3.5 installieren (für die meisten Benutzer empfohlen)
ollama pull qwen2.5:7b

# Oder das neueste Qwen3
ollama pull qwen3:7b

# DeepSeek-R1 für Argumentationsaufgaben
ollama pull deepseek-r1:7b

# Llama 3.2
ollama pull llama3.2:7b

# Mistral
ollama pull mistral:7b

Modell-Tags

Modelle gibt es in verschiedenen Größen:

# Verschiedene Parametergrößen
ollama pull qwen2.5:3b    # Kleiner, schneller
ollama pull qwen2.5:7b    # Ausgewogen
ollama pull qwen2.5:14b   # Leistungsfähiger

Installierte Modelle anzeigen

ollama list

Dies zeigt alle heruntergeladenen Modelle und deren Größen an.

Modelle ausführen und testen

Interaktiver Modus

# Mit dem Modell chatten
ollama run qwen2.5:7b

Geben Sie Ihre Nachricht ein und drücken Sie die Eingabetaste. Geben Sie /bye ein, um den Vorgang zu beenden.

API-Modus

Ollama führt standardmäßig einen API-Server auf Port 11434 aus:

# Generate endpoint
curl http://localhost:11434/api/generate -d {
  "model": "qwen2.5:7b",
  "prompt": "Hello, how are you?",
  "stream": false
}

Verwendung der Python-Bibliothek

from ollama import Client

client = Client()
response = client.chat(
    model='qwen2.5:7b',
    messages=[
        {'role': 'user', 'content': 'Hello!'}
    ]
)
print(response['message']['content'])

Testen mit Apidog

Bevor Sie eine Verbindung zu OpenClaw herstellen, testen Sie Ihre Ollama-Einrichtung mit Apidog:

Erstellen Sie eine neue Anfrage in Apidog
Setzen Sie die Methode auf POST
Geben Sie die URL ein: http://localhost:11434/api/generate
Fügen Sie den Header hinzu: Content-Type: application/json

5. Fügen Sie den Body hinzu:

{
  "model": "qwen3-coder",
  "prompt": "What is 2 + 2?",
  "stream": false
}

Body zu einer Anfrage in Apidog hinzufügen

Dadurch wird überprüft, ob Ihre Ollama-Einrichtung funktioniert, bevor Sie sie in OpenClaw integrieren.

Ollama mit OpenClaw integrieren

Verbinden wir nun Ollama mit OpenClaw.

Methode 1: Schnelle Konfiguration

# OpenClaw so einstellen, dass es Ollama mit Ihrem Modell verwendet
openclaw models set ollama/qwen2.5:7b

Methode 2: Umgebungsvariablen

# Ollama-Endpunkt konfigurieren
export OLLAMA_HOST=http://localhost:11434

# Das Standardmodell festlegen
export OLLAMA_MODEL=qwen2.5:7b

Methode 3: Konfigurationsdatei

Erstellen oder bearbeiten Sie ~/.openclaw/config.yaml:

models:
  default: ollama/qwen2.5:7b

ollama:
  host: http://localhost:11434
  model: qwen2.5:7b
  temperature: 0.7
  top_p: 0.9

Integration überprüfen

# OpenClaw Modellstatus überprüfen
openclaw models status

# Mit einer Nachricht testen
openclaw chat "Hello!"

Sie sollten eine Antwort von Ihrem lokalen Modell erhalten.

Konfigurationsoptionen

Feinjustieren Sie Ihre Ollama + OpenClaw-Einrichtung:

Temperatur

Steuert Kreativität vs. Präzision:

ollama:
  temperature: 0.7    # 0.0 = präzise, 1.0 = kreativ

Top-P und Top-K

Steuert die Antwortvielfalt:

ollama:
  top_p: 0.9         # Nucleus-Sampling
  top_k: 40          # Token-Auswahl

Kontextlänge

Für längere Konversationen:

ollama:
  context_size: 4096  # Standard ist oft 2048 oder 4096

System-Prompt

Modellverhalten anpassen:

ollama:
  system_prompt: |
    Sie sind ein hilfreicher Programmierassistent.
    Geben Sie klare, prägnante Codebeispiele.
    Erklären Sie Konzepte einfach.

Zwischen Modellen wechseln

Ein Vorteil von Ollama ist der einfache Modellwechsel:

# Zu DeepSeek-R1 für Argumentationszwecke wechseln
openclaw models set ollama/deepseek-r1:7b

# Zu Qwen-Coder für Programmieraufgaben wechseln
openclaw models set ollama/qwen2.5-coder:7b

# Zurück zum allgemeinen Modell wechseln
openclaw models set ollama/qwen2.5:7b

Einrichtung mehrerer Modelle

Konfigurieren Sie mehrere Modelle in config.yaml:

models:
  default: ollama/qwen2.5:7b
  coding: ollama/qwen2.5-coder:7b
  reasoning: ollama/deepseek-r1:7b

Wechseln Sie dann zwischen ihnen:

openclaw models set coding
openclaw models set reasoning

Fehlerbehebung

Modell lädt nicht

Problem: Speicherfehler (Out of memory)

Lösungen:

Verwenden Sie ein kleineres Modell (7B anstelle von 14B)
Schließen Sie andere Anwendungen, um RAM freizugeben
Überprüfen Sie den verfügbaren Speicher mit free -h (Linux) oder der Aktivitätsanzeige (Mac)

Langsame Antworten

Problem: Antworten dauern zu lange

Lösungen:

Verwenden Sie ein kleineres Modell
Aktivieren Sie die GPU-Beschleunigung (falls verfügbar)
Reduzieren Sie die Kontextgröße
Verwenden Sie SSD-Speicher für Modelldateien

Verbindung verweigert

Problem: OpenClaw kann keine Verbindung zu Ollama herstellen

Lösungen:

# Überprüfen, ob Ollama läuft
ollama serve

# Den Port überprüfen
curl http://localhost:11434

Modell nicht gefunden

Problem: Modell existiert nicht in Ollama

Lösungen:

# Das Modell herunterladen
ollama pull qwen2.5:7b

# Verfügbare Modelle überprüfen
ollama list

Fazit

Sie haben jetzt einen leistungsstarken, privaten KI-Assistenten, der lokal läuft. Ollama + OpenClaw bietet Funktionen, die bei Cloud-Alternativen 20 $+/Monat kosten würden – alles läuft auf Hardware, die Sie kontrollieren.

Was Sie jetzt tun können:

Chatten Sie mit Ihrer KI über mehrere Plattformen
Wechseln Sie je nach Aufgabe zwischen Modellen
Passen Sie Prompts für spezialisierte Verhaltensweisen an
Offline ausführen, sobald Modelle heruntergeladen sind

Die einzige Grenze ist Ihre Hardware.

Nächste Schritte:

Experimentieren Sie mit verschiedenen Modellen
Probieren Sie Qwen3.5, DeepSeek-R1 und andere aus
Passen Sie Ihre System-Prompts an
Erkunden Sie OpenClaw-Fähigkeiten auf ClawHub

Bereit, professionelle KI-Anwendungen zu entwickeln? Laden Sie Apidog kostenlos herunter und testen Sie Ihre KI-Integrationen mit einer visuellen Benutzeroberfläche, die für Entwickler entwickelt wurde.

button

FAQ

Welches ist das beste Ollama-Modell für OpenClaw?

Qwen3.5 ist derzeit das beliebteste – ausgewogene Leistung mit guten Argumentations- und Programmierfähigkeiten. DeepSeek-R1 ist hervorragend für Argumentationsaufgaben geeignet, falls dies Ihre Priorität ist.

Kann ich mehrere Ollama-Modelle gleichzeitig ausführen?

Ja, aber jedes Modell benötigt RAM. Eine typische Einrichtung führt jeweils ein Modell aus und wechselt bei Bedarf.

Benötige ich eine GPU?

Nein, Ollama läuft auf der CPU. GPU-Beschleunigung macht es schneller, ist aber nicht zwingend erforderlich. Kleinere Modelle (7B) funktionieren auch auf der CPU recht gut.

Wie aktualisiere ich Modelle?

ollama pull model-name

Ollama aktualisiert sich automatisch, wenn eine neuere Version verfügbar ist.

Kann ich meine eigenen feinabgestimmten Modelle verwenden?

Ja, importieren Sie benutzerdefinierte Modelle mithilfe der Importfunktion von Ollama. Weitere Details finden Sie in der Ollama-Dokumentation.