OpenClaw mit Ollama ausführen: Anleitung & Tutorial

Ashley Innocent

Ashley Innocent

26 February 2026

OpenClaw mit Ollama ausführen: Anleitung & Tutorial

TL;DR

Ollama ist der einfachste Weg, leistungsstarke KI-Modelle lokal auszuführen. In Kombination mit OpenClaw entsteht ein kostenloser, datenschutzorientierter KI-Assistent, der kostenpflichtigen Alternativen in nichts nachsteht. Diese Anleitung führt Sie durch die Einrichtung von Ollama, die Auswahl des richtigen Modells und die Integration mit OpenClaw für Ihren persönlichen KI-Assistenten.

Einleitung

KI lokal auszuführen war einst eine Beschäftigung für Hobbyisten, die eine komplexe Einrichtung und teure Hardware erforderte. Ollama hat das geändert. Mit einem einfachen Installationsbefehl und einer intuitiven API macht Ollama die lokale Ausführung von KI-Modellen für jedermann zugänglich.

ollama launch openclaw --model qwen3.5:35b

In Verbindung mit OpenClaw erhalten Sie einen leistungsstarken KI-Assistenten, der:

Dieser Leitfaden deckt alles ab, was Sie für den Einstieg benötigen.

Warum Ollama mit OpenClaw verwenden

Vorteile lokaler KI

Warum Ollama

Ollama zeichnet sich aus mehreren Gründen aus:

Voraussetzungen

Stellen Sie vor dem Start sicher, dass Sie Folgendes haben:

Hardware-Anforderungen

ModellgrößeMindest-RAMEmpfohlener RAM
7B Parameter8GB16GB
14B Parameter16GB32GB
32B Parameter32GB64GB
70B Parameter64GB128GB

Software-Anforderungen

Was Sie benötigen werden

  1. Einen Computer, der die RAM-Anforderungen erfüllt
  2. Internet zum Herunterladen von Modellen
  3. Zeit für die anfänglichen Modelldownloads (variiert je nach Größe und Verbindung)

Ollama installieren

macOS-Installation

Die einfachste Methode verwendet Homebrew:

brew install ollama

Oder verwenden Sie das offizielle Installationsskript:

curl -fsSL https://ollama.ai/install.sh | sh

Linux-Installation

# Installationsskript verwenden (empfohlen)
curl -fsSL https://ollama.ai/install.sh | sh

# Oder die Binärdatei direkt herunterladen
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

Windows-Installation

  1. Laden Sie den Installer herunter
  2. Führen Sie den Installer aus
  3. Folgen Sie den Anweisungen auf dem Bildschirm
Ollama herunterladen

Installation überprüfen

ollama --version

Sie sollten eine Ausgabe wie ollama version 0.15.0 oder neuer sehen.

Ollama-Version im Terminal

Ollama-Dienst starten

Ollama läuft als Hintergrunddienst:

# Überprüfen, ob Ollama läuft
ollama list

# Ollama starten, falls nicht aktiv
ollama serve
Überprüfen, ob Ollama mit dem Befehl Ollama list läuft

Das richtige Modell auswählen

Ollama unterstützt über 100 Modelle. So wählen Sie aus:

Nach Anwendungsfall

AnwendungsfallEmpfohlene Modelle
Allgemeine KonversationQwen3.5, Llama 3.2, Mistral
ProgrammierunterstützungQwen3.5-Coder, DeepSeek-Coder
Argumentation/MathematikDeepSeek-R1, Qwen3.5
Kleinere HardwarePhi3.5, Gemma2.2B

Nach Hardware

Verfügbarer RAMEmpfohlen
8GB7B-Modelle (Qwen3.5, Llama3.2, Mistral)
16GB8-14B-Modelle
32GB14-32B-Modelle
64GB+70B+-Modelle

Beliebte Modelle im Jahr 2026

Qwen3.5 — Hervorragende Allround-Leistung, starke Argumentation, gut zum Programmieren. Die beliebteste Wahl für OpenClaw im Jahr 2026.

DeepSeek-R1 — Open-Source-Argumentationsmodell, das GPT-4 bei Mathematik- und Logikaufgaben Konkurrenz macht. Ideal für komplexe Problemlösungen.

Mistral — Leichtgewichtig, aber leistungsfähig. Hervorragend für Systeme mit begrenztem RAM.

Modelle installieren

Modelle herunterladen

# Qwen3.5 installieren (für die meisten Benutzer empfohlen)
ollama pull qwen2.5:7b

# Oder das neueste Qwen3
ollama pull qwen3:7b

# DeepSeek-R1 für Argumentationsaufgaben
ollama pull deepseek-r1:7b

# Llama 3.2
ollama pull llama3.2:7b

# Mistral
ollama pull mistral:7b

Modell-Tags

Modelle gibt es in verschiedenen Größen:

# Verschiedene Parametergrößen
ollama pull qwen2.5:3b    # Kleiner, schneller
ollama pull qwen2.5:7b    # Ausgewogen
ollama pull qwen2.5:14b   # Leistungsfähiger

Installierte Modelle anzeigen

ollama list

Dies zeigt alle heruntergeladenen Modelle und deren Größen an.

Modelle ausführen und testen

Interaktiver Modus

# Mit dem Modell chatten
ollama run qwen2.5:7b

Geben Sie Ihre Nachricht ein und drücken Sie die Eingabetaste. Geben Sie /bye ein, um den Vorgang zu beenden.

API-Modus

Ollama führt standardmäßig einen API-Server auf Port 11434 aus:

# Generate endpoint
curl http://localhost:11434/api/generate -d {
  "model": "qwen2.5:7b",
  "prompt": "Hello, how are you?",
  "stream": false
}

Verwendung der Python-Bibliothek

from ollama import Client

client = Client()
response = client.chat(
    model='qwen2.5:7b',
    messages=[
        {'role': 'user', 'content': 'Hello!'}
    ]
)
print(response['message']['content'])

Testen mit Apidog

Bevor Sie eine Verbindung zu OpenClaw herstellen, testen Sie Ihre Ollama-Einrichtung mit Apidog:

  1. Erstellen Sie eine neue Anfrage in Apidog
  2. Setzen Sie die Methode auf POST
  3. Geben Sie die URL ein: http://localhost:11434/api/generate
  4. Fügen Sie den Header hinzu: Content-Type: application/json
Anfrage in Apidog erstellen

5. Fügen Sie den Body hinzu:

{
  "model": "qwen3-coder",
  "prompt": "What is 2 + 2?",
  "stream": false
}

Body zu einer Anfrage in Apidog hinzufügen

Dadurch wird überprüft, ob Ihre Ollama-Einrichtung funktioniert, bevor Sie sie in OpenClaw integrieren.

Ollama mit OpenClaw integrieren

Verbinden wir nun Ollama mit OpenClaw.

Methode 1: Schnelle Konfiguration

# OpenClaw so einstellen, dass es Ollama mit Ihrem Modell verwendet
openclaw models set ollama/qwen2.5:7b

Methode 2: Umgebungsvariablen

# Ollama-Endpunkt konfigurieren
export OLLAMA_HOST=http://localhost:11434

# Das Standardmodell festlegen
export OLLAMA_MODEL=qwen2.5:7b

Methode 3: Konfigurationsdatei

Erstellen oder bearbeiten Sie ~/.openclaw/config.yaml:

models:
  default: ollama/qwen2.5:7b

ollama:
  host: http://localhost:11434
  model: qwen2.5:7b
  temperature: 0.7
  top_p: 0.9

Integration überprüfen

# OpenClaw Modellstatus überprüfen
openclaw models status

# Mit einer Nachricht testen
openclaw chat "Hello!"

Sie sollten eine Antwort von Ihrem lokalen Modell erhalten.

Konfigurationsoptionen

Feinjustieren Sie Ihre Ollama + OpenClaw-Einrichtung:

Temperatur

Steuert Kreativität vs. Präzision:

ollama:
  temperature: 0.7    # 0.0 = präzise, 1.0 = kreativ

Top-P und Top-K

Steuert die Antwortvielfalt:

ollama:
  top_p: 0.9         # Nucleus-Sampling
  top_k: 40          # Token-Auswahl

Kontextlänge

Für längere Konversationen:

ollama:
  context_size: 4096  # Standard ist oft 2048 oder 4096

System-Prompt

Modellverhalten anpassen:

ollama:
  system_prompt: |
    Sie sind ein hilfreicher Programmierassistent.
    Geben Sie klare, prägnante Codebeispiele.
    Erklären Sie Konzepte einfach.

Zwischen Modellen wechseln

Ein Vorteil von Ollama ist der einfache Modellwechsel:

# Zu DeepSeek-R1 für Argumentationszwecke wechseln
openclaw models set ollama/deepseek-r1:7b

# Zu Qwen-Coder für Programmieraufgaben wechseln
openclaw models set ollama/qwen2.5-coder:7b

# Zurück zum allgemeinen Modell wechseln
openclaw models set ollama/qwen2.5:7b

Einrichtung mehrerer Modelle

Konfigurieren Sie mehrere Modelle in config.yaml:

models:
  default: ollama/qwen2.5:7b
  coding: ollama/qwen2.5-coder:7b
  reasoning: ollama/deepseek-r1:7b

Wechseln Sie dann zwischen ihnen:

openclaw models set coding
openclaw models set reasoning

Fehlerbehebung

Modell lädt nicht

Problem: Speicherfehler (Out of memory)

Lösungen:

Langsame Antworten

Problem: Antworten dauern zu lange

Lösungen:

Verbindung verweigert

Problem: OpenClaw kann keine Verbindung zu Ollama herstellen

Lösungen:

# Überprüfen, ob Ollama läuft
ollama serve

# Den Port überprüfen
curl http://localhost:11434

Modell nicht gefunden

Problem: Modell existiert nicht in Ollama

Lösungen:

# Das Modell herunterladen
ollama pull qwen2.5:7b

# Verfügbare Modelle überprüfen
ollama list

Fazit

Sie haben jetzt einen leistungsstarken, privaten KI-Assistenten, der lokal läuft. Ollama + OpenClaw bietet Funktionen, die bei Cloud-Alternativen 20 $+/Monat kosten würden – alles läuft auf Hardware, die Sie kontrollieren.

Was Sie jetzt tun können:

Die einzige Grenze ist Ihre Hardware.

Nächste Schritte:

  1. Experimentieren Sie mit verschiedenen Modellen
  2. Probieren Sie Qwen3.5, DeepSeek-R1 und andere aus
  3. Passen Sie Ihre System-Prompts an
  4. Erkunden Sie OpenClaw-Fähigkeiten auf ClawHub

Bereit, professionelle KI-Anwendungen zu entwickeln? Laden Sie Apidog kostenlos herunter und testen Sie Ihre KI-Integrationen mit einer visuellen Benutzeroberfläche, die für Entwickler entwickelt wurde.

button

FAQ

Welches ist das beste Ollama-Modell für OpenClaw?

Qwen3.5 ist derzeit das beliebteste – ausgewogene Leistung mit guten Argumentations- und Programmierfähigkeiten. DeepSeek-R1 ist hervorragend für Argumentationsaufgaben geeignet, falls dies Ihre Priorität ist.

Kann ich mehrere Ollama-Modelle gleichzeitig ausführen?

Ja, aber jedes Modell benötigt RAM. Eine typische Einrichtung führt jeweils ein Modell aus und wechselt bei Bedarf.

Benötige ich eine GPU?

Nein, Ollama läuft auf der CPU. GPU-Beschleunigung macht es schneller, ist aber nicht zwingend erforderlich. Kleinere Modelle (7B) funktionieren auch auf der CPU recht gut.

Wie aktualisiere ich Modelle?

ollama pull model-name

Ollama aktualisiert sich automatisch, wenn eine neuere Version verfügbar ist.

Kann ich meine eigenen feinabgestimmten Modelle verwenden?

Ja, importieren Sie benutzerdefinierte Modelle mithilfe der Importfunktion von Ollama. Weitere Details finden Sie in der Ollama-Dokumentation.

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen