OpenClaw (ehemals Moltbot/Clawdbot) wurde schnell populär, weil es sich auf praktische lokale Automatisierung konzentriert: Ihre Maschine überwachen, Abweichungen erkennen und handeln, bevor sich Probleme anhäufen. Die Heartbeat-Funktion ist zentral für dieses Versprechen.

Ein Heartbeat ist ein periodisches Gesundheits- und Zustandssignal. In OpenClaw leistet er mehr als nur Uptime-Pings. Er durchläuft eine geschichtete Entscheidungspipeline:
- Zuerst günstige deterministische Prüfungen (Prozess, Dateien, Warteschlangentiefe, API-Status)
- Regelauswertung anhand von Schwellenwerten und Richtlinien
- Optionale Modelleskalation nur bei verbleibender Unklarheit
Dieses Muster „zuerst günstige Prüfungen, Modelle nur bei Bedarf“ ist genau das, wonach Entwickler in jüngsten Community-Diskussionen gefragt haben: bessere Kostenkontrolle, vorhersehbareres Verhalten und weniger unnötige LLM-Aufrufe.
Wenn Sie Agenten-Infrastruktur aufbauen, ist dies die Kernidee: Heartbeats sind Kontroll-Ebenen-Primitive, nicht nur Überwachungsereignisse.
OpenClaw Heartbeat-Architektur auf einen Blick
Zur Laufzeit werden OpenClaw Heartbeats typischerweise als Schleife mit fünf Stufen implementiert:
- Der Scheduler löst Heartbeat-Takte aus (zum Beispiel alle 15s/30s/60s).
- Der Probe Runner führt deterministische Probes aus.
- Die Policy Engine berechnet Zustandsübergänge und Schweregrad.
- Das Escalation Gate entscheidet, ob ein LLM-/Tool-Planer benötigt wird.
- Der Action Dispatcher gibt Alarme, Korrekturaufgaben oder No-Ops aus.
Ein praktisches Ereignis-Envelope sieht so aus:
{
"agent_id": "desktop-a17",
"heartbeat_id": "hb_01JX...",
"ts": "2026-02-11T10:18:05Z",
"probes": {
"cpu_load": 0.72,
"disk_free_gb": 21.4,
"mail_queue_depth": 0,
"service_api": {
"status": 200,
"latency_ms": 83
}
},
"policy": {
"state": "degraded",
"reasons": [
"disk_free_below_warn"
]
},
"escalation": {
"llm_required": false,
"confidence": 0.93
}
}
Das wichtigste Systemverhalten:
- Deterministische Probe-Ergebnisse sind die primäre Wahrheit.
- Richtlinien-Ausgaben sind reproduzierbar und testbar.
- Die LLM-Nutzung ist spärlich, überprüfbar und durch strenge Schranken begrenzt.
Was „zuerst günstige Prüfungen“ in der Implementierung bedeutet
In OpenClaw sollten günstige Prüfungen sein:
- Geringe Latenz (Millisekunden bis wenige hundert ms)
- Kostengünstig (keine Modell-Token-Ausgaben)
- Deterministisch (gleiche Eingabe => gleiche Ausgabe)
- Standardmäßig nebenwirkungsfrei
Typische Probe-Kategorien:
- Lokale Laufzeit: Prozess aktiv, Speicherdruck, Thread-Anzahl
- I/O-Zustand: freier Speicherplatz, Inode-Druck, Berechtigungsänderungen
- Integrationszustand: Ziel-API-Statuscode, Timeout, p95-Latenz
- Task-Zustand: Warteschlangenverzögerung, Indikatoren für Wiederholungsstürme
- Richtlinien-Vorbedingungen: gültige Anmeldeinformationen, Ablaufzeiträume für Zertifikate
Probe-Vertrag
Verwenden Sie ein striktes Probe-Schema, damit die nachgeschaltete Logik stabil ist:
yaml ProbeResult: name: string ok: boolean observed_at: datetime value: number|string|object|null severity_hint: info|warn|critical error: string|null ttl_ms: integer
ttl_ms ist wichtig. Wenn Daten frisch genug sind, überspringen Sie doppelte Prüfungen während Burst-Fenstern.
Wann OpenClaw zur Modell-Argumentation eskalieren sollte
Modelleskalation sollte nur dann erfolgen, wenn die deterministische Logik keine sichere Entscheidung treffen kann.
Gute Eskalationsauslöser:
- Widersprüchliche Probe-Signale (API 200, aber Business-KPI bricht zusammen)
- Neue Fehlercluster ohne passende bekannte Signatur
- Mehrstufige Korrekturplanung unter Einschränkungen
- Erstellung einer menschenlesbaren Zusammenfassung für Vorfälle
Schlechte Eskalationsauslöser:
- Jedes Warnereignis
- Statische Schwellenwertüberschreitungen mit bekannten Runbooks
- Hochfrequentes Flapping, bei dem eine Entprellung das Rauschen beheben würde
Zustandsmaschinen-Design: Alert-Flapping vermeiden
Die meisten Heartbeat-Probleme resultieren aus instabilen Übergängen. Verwenden Sie eine Zustandsmaschine mit Hysterese:
healthy(gesund)degraded(verschlechtert)critical(kritisch)recovering(sich erholend)
Übergangsregeln sollten umfassen:
- Eintrittsschwellen (z.B. Festplatte < 15% => verschlechtert)
- Austrittsschwellen (z.B. Festplatte > 20% für 3 Intervalle => gesund)
- Entprellungsfenster (N aufeinanderfolgende Stichproben)
- Aktions-Cooldown (wiederholte Korrekturmaßnahmen vermeiden)
Beispiel:
yaml transitions: healthy->degraded: condition: disk_free_pct < 15 consecutive: 2 degraded->critical: condition: disk_free_pct < 8 consecutive: 1 degraded->healthy: condition: disk_free_pct > 20 consecutive: 3 critical->recovering: condition: remediation_applied == true recovering->healthy: condition: disk_free_pct > 20 consecutive: 2
Dies reduziert die störende Oszillation drastisch.
API-Design für Heartbeat-Erfassung und -Steuerung
Wenn Sie Heartbeat-APIs bereitstellen, halten Sie diese nach Möglichkeit explizit und idempotent.
Vorgeschlagene Endpunkte:
POST /v1/heartbeats— Heartbeat-Ereignis aufnehmenGET /v1/agents/{id}/status— Letzter berechneter ZustandPOST /v1/heartbeats/{id}/ack— Bestätigung durch den OperatorPOST /v1/policies/simulate— Richtlinie im Trockenlauf gegen eine Beispielnutzlast testen
Sicherheitsgrenzen für Agenten-Heartbeats
Das Interesse der Community an Sandboxing und sicherer Agentenausführung wächst aus gutem Grund. Heartbeats lösen oft Aktionen aus, daher sind Sicherheitsgrenzen nicht verhandelbar.
Minimale Kontrollen:
- Signierte Heartbeat-Nutzlasten (HMAC- oder mTLS-Identität)
- Pro-Agent-bereichsspezifische Token (geringstes Privileg)
- Richtlinien-/Aktions-Erlaubnislisten (kein willkürlicher Tool-Aufruf)
- Sandboxed-Ausführung für Korrekturen
- Audit-Trail für jeden Zustandsübergang und jede Aktion
Wenn ein Modell beteiligt ist:
- LLM-Ausgabe als nicht vertrauenswürdigen Planungs-Text behandeln
- Tool-Aufrufe gegen Schema und Richtlinie validieren
- Deterministische Schutzprüfungen vor der Ausführung verlangen
Kurz gesagt: Die Heartbeat-Erkennung kann flexibel sein; Heartbeat-Aktionen müssen eingeschränkt werden.
Beobachtbarkeits- und Debugging-Strategie
Um Heartbeat-Systeme zu debuggen, instrumentieren Sie zuerst diese Metriken:
- Heartbeat-Erfassungsrate
- Verhältnis von verspäteten/fehlenden Heartbeats
- Probe-Latenz nach Typ
- Richtlinien-Evaluierungs-Latenz
- Eskalationsrate (%)
- Modell-Token-Ausgaben pro Agent/Tag
- False-Positive- und False-Negative-Incident-Labels
Testen von OpenClaw-ähnlichen Heartbeat-APIs mit Apidog
Heartbeat-Systeme versagen an Grenzen: fehlerhafte Nutzlasten, Replay-Ereignisse und Race Conditions. Apidog hilft Ihnen, diese Grenzen in einem einzigen Arbeitsbereich zu testen.

Ein praktischer Ablauf:
- Definieren Sie Heartbeat-Endpunkte mit OpenAPI im visuellen Designer von Apidog.
- Erstellen Sie Testszenarien für normale, verzögerte, duplizierte und beschädigte Heartbeat-Ereignisse.
- Fügen Sie visuelle Zusicherungen für Zustandsübergänge und Aktionsausgaben hinzu.
- Mocken Sie nachgeschaltete Kanäle (Slack/Webhook/Korrektur-Dienst) mit dynamischen Antworten.
- Führen Sie Suiten in CI/CD als Regressionsschranke aus.
Beispiel-Testfälle
ingest_valid_heartbeat_returns_200duplicate_idempotency_key_no_duplicate_actioncritical_state_triggers_single_alert_with_cooldowninvalid_signature_returns_401novelty_trigger_causes_model_escalation_when_enabled
Da Apidog Design, Testen, Mocking und Dokumentation kombiniert, bleiben Ihr API-Vertrag und Ihr Verhalten im Einklang, während sich die Heartbeat-Logik weiterentwickelt.
Wenn Ihr Team dies derzeit auf mehrere Tools aufteilt, reduziert die Konsolidierung in Apidog die Abweichung und beschleunigt das Debugging.
Randfälle, die Ingenieure oft übersehen
- Taktversatz
- Agenten-Zeitstempel können abweichen.
- Akzeptieren Sie begrenzte Abweichungen und speichern Sie die vom Server empfangene Zeit separat.
- Netzwerkpartitionen
- Heartbeats können nach der Wiederverbindung in Bursts ankommen.
- Verwenden Sie Sequenznummern und Neuordnungsfenster.
- Rückstau-Stürme
- Wenn die Policy-Engine langsamer wird, können Warteschlangen die Verzögerung verstärken.
- Wenden Sie Zugangskontrollen an und bauen Sie die Leistung schrittweise ab.
- Stiller Probe-Fehler
- „Keine Daten“ ist nicht „gesund“.
- Codieren Sie unbekannten Zustand explizit.
- Durchgehende Korrekturschleifen
- Eine Aktion löst eine Bedingung aus, die dieselbe Aktion wiederholt auslöst.
- Fügen Sie einen Cooldown pro Aktion und maximale Wiederholungsbudgets hinzu.
- Modelldrift bei Eskalationsergebnissen
- Behalten Sie Evaluierungs-Fixtures für modellgestützte Entscheidungen bei.
- Erneute Validierung bei Modell-/Versionsänderungen.
Migrationshinweis: Moltbot/Clawdbot zu OpenClaw-Benennung
Die Umbenennungshistorie führte zu Verwirrung bei Paketnamen, Dokumentationen und Endpunktpräfixen. Wenn Sie Integrationen pflegen:
- Behalten Sie Rückwärts-Aliase für ein Deprecationsfenster bei.
- Versionieren Sie Ereignisschemata explizit (
event_version). - Veröffentlichen Sie eine Migrationskarte (alte Themennamen -> neue Themennamen).
- Fügen Sie Vertragstests für sowohl alte als auch aktuelle Nutzlasten hinzu.
Dies reduziert Störungen im Ökosystem, während sich die Community auf die OpenClaw-Benennung einigt.
Empfohlene Produktions-Baseline
Wenn Sie einen sinnvollen Standard für die Heartbeat-Einführung wünschen:
- Intervall: 30s
- Probe-Timeout: 500ms pro, 2s Gesamtbudget
- Entprellung: 2 aufeinanderfolgende Fehler für Warnung
- Cooldown: 5 Minuten pro Aktionstyp
- Eskalationsobergrenze: max. 5% der Heartbeats rufen das Modell auf
- Aufbewahrung: 30 Tage heiß, 180 Tage kalt für Audits
Passen Sie es dann an die Arbeitslast an. Entwickler-Desktop-Agenten und Server-Agenten benötigen in der Regel unterschiedliche Richtlinien.
Wichtige Erkenntnisse
Die Heartbeat-Funktion von OpenClaw ist wertvoll, weil sie die Agenten-Gesundheit als disziplinierte Kontrollschleife behandelt und nicht als einen Chat-First-Workflow. Das erfolgreiche Muster ist klar:
- zuerst deterministische Probes,
- zweiter eine explizite Richtlinien-Zustandsmaschine,
- Modelleskalation nur bei Unsicherheit.
Dieses Design bietet Ihnen geringere Kosten, höhere Vorhersehbarkeit und sicherere Automatisierung.
Wenn Sie Heartbeat-APIs implementieren, investieren Sie stark in Verträge, Idempotenz, Richtliniensimulation und Testautomatisierung. Apidog passt hier hervorragend, da Sie OpenAPI-Spezifikationen entwerfen, Abhängigkeiten mocken, Regressionstests ausführen und Dokumentationen an einem Ort veröffentlichen können.
Wenn Sie jetzt OpenClaw-ähnliche Heartbeats erstellen oder integrieren, beginnen Sie mit strengen deterministischen Regeln und fügen Sie Modell-Intelligenz schrittweise hinzu. Zuverlässigkeit entsteht zuerst durch Einschränkungen, dann durch Intelligenz.
