Wünschten Sie sich schon immer, dass Ihre KI das Web genauso nutzen könnte wie Sie? Dann schnallen Sie sich an, denn heute tauchen wir ein in die Welt des Browserbase MCP Servers – einem bahnbrechenden Tool, das KI-Modellen wie Claude, GPT und Gemini die Steuerung von Webbrowsern ermöglicht. Stellen Sie sich vor, Ihre KI navigiert selbstständig auf Websites, klickt auf Schaltflächen, füllt Formulare aus und macht sogar Screenshots. Klingt futuristisch? Es geschieht jetzt, und die Einrichtung ist einfacher, als Sie denken, besonders mit dem Browserbase MCP Server.
In diesem Leitfaden erkläre ich Ihnen, was der Browserbase MCP Server ist, warum er ein Muss für KI-gesteuerte Workflows ist und wie Sie ihn einrichten, um einen Chrome-Browser zu steuern. Egal, ob Sie Entwickler, Datenwissenschaftler oder einfach nur eine KI-interessierte Seele sind, dieses Schritt-für-Schritt-Tutorial wird Sie wie einen Profi fühlen lassen. Fangen wir an!
Möchten Sie eine integrierte All-in-One-Plattform, damit Ihr Entwicklerteam mit maximaler Produktivität zusammenarbeiten kann?
Apidog erfüllt all Ihre Anforderungen und ersetzt Postman zu einem wesentlich günstigeren Preis!
Was ist der Browserbase MCP Server?
Der Browserbase MCP Server ist ein Open-Source-Tool, das das Model Context Protocol (MCP) verwendet, um große Sprachmodelle (LLMs) mit Webbrowsern zu verbinden. Stellen Sie es sich als eine Brücke vor, die es der KI ermöglicht, in Echtzeit mit Websites zu interagieren. Mit diesem Server kann Ihre KI:
- Zu jeder URL navigieren
- Schaltflächen anklicken und Formulare ausfüllen
- Daten von Webseiten extrahieren
- Screenshots erstellen
- JavaScript auf Websites ausführen
- Mehrere Browsersitzungen gleichzeitig verwalten
Es ist, als würde man Ihrer KI eigene Hände geben, um im Web zu surfen. Und das Beste daran? Es funktioniert mit beliebten KI-Modellen wie OpenAI's GPT, Anthropic's Claude und Google's Gemini.

Warum den Browserbase MCP Server verwenden?
Bevor wir uns dem "Wie" widmen, sprechen wir darüber, warum der Browserbase MCP Server ein Game Changer ist:
- Cloud-basierte Automatisierung: Führen Sie Browser-Aufgaben in der Cloud aus, ohne lokale Einrichtungsprobleme.
- Multi-Modell-Unterstützung: Funktioniert mit verschiedenen KI-Modellen, sodass Sie Ihr bevorzugtes auswählen können.
- Parallele Sitzungen: Bearbeiten Sie mehrere Browser-Aufgaben gleichzeitig für maximale Effizienz.
- Visuelle Fähigkeiten: Erstellen Sie Screenshots und analysieren Sie Webseiten visuell.
- Einfache Integration: Verbindet sich nahtlos mit KI-Clients wie Claude Desktop oder Cursor.
Egal, ob Sie eine KI-gesteuerte App entwickeln, Workflows automatisieren oder einfach nur experimentieren, der Browserbase MCP Server spart Zeit und eröffnet neue Möglichkeiten.
So installieren und richten Sie den Browserbase MCP Server ein
Es gibt drei Möglichkeiten, zu beginnen: die Verwendung eines gehosteten Remote-Servers, die Ausführung mit npm oder die lokale Ausführung. Ich werde alle drei behandeln, damit Sie wählen können, was für Sie am besten passt.
Voraussetzungen
Bevor Sie den Browserbase MCP Server zur Steuerung eines Chrome-Browsers mit KI nutzen, stellen Sie sicher, dass Sie Folgendes haben:
- Ein MCP-kompatibler KI-Client: Installieren Sie einen Client wie Claude Desktop oder Cursor, der das Model Context Protocol (MCP) unterstützt.
- Ein Browserbase API-Schlüssel: Erhalten Sie diesen von Browserbase, um Ihre KI mit der Browser-Automatisierung zu verbinden.

Für die lokale Einrichtung (Optional)
Wenn Sie den Server lokal ausführen möchten, benötigen Sie außerdem:
- Git: Um das Repository von GitHub zu klonen.
- pnpm: Installieren Sie diesen Paketmanager von pnpm.io, um Abhängigkeiten zu verwalten.
- Node.js: Laden Sie es von nodejs.org herunter, um den Server auszuführen.
- Ein API-Schlüssel für ein KI-Modell: Besorgen Sie sich einen für Ihr ausgewähltes Modell, z.B. Gemini.
Option 1: Verwendung des gehosteten Remote-Servers des BrowserBase MCP Servers (Am einfachsten)
Wenn Sie sich den Einrichtungsaufwand ersparen möchten, ist die gehostete Option Ihr Freund. So geht's:
Besuchen Sie Smithery: Gehen Sie zu smithery.ai, um Ihre API-Schlüssel und eine Remote-MCP-URL zu erhalten.

Konfigurieren Sie Ihren KI-Client: Fügen Sie die bereitgestellte URL zu den MCP-Einstellungen Ihres KI-Clients hinzu. Zum Beispiel würden Sie in Claude Desktop dies zu Ihrer claude_desktop_config.json
hinzufügen:
{
"mcpServers": {
"browserbase": {
"url": "https://your-smithery-url.com"
}
}
}
Oder, wenn Sie die mcp-remote
CLI verwenden:
{
"mcpServers": {
"browserbase": {
"command": "npx",
"args": ["mcp-remote", "https://your-smithery-url.com"]
}
}
}
Starten Sie Ihren Client neu: Schließen Sie Ihren KI-Client und öffnen Sie ihn erneut, um die Änderungen zu übernehmen.
Das war's! Ihre KI kann nun einen Chrome-Browser über den Browserbase MCP Server steuern.
Option 2: Ausführen des BrowserBase MCP Servers mit NPM (Empfohlen)
Dies ist der empfohlene Ansatz aufgrund seiner Kompatibilität mit den meisten MCP-Clients. Gehen Sie zu Ihrer MCP Config JSON-Datei und fügen Sie die Browserbase Server-Konfiguration ein:
{
"mcpServers": {
"browserbase": {
"command": "npx",
"args": ["@browserbasehq/mcp"],
"env": {
"BROWSERBASE_API_KEY": "",
"BROWSERBASE_PROJECT_ID": "",
"GEMINI_API_KEY": ""
}
}
}
}
Option 3: BrowserBase MCP Server lokal installieren und ausführen (Für volle Kontrolle)
Möchten Sie unter der Haube basteln? Das lokale Ausführen des Servers bietet Ihnen mehr Flexibilität. So geht's:
Klonen Sie das Repository:
- Öffnen Sie Ihr Terminal und führen Sie aus:
git clone https://github.com/browserbase/mcp-server-browserbase.git
cd mcp-server-browserbase
Abhängigkeiten installieren:
- Stellen Sie sicher, dass Sie pnpm installiert haben. Führen Sie dann aus:
pnpm install && pnpm build
Starten Sie den Server:
- Sie können den Server über STDIO oder HTTP-Transport ausführen.
- Für STDIO (lokaler Prozess):
- Fügen Sie dies zu Ihrer MCP-Client-Konfiguration hinzu:
{
"mcpServers": {
"browserbase": {
"command": "node",
"args": ["path/to/mcp-server-browserbase/cli.js"],
"env": {
"BROWSERBASE_API_KEY": "your_api_key",
"BROWSERBASE_PROJECT_ID": "your_project_id",
"GEMINI_API_KEY": "your_gemini_key"
}
}
}
}
- Für HTTP-Transport:
- Starten Sie den Server mit:
node cli.js --port 3000
- Konfigurieren Sie Ihren Client so, dass er sich mit
http://localhost:3000
verbindet.
API-Schlüssel hinzufügen: Ersetzen Sie die Platzhalter in der Konfiguration durch Ihre tatsächlichen Browserbase- und Modell-API-Schlüssel.
Starten Sie Ihren Client neu: Wie zuvor, starten Sie Ihren KI-Client neu, um den Server zu aktivieren.
Anpassen des Servers
Der Browserbase MCP Server bietet Flags zur Anpassung seines Verhaltens. Hier sind einige nützliche:
--proxies
: Aktivieren Sie Browserbase-Proxies für bessere Privatsphäre.--advancedStealth
: Verwenden Sie den Stealth-Modus, um Erkennung zu vermeiden (Scale Plan erforderlich).--browserWidth
und--browserHeight
: Legen Sie die Größe des Browserfensters fest.--modelName
: Wählen Sie ein anderes KI-Modell für Stagehand.
Sie können diese Flags zum args
-Array in Ihrer MCP-Konfiguration hinzufügen. Zum Beispiel:
"args": ["path/to/cli.js", "--proxies", "--browserWidth=1920"]
So verwenden Sie den Browserbase MCP Server zur Steuerung von Chrome
Nachdem Ihr Server eingerichtet ist, lassen Sie uns ihn in Betrieb nehmen! So verwenden Sie den Browserbase MCP Server, um einen Chrome-Browser zu steuern.
Schritt 1: Verbinden Sie Ihren KI-Client
Stellen Sie sicher, dass Ihr KI-Client (wie Claude Desktop oder Cursor) über eine der drei oben genannten Methoden mit dem Browserbase MCP Server verbunden ist.
Schritt 2: Befehle geben
In Ihrem KI-Client können Sie nun Befehle in natürlicher Sprache eingeben, um den Browser zu steuern. Hier sind einige Beispiele:
Zu einer URL navigieren:
https://example.com
Eine Schaltfläche anklicken:
"Klicke auf die Schaltfläche 'Sign Up'"
Ein Formular ausfüllen:
user@example.com
Einen Screenshot erstellen:
"Mache einen Screenshot der Startseite"
Daten extrahieren:
"Extrahiere alle Produkttitel von dieser Seite"
Die KI übersetzt diese Anweisungen mithilfe des Browserbase MCP Servers in Browseraktionen.
Schritt 3: Ergebnisse anzeigen
Je nach Befehl liefert die KI Ergebnisse wie:
- Bestätigung der Aktionen (z.B. "Navigiert zu https://example.com")
- Extrahierte Daten (z.B. eine Liste von Produkttiteln)
- Screenshots (gespeichert oder angezeigt, je nach Ihrer Einrichtung)
Wenn Sie beispielsweise einen Screenshot anfordern, könnte die KI antworten:
"Screenshot aufgenommen und als 'homepage.png' gespeichert"
Testen des Browserbase MCP Servers
Lassen Sie uns dies an einem realen Beispiel testen. Angenommen, Sie möchten eine Suche auf einer Website automatisieren.
- Öffnen Sie Ihren KI-Client: Für dieses Beispiel verwenden wir Claude Desktop.
- Geben Sie einen Befehl ein:
https://google.com
3. Beobachten Sie den Browser: Wenn Sie lokal mit HTTP-Transport arbeiten, sehen Sie möglicherweise, wie der Browser geöffnet wird und die Aktionen ausführt.
4. Überprüfen Sie die Antwort: Claude sollte die Aktionen bestätigen und möglicherweise den Seitentitel oder Inhalt extrahieren.
Dieser einfache Test zeigt, wie der Browserbase MCP Server es der KI ermöglicht, Chrome zur Ausführung von Web-Aufgaben zu steuern.

Tipps zur Fehlerbehebung
Server startet nicht?
Stellen Sie sicher, dass Sie die richtigen API-Schlüssel haben und dasspnpm build
erfolgreich abgeschlossen wurde.Client verbindet sich nicht?
Überprüfen Sie die MCP-Konfiguration und starten Sie Ihren KI-Client neu.Aktionen funktionieren nicht?
Überprüfen Sie die Struktur der Website; einige Websites erfordern möglicherweise erweiterte Stealth-Modi oder Proxies.Modellprobleme?
Stellen Sie sicher, dass Ihr Modell-API-Schlüssel gültig ist und das Modell die erforderlichen Funktionen unterstützt.
Fazit
Und da haben Sie es! Sie haben gelernt, wie Sie den Browserbase MCP Server verwenden, um einen Chrome-Browser mit KI zu steuern. Egal, ob Sie den gehosteten Weg für Einfachheit, npm oder die lokale Einrichtung für Kontrolle gewählt haben, Sie sind nun in der Lage, Web-Aufgaben wie ein Profi zu automatisieren. Der Browserbase MCP Server ist ein leistungsstarkes Tool, das KI und Web-Automatisierung zusammenführt und endlose Möglichkeiten für Innovationen eröffnet.
Bereit, mehr zu entdecken? Versuchen Sie, Ihre täglichen Web-Aufgaben zu automatisieren oder integrieren Sie es in Ihr nächstes KI-Projekt.
Möchten Sie eine integrierte All-in-One-Plattform, damit Ihr Entwicklerteam mit maximaler Produktivität zusammenarbeiten kann?
Apidog erfüllt all Ihre Anforderungen und ersetzt Postman zu einem wesentlich günstigeren Preis!