MCP Server: Chrome Browser Steuerung mit Browserbase

Ashley Goolam

Ashley Goolam

24 July 2025

MCP Server: Chrome Browser Steuerung mit Browserbase

Wünschten Sie sich schon immer, dass Ihre KI das Web genauso nutzen könnte wie Sie? Dann schnallen Sie sich an, denn heute tauchen wir ein in die Welt des Browserbase MCP Servers – einem bahnbrechenden Tool, das KI-Modellen wie Claude, GPT und Gemini die Steuerung von Webbrowsern ermöglicht. Stellen Sie sich vor, Ihre KI navigiert selbstständig auf Websites, klickt auf Schaltflächen, füllt Formulare aus und macht sogar Screenshots. Klingt futuristisch? Es geschieht jetzt, und die Einrichtung ist einfacher, als Sie denken, besonders mit dem Browserbase MCP Server.

In diesem Leitfaden erkläre ich Ihnen, was der Browserbase MCP Server ist, warum er ein Muss für KI-gesteuerte Workflows ist und wie Sie ihn einrichten, um einen Chrome-Browser zu steuern. Egal, ob Sie Entwickler, Datenwissenschaftler oder einfach nur eine KI-interessierte Seele sind, dieses Schritt-für-Schritt-Tutorial wird Sie wie einen Profi fühlen lassen. Fangen wir an!

💡
Möchten Sie ein großartiges API-Testtool, das schöne API-Dokumentation generiert?

Möchten Sie eine integrierte All-in-One-Plattform, damit Ihr Entwicklerteam mit maximaler Produktivität zusammenarbeiten kann?

Apidog erfüllt all Ihre Anforderungen und ersetzt Postman zu einem wesentlich günstigeren Preis!
Schaltfläche

Was ist der Browserbase MCP Server?

Der Browserbase MCP Server ist ein Open-Source-Tool, das das Model Context Protocol (MCP) verwendet, um große Sprachmodelle (LLMs) mit Webbrowsern zu verbinden. Stellen Sie es sich als eine Brücke vor, die es der KI ermöglicht, in Echtzeit mit Websites zu interagieren. Mit diesem Server kann Ihre KI:

Es ist, als würde man Ihrer KI eigene Hände geben, um im Web zu surfen. Und das Beste daran? Es funktioniert mit beliebten KI-Modellen wie OpenAI's GPT, Anthropic's Claude und Google's Gemini.

Browserbase MCP Server

Warum den Browserbase MCP Server verwenden?

Bevor wir uns dem "Wie" widmen, sprechen wir darüber, warum der Browserbase MCP Server ein Game Changer ist:

Egal, ob Sie eine KI-gesteuerte App entwickeln, Workflows automatisieren oder einfach nur experimentieren, der Browserbase MCP Server spart Zeit und eröffnet neue Möglichkeiten.

So installieren und richten Sie den Browserbase MCP Server ein

Es gibt drei Möglichkeiten, zu beginnen: die Verwendung eines gehosteten Remote-Servers, die Ausführung mit npm oder die lokale Ausführung. Ich werde alle drei behandeln, damit Sie wählen können, was für Sie am besten passt.

Voraussetzungen

Bevor Sie den Browserbase MCP Server zur Steuerung eines Chrome-Browsers mit KI nutzen, stellen Sie sicher, dass Sie Folgendes haben:

offizielle Browserbase-Website

Für die lokale Einrichtung (Optional)

Wenn Sie den Server lokal ausführen möchten, benötigen Sie außerdem:

Option 1: Verwendung des gehosteten Remote-Servers des BrowserBase MCP Servers (Am einfachsten)

Wenn Sie sich den Einrichtungsaufwand ersparen möchten, ist die gehostete Option Ihr Freund. So geht's:

Besuchen Sie Smithery: Gehen Sie zu smithery.ai, um Ihre API-Schlüssel und eine Remote-MCP-URL zu erhalten.

Smithery KI

Konfigurieren Sie Ihren KI-Client: Fügen Sie die bereitgestellte URL zu den MCP-Einstellungen Ihres KI-Clients hinzu. Zum Beispiel würden Sie in Claude Desktop dies zu Ihrer claude_desktop_config.json hinzufügen:

{
  "mcpServers": {
    "browserbase": {
      "url": "https://your-smithery-url.com"
    }
  }
}

Oder, wenn Sie die mcp-remote CLI verwenden:

{
  "mcpServers": {
    "browserbase": {
      "command": "npx",
      "args": ["mcp-remote", "https://your-smithery-url.com"]
    }
  }
}

Starten Sie Ihren Client neu: Schließen Sie Ihren KI-Client und öffnen Sie ihn erneut, um die Änderungen zu übernehmen.

Das war's! Ihre KI kann nun einen Chrome-Browser über den Browserbase MCP Server steuern.

Option 2: Ausführen des BrowserBase MCP Servers mit NPM (Empfohlen)

Dies ist der empfohlene Ansatz aufgrund seiner Kompatibilität mit den meisten MCP-Clients. Gehen Sie zu Ihrer MCP Config JSON-Datei und fügen Sie die Browserbase Server-Konfiguration ein:

{
  "mcpServers": {
    "browserbase": {
      "command": "npx",
      "args": ["@browserbasehq/mcp"],
      "env": {
        "BROWSERBASE_API_KEY": "",
        "BROWSERBASE_PROJECT_ID": "",
        "GEMINI_API_KEY": ""
      }
    }
  }
}

Option 3: BrowserBase MCP Server lokal installieren und ausführen (Für volle Kontrolle)

Möchten Sie unter der Haube basteln? Das lokale Ausführen des Servers bietet Ihnen mehr Flexibilität. So geht's:

Klonen Sie das Repository:

git clone https://github.com/browserbase/mcp-server-browserbase.git
cd mcp-server-browserbase

Abhängigkeiten installieren:

pnpm install && pnpm build

Starten Sie den Server:

{
  "mcpServers": {
    "browserbase": {
      "command": "node",
      "args": ["path/to/mcp-server-browserbase/cli.js"],
      "env": {
        "BROWSERBASE_API_KEY": "your_api_key",
        "BROWSERBASE_PROJECT_ID": "your_project_id",
        "GEMINI_API_KEY": "your_gemini_key"
      }
    }
  }
}
node cli.js --port 3000

API-Schlüssel hinzufügen: Ersetzen Sie die Platzhalter in der Konfiguration durch Ihre tatsächlichen Browserbase- und Modell-API-Schlüssel.

Starten Sie Ihren Client neu: Wie zuvor, starten Sie Ihren KI-Client neu, um den Server zu aktivieren.

Anpassen des Servers

Der Browserbase MCP Server bietet Flags zur Anpassung seines Verhaltens. Hier sind einige nützliche:

Sie können diese Flags zum args-Array in Ihrer MCP-Konfiguration hinzufügen. Zum Beispiel:

"args": ["path/to/cli.js", "--proxies", "--browserWidth=1920"]

So verwenden Sie den Browserbase MCP Server zur Steuerung von Chrome

Nachdem Ihr Server eingerichtet ist, lassen Sie uns ihn in Betrieb nehmen! So verwenden Sie den Browserbase MCP Server, um einen Chrome-Browser zu steuern.

Schritt 1: Verbinden Sie Ihren KI-Client

Stellen Sie sicher, dass Ihr KI-Client (wie Claude Desktop oder Cursor) über eine der drei oben genannten Methoden mit dem Browserbase MCP Server verbunden ist.

Schritt 2: Befehle geben

In Ihrem KI-Client können Sie nun Befehle in natürlicher Sprache eingeben, um den Browser zu steuern. Hier sind einige Beispiele:

Zu einer URL navigieren:

https://example.com

Eine Schaltfläche anklicken:

"Klicke auf die Schaltfläche 'Sign Up'"

Ein Formular ausfüllen:

user@example.com

Einen Screenshot erstellen:

"Mache einen Screenshot der Startseite"

Daten extrahieren:

"Extrahiere alle Produkttitel von dieser Seite"

Die KI übersetzt diese Anweisungen mithilfe des Browserbase MCP Servers in Browseraktionen.

Schritt 3: Ergebnisse anzeigen

Je nach Befehl liefert die KI Ergebnisse wie:

Wenn Sie beispielsweise einen Screenshot anfordern, könnte die KI antworten:

"Screenshot aufgenommen und als 'homepage.png' gespeichert"

Testen des Browserbase MCP Servers

Lassen Sie uns dies an einem realen Beispiel testen. Angenommen, Sie möchten eine Suche auf einer Website automatisieren.

  1. Öffnen Sie Ihren KI-Client: Für dieses Beispiel verwenden wir Claude Desktop.
  2. Geben Sie einen Befehl ein:
https://google.com

3. Beobachten Sie den Browser: Wenn Sie lokal mit HTTP-Transport arbeiten, sehen Sie möglicherweise, wie der Browser geöffnet wird und die Aktionen ausführt.

4. Überprüfen Sie die Antwort: Claude sollte die Aktionen bestätigen und möglicherweise den Seitentitel oder Inhalt extrahieren.

Dieser einfache Test zeigt, wie der Browserbase MCP Server es der KI ermöglicht, Chrome zur Ausführung von Web-Aufgaben zu steuern.

Claude installieren

Tipps zur Fehlerbehebung

Fazit

Und da haben Sie es! Sie haben gelernt, wie Sie den Browserbase MCP Server verwenden, um einen Chrome-Browser mit KI zu steuern. Egal, ob Sie den gehosteten Weg für Einfachheit, npm oder die lokale Einrichtung für Kontrolle gewählt haben, Sie sind nun in der Lage, Web-Aufgaben wie ein Profi zu automatisieren. Der Browserbase MCP Server ist ein leistungsstarkes Tool, das KI und Web-Automatisierung zusammenführt und endlose Möglichkeiten für Innovationen eröffnet.

Bereit, mehr zu entdecken? Versuchen Sie, Ihre täglichen Web-Aufgaben zu automatisieren oder integrieren Sie es in Ihr nächstes KI-Projekt.

💡
Möchten Sie ein großartiges API-Testtool, das schöne API-Dokumentation generiert?

Möchten Sie eine integrierte All-in-One-Plattform, damit Ihr Entwicklerteam mit maximaler Produktivität zusammenarbeiten kann?

Apidog erfüllt all Ihre Anforderungen und ersetzt Postman zu einem wesentlich günstigeren Preis!
Schaltfläche

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen