So verwenden Sie SiteMCP und verwandeln jede Website in einen MCP-Server

Betreten Sie SiteMCP! Verwandeln Sie Websites in MCP-Server, damit KI wie Claude Web-Inhalte direkt nutzen kann.

Leo Schulz

Leo Schulz

5 June 2025

So verwenden Sie SiteMCP und verwandeln jede Website in einen MCP-Server

In der heutigen, von KI getriebenen Welt ist die Fähigkeit, externes Wissen in große Sprachmodelle (LLMs) einzuspeisen, immer wichtiger geworden. Egal, ob Sie Entwickler, Content-Ersteller oder KI-Enthusiast sind, der Zugriff Ihrer Modelle auf spezifische Informationen kann deren Antworten dramatisch verbessern. Hier kommt SiteMCP ins Spiel, ein innovatives Tool, mit dem Sie praktisch jede Website in einen Model Context Protocol (MCP)-Server umwandeln können, sodass KI-Assistenten wie Claude direkt auf Webinhalte zugreifen und sich darauf beziehen können.

Was ist SiteMCP?

SiteMCP ist ein leistungsstarkes Dienstprogramm, das eine ganze Website abruft und in einen MCP-Server umwandelt. Entwickelt von ryoppippi, überbrückt dieses Tool die Lücke zwischen Webinhalten und KI-Modellen, indem es Websites über das Model Context Protocol-Framework zugänglich macht. Es ist im Wesentlichen eine Lösung, die es LLMs ermöglicht, Websites zu lesen und sich auf sie zu beziehen, die MCP nicht nativ unterstützen oder keine spezifischen Integrationsmethoden bereitgestellt haben.

Credit: SiteMCP wurde von ryoppippi erstellt. Ich ermutige Sie, sein GitHub-Projekt unter https://github.com/ryoppippi/sitemcp zu besuchen, um seine Arbeit zu unterstützen und über die neuesten Funktionen und Entwicklungen auf dem Laufenden zu bleiben

Bitte besuchen Sie das SiteMCP Github Repo

Was ist Model Context Protocol (MCP)?

Bevor wir tiefer in SiteMCP eintauchen, wollen wir verstehen, was MCP eigentlich ist. MCP steht für "Model Context Protocol", ein System, das KI-Assistenten den Zugriff auf externe Datenquellen ermöglicht. Vereinfacht ausgedrückt ist es ein Protokoll, mit dem Sie einer KI sagen können: "Bitte lies diese Website" oder "Überprüfe diese Datei", und die KI diese Informationen tatsächlich abrufen und verarbeiten lassen können.

MCP dient als Brücke zwischen KI-Modellen und externen Wissensquellen und macht Interaktionen informierter und kontextbezogener. Ohne MCP wären KI-Assistenten auf Informationen beschränkt, auf denen sie trainiert wurden, und würden möglicherweise die neuesten Entwicklungen oder spezifische Inhalte verpassen, auf die Sie sich beziehen möchten.

Warum SiteMCP wichtig ist

SiteMCP löst mehrere kritische Herausforderungen:

  1. Zugriff auf nicht bereitgestellte Informationen: Viele Websites bieten keine MCP-Server oder Kompatibilität mit KI-Tools an. SiteMCP umgeht diese Einschränkung.
  2. Reduzierter Token-Verbrauch: Anstatt ganze Websites in eine Eingabeaufforderung einzuspeisen (was wertvolle Token verbraucht), ermöglicht SiteMCP KIs, nur auf das zuzugreifen, was sie wann benötigen.
  3. Aktuelle Informationen: Greifen Sie auf die aktuellste Dokumentation zu, insbesondere für sich schnell verändernde Technologien und Bibliotheken.
  4. Benutzerdefinierte Wissensdatenbank: Machen Sie Ihre persönlichen Websites, Dokumentationen oder Wissensdatenbanken für KI-Assistenten zugänglich.

Erste Schritte mit SiteMCP

Installationsoptionen

SiteMCP bietet flexible Installationsoptionen, je nach Ihren Präferenzen:

Für einmalige Verwendung:

# Wählen Sie eine der folgenden Optionen:
bunx sitemcp
npx sitemcp
pnpx sitemcp

Für globale Installation:

# Wählen Sie eine der folgenden Optionen:
bun i -g sitemcp
npm i -g sitemcp
pnpm i -g sitemcp

Grundlegende Verwendung

Die Verwendung von SiteMCP ist bemerkenswert einfach. Der einfachste Befehl folgt diesem Muster:

sitemcp https://example.com

Dadurch wird die gesamte Website unter example.com abgerufen und ein MCP-Server dafür erstellt. Für eine bessere Leistung bei größeren Websites können Sie die Parallelität anpassen:

sitemcp https://example.com --concurrency 10

Erweiterte Konfigurationsoptionen

SiteMCP bietet mehrere Anpassungsoptionen, um die Verarbeitung und Bereitstellung von Websites fein abzustimmen:

Tool-Namensstrategie

Die Tool-Namensstrategie bestimmt, wie die MCP-Servernamen generiert werden. Dies wird mit dem Flag -t oder --tool-name-strategy festgelegt:

# Verwenden Sie die Domain als Tool-Namen
sitemcp https://vite.dev -t domain

# Verwenden Sie die Subdomain als Tool-Namen
sitemcp https://react-tweet.vercel.app/ -t subdomain

# Verwenden Sie den Pfadnamen als Tool-Namen (Standard)
sitemcp https://ryoppippi.github.io/vite-plugin-favicons/ -t pathname
# Ergebnisse in: indexOfVitePluginFavicons / getDocumentOfVitePluginFavicons

Abgleichen bestimmter Seiten

Für große Websites möchten Sie möglicherweise einschränken, welche Seiten abgerufen werden. Mit dem Flag -m oder --match können Sie Muster angeben:

sitemcp https://vite.dev -m "/guide/**" "/blog/**"

Dadurch werden nur Seiten abgerufen, die mit den angegebenen Mustern übereinstimmen, wodurch Verarbeitungszeit und Ressourcen gespart werden. Das Matching wird von micromatch unterstützt, das leistungsstarke Musterabgleichfunktionen bietet.

Inhaltsauswahl

SiteMCP verwendet Mozillas Lesbarkeit, um aussagekräftige Inhalte von Webseiten zu extrahieren. Manchmal erfasst diese automatische Extraktion jedoch möglicherweise nicht den richtigen Inhalt. In solchen Fällen können Sie einen CSS-Selektor angeben:

sitemcp https://vite.dev --content-selector ".content"

Caching-Mechanismus

SiteMCP speichert abgerufene Seiten standardmäßig in ~/.cache/sitemcp zwischen, was nachfolgende Läufe beschleunigt. Wenn Sie jedes Mal frische Inhalte benötigen, können Sie das Caching deaktivieren:

sitemcp https://example.com --no-cache

Integrieren von SiteMCP mit MCP-Clients

Die wahre Stärke von SiteMCP zeigt sich, wenn es in MCP-kompatible KI-Clients integriert wird. Lassen Sie uns untersuchen, wie Sie dies mit Claude Desktop, einem beliebten KI-Assistenten, einrichten können:

Claude Desktop-Konfiguration

Um Claude Desktop so zu konfigurieren, dass er Ihren SiteMCP-Server verwendet, fügen Sie Folgendes zu Ihrer Konfigurationsdatei hinzu:

{
  "mcpServers": {
    "daisy-ui": {
      "command": "npx",
      "args": [
        "-y",
        "sitemcp",
        "https://daisyui.com",
        "-m",
        "/components/**"
      ]
    }
  }
}

Diese Konfiguration weist Claude Desktop an, einen MCP-Server namens "daisy-ui" einzurichten, der Zugriff auf die DaisyUI-Komponentendokumentation bietet. Wenn Sie Claude Desktop neu starten, startet er bei Bedarf automatisch den SiteMCP-Server.

Praktische Anwendungsfälle

Zugriff auf Bibliotheksdokumentation

Eine der leistungsstärksten Anwendungen von SiteMCP ist die Bereitstellung von KI-Assistenten mit Zugriff auf die Bibliotheksdokumentation:

{
  "mcpServers": {
    "svelte": {
      "command": "npx",
      "args": [
        "-y",
        "sitemcp@latest",
        "https://svelte.dev",
        "-m",
        "/docs/**"
      ]
    }
  }
}

Diese Konfiguration ermöglicht es Ihrer KI, sich auf die neueste Svelte-Dokumentation zu beziehen, um sicherzustellen, dass Codevorschläge und Erklärungen aktuelle Best Practices widerspiegeln und nicht veraltete Informationen, die die KI möglicherweise während des Trainings gelernt hat.

Integration der persönlichen Website

Sie können Ihre persönliche Website auch für KIs verfügbar machen:

{
  "mcpServers": {
    "my-blog": {
      "command": "npx",
      "args": [
        "-y",
        "sitemcp@latest",
        "https://yourblog.com"
      ]
    }
  }
}

Dies ermöglicht es KIs, sich auf Ihren Schreibstil, frühere Artikel oder persönliche Dokumentation zu beziehen, wodurch ihre Antworten besser auf Ihren spezifischen Kontext zugeschnitten werden.

So funktioniert SiteMCP

SiteMCP arbeitet über eine clevere Zwei-Server-Architektur:

  1. Index-Server: Bietet eine Liste der verfügbaren Seiten mit ihren Titeln und URLs.
  2. Dokumentenserver: Ruft den tatsächlichen Inhalt bestimmter Seiten ab, wenn dies angefordert wird.

Dieser Ansatz ermöglicht es der KI, zunächst zu verstehen, welche Informationen verfügbar sind, und dann selektiv nur das abzurufen, was sie benötigt, wodurch die Token-Nutzung im Vergleich zur Bereitstellung aller Informationen auf einmal erheblich reduziert wird.

Wenn eine Seite besonders lang ist, implementiert SiteMCP eine Paginierung, um einen zuverlässigen Zugriff zu gewährleisten, da einige KI-Modelle möglicherweise mit extrem großen Dokumenten zu kämpfen haben.

Behebung häufiger Probleme

Lange Tool-Namen

Einige Benutzer sind auf Probleme mit Toolnamen gestoßen, die das 64-Zeichen-Limit in bestimmten MCP-Clients überschreiten. Die neueste Version (v0.3.0 und höher) hat dieses Problem behoben, aber wenn Sie ähnliche Probleme haben, wird empfohlen, auf die neueste Version zu aktualisieren.

Serverkommunikationsfehler

Wenn Sie JSONRPC-Fehler wie {"jsonrpc":"2.0","id":XX,"error":{"code":-32601,"message":"Method not found"}} erhalten, stellen Sie sicher, dass Sie die neueste Version von SiteMCP verwenden, die Korrekturen für die Kompatibilität mit verschiedenen MCP-Clients enthält.

Leistungsaspekte

Für sehr große Websites sollten Sie den Parameter "match" verwenden, um einzuschränken, welche Seiten abgerufen werden:

sitemcp https://large-documentation-site.com -m "/get-started/**" "/api/**"

Dies kann die Leistung dramatisch verbessern und die Ressourcenauslastung reduzieren.

Erweiterte SiteMCP-Anwendungen

Erstellen benutzerdefinierter Wissensdatenbanken

Über bestehende Websites hinaus können Sie SiteMCP verwenden, um benutzerdefinierte Wissensdatenbanken zu erstellen, indem Sie es auf lokal bereitgestellte Inhalte verweisen:

# Stellen Sie zuerst Ihre lokale Dokumentation bereit
npx serve ./my-docs

# Erstellen Sie dann in einem anderen Terminal einen MCP-Server daraus
sitemcp http://localhost:3000

Kombinieren mehrerer Wissensquellen

Sie können mehrere SiteMCP-Server in Ihrem MCP-Client konfigurieren, um der KI Zugriff auf verschiedene Informationsquellen zu ermöglichen:

{
  "mcpServers": {
    "technical-docs": {
      "command": "npx",
      "args": ["-y", "sitemcp@latest", "https://docs.example.com"]
    },
    "company-blog": {
      "command": "npx",
      "args": ["-y", "sitemcp@latest", "https://blog.example.com"]
    }
  }
}

Fazit

SiteMCP bietet eine elegante Lösung für eine der häufigsten Herausforderungen bei KI-Interaktionen: die Bereitstellung spezifischen externen Wissens für KI-Modelle. Durch die Umwandlung jeder Website in einen MCP-Server überbrückt es die Lücke zwischen Webinhalten und KI-Funktionen und ermöglicht informiertere, genauere und kontextbezogene KI-Antworten.

Egal, ob Sie ein Entwickler sind, der Ihrer KI Zugriff auf bestimmte Dokumentationen ermöglichen möchte, ein Content-Ersteller, der möchte, dass Ihre KI sich auf Ihre Arbeit bezieht, oder einfach ein KI-Enthusiast, der die Fähigkeiten Ihres Assistenten erweitern möchte, SiteMCP bietet eine unkomplizierte Möglichkeit, die KI-Mensch-Zusammenarbeit zu verbessern.

Da sich die KI-Landschaft ständig weiterentwickelt, werden Tools wie SiteMCP, die den Informationsfluss zwischen Webressourcen und KI-Modellen erleichtern, immer wertvoller. Indem Sie SiteMCP beherrschen, lernen Sie nicht nur ein Tool – Sie übernehmen ein neues Paradigma der KI-Interaktion, das das riesige Wissen des Webs nutzt, um KI-Assistenten hilfreicher, genauer und kontextbezogener zu machen.

Explore more

Fathom-R1-14B: Fortschrittliches KI-Argumentationsmodell aus Indien

Fathom-R1-14B: Fortschrittliches KI-Argumentationsmodell aus Indien

Künstliche Intelligenz wächst rasant. FractalAIResearch/Fathom-R1-14B (14,8 Mrd. Parameter) glänzt in Mathe & Logik.

5 June 2025

Cursor 1.0 mit BugBot: KI-gestütztes Automatisierungstest-Tool ist da:

Cursor 1.0 mit BugBot: KI-gestütztes Automatisierungstest-Tool ist da:

Die Softwareentwicklung erlebt Innovationen durch KI. Cursor, ein KI-Editor, erreicht mit Version 1.0 einen Meilenstein.

5 June 2025

30+ öffentliche Web 3.0 APIs, die Sie jetzt nutzen können

30+ öffentliche Web 3.0 APIs, die Sie jetzt nutzen können

Der Aufstieg von Web 3.0: Dezentral, nutzerorientiert, transparent. APIs ermöglichen innovative dApps und Blockchain-Integration.

4 June 2025

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen