Suna AI: Der Open-Source-General-AI-Agent

Dieser Artikel: Suna-Funktionen & Architektur. Anleitung zur lokalen Einrichtung & Nutzung dieses KI-Agenten.

Leo Schulz

Leo Schulz

17 July 2025

Suna AI: Der Open-Source-General-AI-Agent

Das Feld der künstlichen Intelligenz bewegt sich zunehmend in Richtung Agenten, die mehr können, als nur Informationen zu verarbeiten – sie können handeln. Suna AI taucht in diesem Bereich als überzeugender Open-Source-Generalist-KI-Agent auf, der als digitaler Begleiter fungieren soll, der in der Lage ist, Anweisungen in natürlicher Sprache zu verstehen und komplexe, reale Aufgaben direkt in Ihrem Namen auszuführen. Entwickelt von Kortix AI und unter der permissiven Apache 2.0-Lizenz veröffentlicht, differenziert sich Suna durch die Kombination einer leistungsstarken Tool-Suite mit einer Konversationsschnittstelle, mit dem Ziel, die Lücke zwischen Benutzerabsicht und greifbarem digitalem Handeln zu schließen.

Im Gegensatz zu spezialisierten KI-Tools liegt die Stärke von Suna in seiner Vielseitigkeit. Es ist so konzipiert, dass es verschiedene Fähigkeiten orchestriert – vom Surfen im Web und Verwalten von Dateien bis hin zur Ausführung von Code und der Interaktion mit APIs – alles gesteuert durch Ihre Konversationsaufforderungen. Dieser Artikel bietet einen Überblick über die Kernfunktionen und die Architektur von Suna, gefolgt von einem detaillierten, schrittweisen Tutorial, wie Sie Ihre eigene Instanz lokal einrichten und ausführen können, damit Sie diesen leistungsstarken KI-Agenten in Ihrer eigenen Umgebung nutzen können.

💡
Want a great API Testing tool that generates beautiful API Documentation?

Want an integrated, All-in-One platform for your Developer Team to work together with maximum productivity?

Apidog delivers all your demans, and replaces Postman at a much more affordable price!
button

Was ist Suna AI und wie funktioniert Suna AI?

Um zu verstehen, was Suna kann, ist es wichtig, die Werkzeuge zu verstehen, die es einsetzt. Diese Fähigkeiten ermöglichen es ihm, mit der digitalen Welt ähnlich wie ein menschlicher Benutzer zu interagieren, aber automatisiert und von KI gesteuert.

  1. Browser Automation (via Playwright): Suna kann eine Webbrowser-Instanz in seiner sicheren Umgebung starten und steuern. Das bedeutet, dass es zu bestimmten URLs navigieren, sich auf Websites anmelden (sofern Anmeldeinformationen sicher bereitgestellt werden), auf Schaltflächen klicken, Formulare ausfüllen, Seiten scrollen und vor allem Daten direkt aus Webseiteninhalten extrahieren kann. Diese Fähigkeit schaltet die riesige Menge an Informationen und Funktionalitäten frei, die im Web für die Automatisierung verfügbar sind.
  2. File Management: Der Agent ist nicht nur auf Webdaten beschränkt. Er besitzt die Fähigkeit, mit einem Dateisystem innerhalb seiner Sandboxed-Umgebung zu interagieren. Dies beinhaltet das Erstellen neuer Dateien (wie Berichte oder Datenexporte), das Lesen vorhandener Dokumente, das Bearbeiten ihres Inhalts und das Organisieren von Dateien in Verzeichnissen. Dies ist entscheidend für Aufgaben, die die Generierung von Ausgaben oder die Verarbeitung lokaler Daten umfassen.
  3. Web Crawling & Enhanced Search: Über das Browsen einzelner Seiten hinaus kann Suna systematisch Websites durchsuchen (Links folgen), um umfassende Informationen zu sammeln. Es kann sich auch in dedizierte Such-APIs (wie die optionale Tavily-Integration) integrieren, um eine anspruchsvollere, gezieltere Informationsbeschaffung durchzuführen als die Verwendung einer Standardsuchmaschine, was tiefere Recherchefunktionen ermöglicht.
  4. Command-Line Execution: Innerhalb seines sicheren Docker-Containers hat Suna die Möglichkeit, Shell-Befehle auszuführen. Diese leistungsstarke Funktion ermöglicht es ihm, Skripte auszuführen, andere Befehlszeilen-Dienstprogramme zu nutzen, mit Systemressourcen zu interagieren (innerhalb der Grenzen des Containers) und potenziell Aufgaben wie Software-Builds oder -Bereitstellungen zu automatisieren, wenn sie entsprechend konfiguriert sind. Sicherheit ist hier von größter Bedeutung und wird von der isolierten Umgebung gehandhabt.
  5. API Integration (via RapidAPI & Direct Calls): Suna kann Aufrufe an externe Application Programming Interfaces (APIs) tätigen. Dies ermöglicht die Verbindung mit einem riesigen Ökosystem von Drittanbieterdiensten. Die Dokumentation hebt die optionale RapidAPI-Integration hervor, die den Zugriff auf verschiedene Datenanbieter (z. B. für LinkedIn-Daten, Finanzinformationen usw.) ermöglicht, aber es kann auch so konfiguriert werden, dass es direkt mit anderen RESTful-APIs interagiert, wodurch sein Potenzial zur Datenerfassung und -aktion erheblich erweitert wird.
  6. Code Interpretation: Suna enthält die Fähigkeit, Code-Snippets (hauptsächlich Python) innerhalb seiner sicheren Umgebung auszuführen. Dies dient nicht nur zum Ausführen vorhandener Skripte, sondern ermöglicht es dem Agenten, Code dynamisch zu generieren und auszuführen, um komplexe Berechnungen, Datenanalysen, benutzerdefinierte Logikverarbeitung oder Transformationen durchzuführen, die über die Fähigkeiten seiner anderen Tools hinausgehen.

Die wahre Stärke von Suna liegt in der Fähigkeit der KI, diese Tools basierend auf der Anfrage des Benutzers angemessen auszuwählen und zu sequenzieren. Eine einzelne Anweisung könnte einen Workflow auslösen, der das Durchsuchen des Webs, das Extrahieren von Daten, deren Verarbeitung mit interpretiertem Code, das Formatieren des Ergebnisses in eine Datei und das Speichern umfasst – alles vom Agenten verwaltet.

Sunas Architektur: Die beteiligten Komponenten

Das Verständnis des Einrichtungsprozesses erfordert ein grundlegendes Verständnis der wichtigsten architektonischen Komponenten von Suna:

  1. Backend API (Python/FastAPI): Hier befindet sich die Kernlogik. Es verwaltet Benutzeranfragen, verwaltet den Konversationsstatus, orchestriert die Toolnutzung des Agenten und handhabt die Kommunikation mit dem gewählten Large Language Model (LLM) über LiteLLM (bietet Flexibilität bei Anbietern wie OpenAI und Anthropic).
  2. Frontend (Next.js/React): Dies ist die benutzerorientierte Webanwendung. Sie stellt die Chat-Oberfläche für die Interaktion mit Suna bereit, zeigt Ergebnisse an und enthält Dashboard-Elemente zur Überwachung der Agentenaktivität.
  3. Agent Docker Environment (via Daytona): Sicherheit und Isolation sind entscheidend. Jede Agentenaufgabe wird in einem dedizierten Docker-Container ausgeführt, der von Daytona verwaltet wird. Diese Sandbox enthält alle notwendigen Tools (Browser, Code-Interpreter, Dateisystemzugriff) und verhindert, dass der Agent in das Hostsystem eingreift.
  4. Supabase Database (PostgreSQL): Verarbeitet alle Anforderungen an die Datenpersistenz, einschließlich Benutzerkonten und Authentifizierung, Konversationsverlauf, Speicherung für vom Agenten generierte Dateien, Agentenstatusverfolgung und potenziell Analysen.

Diese Komponenten arbeiten zusammen und kommunizieren über APIs, um die Suna-Erfahrung zu liefern. Die Self-Hosting-Einrichtung beinhaltet die Konfiguration und Ausführung dieser miteinander verbundenen Teile.

So richten Sie Suna AI ein

Wenn Sie Suna selbst ausführen, haben Sie maximale Kontrolle und Privatsphäre. Die folgenden Schritte führen Sie durch den Einrichtungsprozess:

Phase 1: Sammeln von Voraussetzungen

Vor der Installation von Suna benötigen Sie mehrere externe Dienste und Anmeldeinformationen:

Supabase Project:

Redis Database:

Daytona Account & Image Configuration:

LLM API Key:

(Optional) Tavily API Key: Für bessere Suchergebnisse. Holen Sie sich einen Schlüssel von Tavily AI.

(Optional) RapidAPI Key: Wenn Sie beabsichtigen, vorgefertigte Integrationen zu verwenden, die dies benötigen (z. B. bestimmte Web-Scraper).

Phase 2: Installation und Konfiguration

Konfigurieren Sie nun die Suna-Anwendungskomponenten:

Klonen Sie das Repository:

git clone https://github.com/kortix-ai/suna.git
cd suna

Konfigurieren Sie das Backend (.env):

NEXT_PUBLIC_URL="http://localhost:3000" # Oder Ihre Frontend-URL, falls abweichend

# Supabase
SUPABASE_URL=YOUR_SUPABASE_URL
SUPABASE_ANON_KEY=YOUR_SUPABASE_ANON_KEY
SUPABASE_SERVICE_ROLE_KEY=YOUR_SUPABASE_SERVICE_ROLE_KEY

# Redis
REDIS_HOST=YOUR_REDIS_HOST
REDIS_PORT=YOUR_REDIS_PORT
REDIS_PASSWORD=YOUR_REDIS_PASSWORD # Leer lassen, falls keine
REDIS_SSL=True # Oder False für lokales Nicht-SSL-Redis

# Daytona
DAYTONA_API_KEY=YOUR_DAYTONA_API_KEY
DAYTONA_SERVER_URL="https://app.daytona.io/api"
DAYTONA_TARGET="us" # Oder Ihre Region

# --- LLM Configuration (FILL ONLY ONE SET) ---
# Anthropic Example:
ANTHROPIC_API_KEY=YOUR_ANTHROPIC_API_KEY
MODEL_TO_USE="anthropic/claude-3-5-sonnet-latest" # Oder anderes Claude-Modell
OPENAI_API_KEY=
# OpenAI Example:
# ANTHROPIC_API_KEY=
# OPENAI_API_KEY=YOUR_OPENAI_API_KEY
# MODEL_TO_USE="gpt-4o" # Oder anderes OpenAI-Modell
# -----------------------------------------

# Optional
TAVILY_API_KEY=YOUR_TAVILY_API_KEY # Optional
RAPID_API_KEY=YOUR_RAPID_API_KEY # Optional

Richten Sie das Supabase-Datenbankschema ein:

Konfigurieren Sie das Frontend (.env.local):

NEXT_PUBLIC_SUPABASE_URL=YOUR_SUPABASE_URL # Wie im Backend .env
NEXT_PUBLIC_SUPABASE_ANON_KEY=YOUR_SUPABASE_ANON_KEY # Wie im Backend .env
NEXT_PUBLIC_BACKEND_URL="http://localhost:8000/api" # Standard-Backend-Standort
NEXT_PUBLIC_URL="http://localhost:3000" # Standard-Frontend-Standort

Abhängigkeiten installieren:

# Im Frontend-Verzeichnis
npm install
# Im Backend-Verzeichnis (verwenden Sie eine virtuelle Umgebung!)
# python -m venv venv
# source venv/bin/activate  OR .\venv\Scripts\activate (Windows)
pip install -r requirements.txt

Phase 3: Suna ausführen

Backend-Dienst starten:

Frontend-Dienst starten:

Greifen Sie auf Ihre Suna-Instanz zu:

Fazit

Suna AI stellt einen praktischen Schritt in Richtung autonomer KI-Agenten dar, die in der Lage sind, Aufgaben im digitalen Bereich auszuführen. Seine Open-Source-Natur, kombiniert mit einem leistungsstarken Toolkit und einer modularen Architektur, macht es zu einer attraktiven Option für Entwickler und Benutzer, die einen anpassbaren, selbst hostbaren KI-Assistenten suchen. Indem Sie dem detaillierten Einrichtungsprozess folgen, den wir oben skizziert haben, können Sie Ihre eigene Instanz von Suna bereitstellen, die Ihnen eine Konversationsschnittstelle bietet, um das Surfen, die Dateimanipulation, die Datenerfassung, die Codeausführung und mehr zu automatisieren, alles in einer Umgebung, die Sie kontrollieren. Während die Einrichtung sorgfältige Aufmerksamkeit auf seine mehreren Komponenten erfordert, ist das Ergebnis ein vielseitiger KI-Agent, der bereit ist, in Ihrem Namen zu handeln.

💡
Want a great API Testing tool that generates beautiful API Documentation?

Want an integrated, All-in-One platform for your Developer Team to work together with maximum productivity?

Apidog delivers all your demans, and replaces Postman at a much more affordable price!
button

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen