AgenticSeek: Ejecutar Manus AI Localmente

Introducción

En una era donde los asistentes de IA son cada vez más potentes pero a menudo requieren conectividad en la nube y plantean preocupaciones de privacidad, AgenticSeek surge como una solución convincente para los usuarios que desean las capacidades de herramientas de IA avanzadas como Manus AI mientras mantienen un control total sobre sus datos. Este tutorial completo lo guiará a través de todo lo que necesita saber sobre la configuración, configuración y uso efectivo de AgenticSeek.

AgenticSeek es un asistente de IA 100% local que combina interacción por voz, navegación web autónoma, generación de código y capacidades de planificación de tareas. A diferencia de las alternativas basadas en la nube, se ejecuta completamente en su hardware, lo que garantiza que sus conversaciones, archivos y búsquedas permanezcan privados. Ya sea que sea un desarrollador que busca un asistente de codificación, un investigador que necesita automatización web o simplemente alguien que valora la privacidad, esta guía lo ayudará a aprovechar todo el potencial de AgenticSeek.

💡

¿Quiere una excelente herramienta de prueba de API que genere documentación de API hermosa?

¿Quiere una plataforma integrada y todo en uno para que su equipo de desarrolladores trabaje en conjunto con la máxima productividad?

¡Apidog satisface todas sus demandas y reemplaza a Postman a un precio mucho más asequible!

botón

Qué hace especial a AgenticSeek

Privacidad completa y operación local

La ventaja más significativa de AgenticSeek es su compromiso con la privacidad. Cada componente, desde el modelo de lenguaje hasta el reconocimiento de voz y la síntesis de voz, se ejecuta localmente en su máquina. Esto significa:

Ningún dato sale de su dispositivo
Sin dependencia de la nube ni requisitos de internet para la funcionalidad principal
Control completo sobre sus interacciones de IA
Sin tarifas de suscripción ni costos de API para la operación local

Capacidades de IA multimodal

AgenticSeek no es solo un chatbot; es un sistema de IA integral que puede:

Navegar por la web de forma autónoma: Buscar, leer artículos, extraer información e incluso llenar formularios web
Escribir y ejecutar código: Generar programas en Python, Go, Java, C y otros lenguajes
Planificar y ejecutar tareas complejas: Desglosar grandes proyectos en pasos manejables utilizando múltiples agentes especializados
Interacción por voz: Capacidades naturales de conversión de voz a texto y de texto a voz
Gestión de archivos: Trabajar con sus archivos y directorios locales

Enrutamiento inteligente de agentes

Una de las características destacadas de AgenticSeek es su capacidad para seleccionar automáticamente el mejor agente para cada tarea. Cuando realiza una solicitud, el sistema analiza su consulta y la enruta al agente especialista más apropiado, ya sea un agente de navegación web, un agente de codificación o un agente de planificación de tareas.

Historial de estrellas de Agenticseek en Github

Repositorio de Agenticseek en Github:

Prerrequisitos y requisitos de hardware

Antes de sumergirse en la instalación, es crucial comprender los requisitos de hardware para ejecutar AgenticSeek de manera efectiva.

Requisitos mínimos del sistema

Sistema operativo: Linux, macOS o Windows
Python: Versión 3.10 (específicamente recomendada)
Navegador Chrome: Última versión
Docker: Para ejecutar servicios de soporte
Memoria: Se recomiendan al menos 16 GB de RAM

Requisitos de hardware para LLM

El rendimiento de AgenticSeek depende en gran medida del modelo de lenguaje que elija ejecutar localmente:

Tamaño del modelo	Requisitos de GPU	Notas de rendimiento
7B	8 GB VRAM	No recomendado - rendimiento pobre y errores frecuentes
14B	12 GB VRAM (RTX 3060 o equivalente)	Utilizable para tareas simples, puede tener dificultades con operaciones complejas
32B	24 GB VRAM (RTX 4090 o equivalente)	Buen rendimiento para la mayoría de las tareas
70B+	48 GB+ VRAM (Mac Studio M2 Ultra o equivalente)	Excelente rendimiento, recomendado para usuarios avanzados

Modelos recomendados

AgenticSeek funciona mejor con modelos centrados en el razonamiento como:

Deepseek R1: Excelente para el razonamiento y el uso de herramientas
Qwen: Fuerte rendimiento en diversas tareas
Modelos Llama: Buen rendimiento de propósito general

Proceso de instalación

Paso 1: Clonar y configuración inicial

Primero, clone el repositorio de AgenticSeek y configure la configuración básica:

git clone https://github.com/Fosowl/agenticSeek.git
cd agenticSeek
mv .env.example .env

Paso 2: Crear entorno virtual

Es crucial usar Python 3.10 específicamente para evitar conflictos de dependencia:

python3 -m venv agentic_seek_env
source agentic_seek_env/bin/activate
# En Windows: agentic_seek_env\Scripts\activate

Paso 3: Instalar dependencias

Para Linux/macOS (instalación automática):

./install.sh

Para Windows:

./install.bat

Instalación manual (si la automática falla):

Linux:

sudo apt update
sudo apt install -y alsa-utils portaudio19-dev python3-pyaudio libgtk-3-dev libnotify-dev libgconf-2-4 libnss3 libxss1
sudo apt install -y chromium-chromedriver
pip3 install -r requirements.txt

macOS:

brew update
brew install --cask chromedriver
brew install portaudio
python3 -m pip install --upgrade pip
pip3 install --upgrade setuptools wheel
pip3 install -r requirements.txt

Windows:

pip install pyreadline3
pip install pyaudio
pip3 install -r requirements.txt

Nota: Para Windows, deberá descargar manualmente ChromeDriver desde el sitio web oficial de Chrome y agregarlo a su PATH.

Paso 4: Configurar proveedor de LLM local

La opción más popular es Ollama por su facilidad de uso:

# Instalar e iniciar Ollama
ollama serve

# Descargar un modelo recomendado
ollama pull deepseek-r1:14b  # Ajuste el tamaño según su hardware

Configuración

Entendiendo config.ini

El corazón de la configuración de AgenticSeek reside en el archivo config.ini. Aquí hay un desglose detallado de cada configuración:

[MAIN]
is_local = True
provider_name = ollama
provider_model = deepseek-r1:14b
provider_server_address = 127.0.0.1:11434
agent_name = Jarvis
recover_last_session = True
save_session = True
speak = True
listen = False
work_dir = /Users/yourname/Documents/ai_workspace
jarvis_personality = False
languages = en zh

[BROWSER]
headless_browser = True
stealth_mode = True

Opciones de configuración clave explicadas

Configuraciones principales:

is_local: Establecer en True para operación local, False para proveedores de API
provider_name: Elegir entre ollama, lm-studio, openai, etc.
provider_model: El modelo específico a usar (por ejemplo, deepseek-r1:14b)
work_dir: Directorio donde AgenticSeek puede leer/escribir archivos

Personalidad e interacción:

agent_name: Nombre para su asistente de IA (usado como palabra de activación para voz)
speak: Habilitar salida de texto a voz
listen: Habilitar entrada de voz a texto (solo CLI)
jarvis_personality: Usar una personalidad más conversacional, tipo Jarvis

Configuraciones del navegador:

headless_browser: Ejecutar el navegador sin ventana visible (recomendado para la interfaz web)
stealth_mode: Usar Selenium no detectado para evitar la detección de bots

Configurando su espacio de trabajo

Elija un directorio dedicado para que AgenticSeek trabaje. Esta debe ser una ubicación donde se sienta cómodo teniendo a la IA creando, modificando y organizando archivos:

mkdir ~/Documents/agentic_workspace

Actualice su config.ini con esta ruta:

work_dir = /Users/yourname/Documents/agentic_workspace

Primeros pasos: Primera ejecución

Iniciando los servicios

Antes de ejecutar AgenticSeek, debe iniciar los servicios de soporte:

# Activar su entorno virtual
source agentic_seek_env/bin/activate

# Iniciar servicios (SearxNG para búsqueda web, Redis, frontend)
sudo ./start_services.sh  # Linux/macOS
# o
start_services.cmd  # Windows

Opción 1: Interfaz de línea de comandos (CLI)

La interfaz CLI es perfecta para usuarios que prefieren la interacción basada en terminal:

python3 cli.py

Configuraciones de CLI recomendadas:

Establezca headless_browser = False en config.ini para ver las acciones del navegador
Establezca speak = True para respuestas de voz
Establezca listen = True si desea entrada de voz

Opción 2: Interfaz web

Para una experiencia más visual, use la interfaz web:

# Iniciar el backend
python3 api.py

Luego abra su navegador y navegue a http://localhost:3000/

Configuraciones de interfaz web recomendadas:

Establezca headless_browser = True para un mejor rendimiento
Mantenga speak = False a menos que desee audio en su navegador

Entendiendo las capacidades de AgenticSeek

Navegación web e investigación

AgenticSeek puede navegar por internet de forma autónoma para recopilar información. Aquí hay ejemplos de consultas efectivas:

Buena consulta: "Busca en la web los 10 mejores lenguajes de programación en 2024 y guarda un resumen en programming_trends.txt"

Evitar: "¿Cuáles son los lenguajes de programación populares?" (demasiado vago, no indica que se necesita búsqueda web)

La IA puede:

Buscar usando SearxNG (motor de búsqueda centrado en la privacidad)
Navegar por sitios web y extraer información
Llenar formularios web (función experimental)
Descargar y guardar contenido

Generación y ejecución de código

AgenticSeek destaca en la escritura y ejecución de código en múltiples lenguajes:

Ejemplos de solicitudes:

"Escribe un script de Python para analizar datos CSV y crear visualizaciones"
"Crea un programa Go que implemente un servidor API REST"
"Escribe un programa C para ordenar un array usando el algoritmo quicksort"

La IA:

Generará código completo y ejecutable
Agregará importaciones y dependencias necesarias
Probará el código y corregirá errores básicos
Guardará archivos en su espacio de trabajo designado

Planificación y ejecución de tareas

Para tareas complejas, AgenticSeek puede desglosarlas en pasos manejables:

Ejemplo: "Planifica un viaje de fin de semana a París, incluyendo vuelos, hoteles y actividades. Investiga opciones y guarda recomendaciones en paris_trip.txt"

La IA:

Investigará opciones de vuelo
Encontrará recomendaciones de hotel
Descubrirá actividades y restaurantes populares
Compilará todo en un documento organizado

Gestión de archivos

AgenticSeek puede trabajar con sus archivos locales:

Leer y analizar documentos
Organizar y renombrar archivos
Crear nuevos archivos y directorios
Procesar datos de archivos existentes

Características avanzadas

Interacción por voz

Para habilitar las funciones de voz, configure estas opciones:

speak = True  # Habilitar texto a voz
listen = True  # Habilitar voz a texto (solo CLI)
agent_name = Friday  # Palabra de activación para voz

Uso de comandos de voz:

Diga el nombre del agente (por ejemplo, "Friday")
Espere a que aparezca la transcripción
Hable su solicitud claramente
Termine con una frase de confirmación como "hazlo", "adelante" o "ejecuta"

Frases de confirmación admitidas:

"hazlo"
"adelante"
"ejecuta"
"corre"
"inicia"
"gracias"
"por favor"
"procede"

Soporte multi-idioma

AgenticSeek admite múltiples idiomas para la síntesis de voz:

languages = en zh fr es  # Inglés, Chino, Francés, Español

El primer idioma de la lista se convierte en el predeterminado para la síntesis de voz.

Gestión de sesiones

Controle cómo AgenticSeek maneja el historial de conversaciones:

recover_last_session = True  # Reanudar conversación anterior
save_session = True  # Recordar conversación actual

Esto es particularmente útil para proyectos de larga duración o cuando necesita continuar trabajando en varias sesiones.

Patrones de uso efectivos

Mejores prácticas para consultas

Sea específico sobre las acciones:

En lugar de: "Háblame de Python"
Use: "Busca en la web tutoriales de Python y guarda los 5 mejores enlaces en python_resources.txt"

Especifique operaciones de archivo:

"Guarda los resultados en nombre_archivo.txt"
"Crea un nuevo directorio llamado nombre_proyecto"
"Lee los datos del archivo_existente.csv y analízalos"

Indicadores de búsqueda web:

Siempre mencione "busca en la web" o "navega por internet" cuando desee investigación en línea
Sea específico sobre la información que está buscando

Ejemplos de flujo de trabajo óptimos

Proyecto de investigación:

"Busca en la web los desarrollos recientes de IA en 2024"
"Resume los hallazgos y guarda en ai_developments_2024.txt"
"Crea un script de Python para visualizar las tendencias mencionadas en el resumen"

Tarea de desarrollo:

"Crea una nueva estructura de proyecto Python para un web scraper"
"Escribe el módulo principal de scraping usando BeautifulSoup"
"Agrega manejo de errores y registro al scraper"
"Escribe pruebas unitarias para las funciones de scraping"

Análisis de datos:

"Lee el archivo sales_data.csv en mi espacio de trabajo"
"Analiza los datos en busca de tendencias y patrones"
"Crea visualizaciones que muestren las tendencias de ventas mensuales"
"Genera un informe con insights y guarda como sales_analysis.txt"

Solución de problemas comunes

Problemas con ChromeDriver

Error: Desajuste de versión entre Chrome y ChromeDriver

Solución:

Verifique su versión de Chrome: google-chrome --version
Descargue el ChromeDriver correspondiente de https://developer.chrome.com/docs/chromedriver/downloads
Reemplace el ChromeDriver existente con la nueva versión

Problemas de conexión

Error: "No connection adapters were found"

Solución: Asegúrese de que la dirección de su proveedor incluya el protocolo:

provider_server_address = http://127.0.0.1:11434

Error de URL base de SearxNG

Solución: Asegúrese de haber renombrado .env.example a .env, o exporte la variable de entorno:

export SEARXNG_BASE_URL="http://127.0.0.1:8080"

Problemas de rendimiento

Rendimiento pobre de la IA:

Use modelos más grandes (32B+ si es posible)
Asegure suficiente VRAM/RAM
Verifique que su proveedor de LLM esté funcionando correctamente

Navegación web lenta:

Habilite stealth_mode para una mejor compatibilidad
Establezca headless_browser = True para una operación más rápida
Verifique su conexión a internet

Opciones de configuración avanzadas

Uso de diferentes proveedores de LLM

Configuración de Ollama:

provider_name = ollama
provider_model = deepseek-r1:32b
provider_server_address = 127.0.0.1:11434

Configuración de LM Studio:

provider_name = lm-studio
provider_model = your-model-name
provider_server_address = http://127.0.0.1:1234

Configuración de servidor remoto:
Si tiene un servidor potente ejecutando el LLM:

provider_name = server
provider_model = deepseek-r1:70b
provider_server_address = your-server-ip:3333

Opciones de proveedor de API

Para usuarios sin hardware suficiente, hay proveedores de API disponibles:

is_local = False
provider_name = deepseek
provider_model = deepseek-chat

Exporte su clave de API:

export DEEPSEEK_API_KEY="your-api-key-here"

Consejos para un uso óptimo

Optimización de hardware

Gestión de memoria de GPU: Cierre aplicaciones innecesarias para liberar VRAM
Selección de modelo: Comience con modelos más pequeños y actualice según sea necesario
Uso de RAM: Monitoree la memoria del sistema, especialmente con modelos más grandes

Optimización de consultas

Sea explícito: Siempre especifique si desea búsqueda web, operaciones de archivos o generación de código
Desglose tareas complejas: Para procesos de varios pasos, proporcione instrucciones claras paso a paso
Use nombres de archivo específicos: Siempre especifique nombres y ubicaciones de archivo exactos

Eficiencia del flujo de trabajo

Organice su espacio de trabajo: Mantenga su work_dir organizado con estructuras de carpetas claras
Use la gestión de sesiones: Habilite el guardado de sesiones para proyectos de larga duración
Pruebe comandos de voz: Practique comandos de voz en un entorno tranquilo para un mejor reconocimiento

Conclusión

AgenticSeek representa un paso significativo hacia adelante en la asistencia de IA consciente de la privacidad. Siguiendo esta guía completa, ahora debería tener un asistente de IA local completamente funcional capaz de navegar por la web, generar código, planificar tareas e interactuar por voz, todo mientras mantiene sus datos completamente privados.

Recuerde que AgenticSeek es un proyecto en evolución. A medida que lo use, descubrirá nuevas capacidades y patrones de uso óptimos. La clave del éxito es ser específico en sus solicitudes, comprender las fortalezas del sistema y aprovechar su arquitectura multi-agente.

Ya sea que esté utilizando AgenticSeek para investigación, desarrollo o tareas de productividad general, su combinación de privacidad, capacidad y operación local lo convierte en una alternativa potente a los asistentes de IA basados en la nube. Comience con tareas simples para familiarizarse con el sistema, luego explore gradualmente flujos de trabajo más complejos a medida que se sienta cómodo con sus capacidades.

El futuro de la asistencia de IA es local, privado y bajo su control total, y AgenticSeek está liderando el camino para hacer que ese futuro sea accesible para todos.