Pruebas de CUA: el servidor MCP para agentes de uso informático, aquí están mis opiniones

CUA, el marco de agente de uso de computadora, y su elegante servidor MCP, Cua, permiten a los agentes de IA controlar tu sistema macOS o Linux con lenguaje natural. Me sumergí en la configuración del servidor MCP de CUA en mi Mac con Apple Silicon, y déjame decirte: ¡es un cambio radical para automatizar tareas localmente! En esta guía para principiantes, compartiré mis impresiones sobre la instalación y prueba del servidor MCP de CUA, con un ejemplo divertido: hacer que abra una terminal y liste el contenido del directorio. No se requieren habilidades técnicas, ¡solo un poco de curiosidad! ¿Listo para convertir tu IA en un susurrador de computadoras? ¡Vamos a ello!

💡

¿Quieres una gran herramienta de prueba de API que genere documentación de API hermosa?

¿Quieres una plataforma integrada, todo en uno, para que tu equipo de desarrolladores trabaje junto con máxima productividad?

Apidog satisface todas tus demandas y reemplaza a Postman a un precio mucho más asequible!

button

¿Qué es Cua y el Servidor MCP de CUA?

CUA (Agente de Uso de Computadora) es un marco de código abierto que permite a los agentes de IA interactuar con tu computadora; piensa en el control de pantalla, la automatización del teclado y el mouse, y las máquinas virtuales en entornos aislados (VMs) en macOS y Linux, especialmente en Apple Silicon. El servidor MCP de Cua es su componente de Protocolo de Contexto de Modelo (MCP), actuando como un puente para permitir que clientes de IA como Claude Desktop o Cursor ejecuten tareas de CUA a través de lenguaje natural. Es como darle a tu IA un control remoto para tu sistema, ejecutando comandos de manera segura sin depender de la nube. Lo configuraremos y lo probaremos con una tarea simple, todo mientras mantenemos las cosas privadas y divertidas. ¡Vamos a sumergirnos!

Configurando tu Entorno: Preparándose para CUA

Antes de lanzar el servidor MCP de CUA, preparemos tu sistema. Esto es amigable para principiantes, con cada paso explicado para mantenerte informado.

1. Verificar Requisitos Previos: Asegúrate de tener estas herramientas listas:

Python: Versión 3.10 o superior. Ejecuta python --version en tu terminal. Si falta o está desactualizado, descárgalo de python.org. Python impulsa los scripts y el servidor de CUA.
Git: Necesario para clonar el repositorio de Cua. Verifica con git --version. Instala desde git-scm.com si es necesario.
Docker: Requerido para la configuración contenida del servidor MCP. Descárgalo de docker.com y verifica con docker --version.
Hardware: Un Mac con Apple Silicon (M1/M2/M3) o un sistema Linux, CPU de 4 núcleos o más, 16 GB de RAM o más, y 10 GB de almacenamiento libre para dependencias. ¿Falta algo? Instálalo ahora para evitar contratiempos.

2. Crear una Carpeta de Proyecto: Mantengamos las cosas organizadas con una carpeta dedicada:

mkdir cua-mcp-test
cd cua-mcp-test

Esta carpeta contendrá tu proyecto de CUA, y cd te prepara para los siguientes pasos.

3. Clonar el Repositorio de Cua: Obtén el código fuente de CUA de GitHub:

git clone https://github.com/trycua/cua.git
cd cua

El comando git clone obtiene el repositorio de Cua, incluyendo el código del servidor MCP en libs/mcp-server. El cd cua te lleva al directorio del proyecto.

4. Configurar un Entorno Virtual: Para prevenir conflictos de paquetes, crea un entorno virtual de Python:

python -m venv venv

Actívalo:

Mac/Linux: source venv/bin/activate
Windows: venv\Scripts\activate Ver (venv) en tu terminal significa que estás en un entorno Python limpio, aislando las dependencias de CUA.

5. Abrir en VS Code: Lanza el proyecto en Visual Studio Code para una codificación sencilla:

code .

VS Code abre la carpeta cua, lista para scripting. Si no tienes VS Code, descárgalo de code.visualstudio.com o usa otro editor, pero la integración de Python de VS Code es excelente.

Instalando el Servidor MCP de CUA

Vamos a instalar el servidor MCP de CUA para trabajar con Claude 3.7. Usaremos un script simple para una configuración sin complicaciones, asegurando que todas las dependencias estén en su lugar.

1. Ejecutar el Script de Configuración Fácil: El repositorio de CUA proporciona una línea de comando para simplificar la instalación:

curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/mcp-server/scripts/install_mcp_server.sh | bash

Este script hace mucho trabajo pesado:

Crea el directorio ~/.cua si no existe.
Genera un script de inicio en ~/.cua/start_mcp_server.sh.
Hace que el script sea ejecutable.
Administra entornos virtuales de Python e instala/actualiza el paquete cua-mcp-server. Está diseñado para macOS y Linux, utilizando Docker para un servidor contenido. Espera que tome un minuto mientras se descargan las dependencias.

2. Instalar Dependencias de Python: Si prefieres la instalación manual o encuentras problemas, instala el servidor MCP de CUA directamente:

pip install cua-mcp-server

Esto instala:

El servidor MCP en sí.
Las dependencias del agente y la computadora de CUA (por ejemplo, para control de pantalla, automatización de teclado/mouse).
Un script ejecutable cua-mcp-server en tu PATH.

3. Verificar Docker: El servidor MCP se ejecuta en un contenedor Docker, así que asegúrate de que Docker esté activo:

docker ps

Si Docker no está en funcionamiento, inícialo a través de Docker Desktop (Mac) o sudo systemctl start docker (Linux). Esto es crucial para el entorno aislado del servidor.

Configurando el Servidor MCP de CUA para Claude Desktop

Ahora, configuremos el servidor MCP de CUA para trabajar con Claude 3.7 en Claude Desktop, configurando las claves API y las variables de entorno necesarias.

1. Obtener una Clave API de Anthropic: Regístrate en anthropic.com, navega a la sección de API y genera una clave API. Guárdala de forma segura (¡no la compartas!). Esta clave permite que Claude 3.7 se comunique con el servidor MCP de CUA.

2. Actualizar la Configuración de Claude Desktop: Agrega el servidor MCP de CUA al archivo de configuración de Claude Desktop, típicamente en ~/.config/claude-desktop/claude_desktop_config.json (Mac). Créalo si no existe:

{
  "mcpServers": {
    "cua-agent": {
      "command": "/bin/bash",
      "args": ["~/.cua/start_mcp_server.sh"],
      "env": {
        "CUA_AGENT_LOOP": "OMNI",
        "CUA_MODEL_PROVIDER": "ANTHROPIC",
        "CUA_MODEL_NAME": "claude-3-7-sonnet-20250219",
        "ANTHROPIC_API_KEY": "tu-clave-api"
      }
    }
  }
}

Reemplaza tu-clave-api con tu clave API de Anthropic. Esta configuración:

Utiliza el script de inicio del paso de instalación.
Configura el ciclo del agente en OMNI para un manejo flexible de tareas.
Especifica Claude 3.7 (claude-3-7-sonnet-20250219) como el modelo.
Pasa la clave API de forma segura. Guarda el archivo en la ubicación correcta. Para más detalles, consulta la Guía del Usuario de MCP de Anthropic.

3. Opcional: Integración con Cursor: ¿Quieres usar CUA con Cursor? Crea un archivo de configuración MCP:

Específico del proyecto: Agrega .cursor/mcp.json en tu directorio de proyecto.
Global: Agrega ~/.cursor/mcp.json en tu directorio de inicio. Usa la misma configuración de mcpServers que arriba. Luego, en el chat de Agente de Cursor, di: “Usa las herramientas de control de computadora para abrir Safari”, y CUA tomará el control. Consulta la documentación de MCP de Cursor para más información.

Probando tu Servidor MCP de CUA con Claude 3.7

¡Es hora de probar el servidor MCP de CUA haciendo que Claude 3.7 abra una terminal y liste el contenido del directorio! Crearemos un script para simular la tarea y lo ejecutaremos en VS Code.

1. Crear un Script de Prueba: En VS Code, con tu proyecto cua abierto, crea un archivo llamado test.py en la carpeta cua. Pega este código:

import os
import asyncio
from computer import Computer
from agent import ComputerAgent, LLM, AgentLoop, LLMProvider

async def run_task() -> str:
    async with Computer(verbosity='DEBUG') as computer:
        agent = ComputerAgent(
            computer=computer,
            loop=AgentLoop.OMNI,
            model=LLM(
                provider=LLMProvider.ANTHROPIC,
                model_name="claude-3-7-sonnet-20250219",
                api_key="tu-clave-api"
            )
        )
        task = "Abre una terminal y lista el contenido del directorio actual"
        async for result in agent.run(task):
            return result

async def main():
    result = await run_task()
    print("\n\nResultado:", result)

if __name__ == "__main__":
    asyncio.run(main())

Reemplaza tu-clave-api con tu clave API de Anthropic (alternativamente, establece ANTHROPIC_API_KEY como una variable de entorno en tu perfil de shell). Este script:

Inicializa una CUA Computer para la interacción con el sistema.
Configura un ComputerAgent con Claude 3.7 a través de la API de Anthropic.
Asigna a la agente abrir una terminal (por ejemplo, Terminal.app en macOS) y ejecutar ls.
Imprime el resultado, como una lista de archivos.

2. Seleccionar el Intérprete de Python en VS Code: Asegúrate de que VS Code use el entorno de Python de tu proyecto:

Presiona Ctrl + P (o Cmd + P en Mac).
Escribe > Seleccionar Intérprete de Python y presiona Enter.
Elige el intérprete de tu entorno virtual (por ejemplo, ./venv/bin/python). Esto asegura que las dependencias de CUA estén disponibles, evitando errores de “módulo no encontrado”.

3. Ejecutar el Script: Asegúrate de que Docker esté en funcionamiento y que la configuración de Claude Desktop esté establecida. Con test.py abierto, haz clic en el botón “Ejecutar” en VS Code (triángulo en la parte superior derecha) o, en la terminal (con el entorno virtual activo):

python test.py

El servidor MCP de CUA se iniciará, Claude 3.7 procesará la tarea y se abrirá una terminal, ejecutando ls. Obtuve “Resultado: cua test.py venv” en mi Mac, ¡bastante impresionante! Si falla, verifica Docker, la clave API y el puerto 11434 (si usas la caída de Ollama). Consulta ~/Library/Logs/Claude/mcp*.log (Mac) para obtener información de depuración.

4. Probar en Claude Desktop: Abre Claude Desktop, escribe: “Abre una terminal y lista el contenido del directorio actual.” Claude utilizará el servidor MCP de CUA para ejecutar la tarea, mostrando los resultados en el chat. ¡Mi prueba listó mis archivos del proyecto al instante!

Herramientas de CUA Disponibles y Uso

El servidor MCP de CUA expone dos herramientas poderosas a Claude 3.7:

run_cua_task: Ejecuta una tarea única, como “Abre Chrome y ve a github.com.”
run_multi_cua_tasks: Ejecuta múltiples tareas en secuencia, por ejemplo, “Crea una carpeta llamada ‘Proyectos’ en mi escritorio, luego ábrela.”

Puedes usar estas en Claude Desktop o Cursor pidiendo:

“Crea una carpeta llamada ‘Proyectos’ en mi escritorio.”
“Encuentra todos los PDFs en mi carpeta de Descargas.”
“Toma una captura de pantalla y resalta el mensaje de error.”

Claude automáticamente envía esto al agente de CUA, facilitando la automatización.

Mis Impresiones sobre CUA con Claude 3.7

Después de probar CUA con Claude 3.7, aquí está mi opinión:

Poder Local: Ejecutar todo en mi Mac mantiene los datos privados, sin necesidad de la nube.
Claude 3.7 Brilla: Su razonamiento hace que tareas como comandos de terminal se sientan sin esfuerzo.
Contratiempos en la Configuración: La configuración de Docker y la clave API requirió un poco de ajuste, pero el script de instalación ahorró tiempo.
Potencial Infinito: Desde abrir aplicaciones hasta gestionar archivos, CUA se siente como un superpoder.

Si encuentras problemas, verifica Docker y tu clave API, y revisa los problemas en GitHub de CUA para soluciones.

Consejos Profesionales para el Éxito de CUA

Registros de Depuración: Revisa los registros de Claude (~/Library/Logs/Claude/mcp*.log) o los registros de Docker (docker logs) para errores.
Prueba Nuevas Tareas: Pide a Claude que “Abra un navegador y vaya a github.com” o “Cree un archivo llamado hello.txt” en test.py o en la aplicación de escritorio.
Optimiza la Configuración: Establece CUA_MAX_IMAGES=5 en la configuración para mantener más capturas de pantalla en contexto para tareas como “Resaltar un error.”

Pensamientos Finales: Tu Aventura con CUA y Claude 3.7 Comienza

¡Lo has logrado! Has configurado el servidor MCP de CUA y has desatado a Claude 3.7 para controlar tu computadora. Desde abrir una terminal hasta listar archivos, has visto cómo CUA hace que la automatización se sienta como magia. Prueba tareas como lanzar aplicaciones o organizar archivos a continuación, y comparte tus éxitos. ¿Cuál es tu próximo paso? ¿Un asistente de codificación de CUA? ¿Un bot de captura de pantalla? Y para más, consulta el GitHub de CUA, y ¡feliz automatización!

button