Pruebas de CUA: el servidor MCP para agentes de uso informático, aquí están mis opiniones

Daniel Costa

Daniel Costa

23 April 2025

Pruebas de CUA: el servidor MCP para agentes de uso informático, aquí están mis opiniones

CUA, el marco de agente de uso de computadora, y su elegante servidor MCP, Cua, permiten a los agentes de IA controlar tu sistema macOS o Linux con lenguaje natural. Me sumergí en la configuración del servidor MCP de CUA en mi Mac con Apple Silicon, y déjame decirte: ¡es un cambio radical para automatizar tareas localmente! En esta guía para principiantes, compartiré mis impresiones sobre la instalación y prueba del servidor MCP de CUA, con un ejemplo divertido: hacer que abra una terminal y liste el contenido del directorio. No se requieren habilidades técnicas, ¡solo un poco de curiosidad! ¿Listo para convertir tu IA en un susurrador de computadoras? ¡Vamos a ello!

💡
¿Quieres una gran herramienta de prueba de API que genere documentación de API hermosa?

¿Quieres una plataforma integrada, todo en uno, para que tu equipo de desarrolladores trabaje junto con máxima productividad?

Apidog satisface todas tus demandas y reemplaza a Postman a un precio mucho más asequible!
button

¿Qué es Cua y el Servidor MCP de CUA?

CUA (Agente de Uso de Computadora) es un marco de código abierto que permite a los agentes de IA interactuar con tu computadora; piensa en el control de pantalla, la automatización del teclado y el mouse, y las máquinas virtuales en entornos aislados (VMs) en macOS y Linux, especialmente en Apple Silicon. El servidor MCP de Cua es su componente de Protocolo de Contexto de Modelo (MCP), actuando como un puente para permitir que clientes de IA como Claude Desktop o Cursor ejecuten tareas de CUA a través de lenguaje natural. Es como darle a tu IA un control remoto para tu sistema, ejecutando comandos de manera segura sin depender de la nube. Lo configuraremos y lo probaremos con una tarea simple, todo mientras mantenemos las cosas privadas y divertidas. ¡Vamos a sumergirnos!

imagen de cua

Configurando tu Entorno: Preparándose para CUA

Antes de lanzar el servidor MCP de CUA, preparemos tu sistema. Esto es amigable para principiantes, con cada paso explicado para mantenerte informado.

1. Verificar Requisitos Previos: Asegúrate de tener estas herramientas listas:

2. Crear una Carpeta de Proyecto: Mantengamos las cosas organizadas con una carpeta dedicada:

mkdir cua-mcp-test
cd cua-mcp-test

Esta carpeta contendrá tu proyecto de CUA, y cd te prepara para los siguientes pasos.

3. Clonar el Repositorio de Cua: Obtén el código fuente de CUA de GitHub:

git clone https://github.com/trycua/cua.git
cd cua

El comando git clone obtiene el repositorio de Cua, incluyendo el código del servidor MCP en libs/mcp-server. El cd cua te lleva al directorio del proyecto.

4. Configurar un Entorno Virtual: Para prevenir conflictos de paquetes, crea un entorno virtual de Python:

python -m venv venv

Actívalo:

5. Abrir en VS Code: Lanza el proyecto en Visual Studio Code para una codificación sencilla:

code .

VS Code abre la carpeta cua, lista para scripting. Si no tienes VS Code, descárgalo de code.visualstudio.com o usa otro editor, pero la integración de Python de VS Code es excelente.

Instalando el Servidor MCP de CUA

Vamos a instalar el servidor MCP de CUA para trabajar con Claude 3.7. Usaremos un script simple para una configuración sin complicaciones, asegurando que todas las dependencias estén en su lugar.

1. Ejecutar el Script de Configuración Fácil: El repositorio de CUA proporciona una línea de comando para simplificar la instalación:

curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/mcp-server/scripts/install_mcp_server.sh | bash

Este script hace mucho trabajo pesado:

2. Instalar Dependencias de Python: Si prefieres la instalación manual o encuentras problemas, instala el servidor MCP de CUA directamente:

pip install cua-mcp-server

Esto instala:

3. Verificar Docker: El servidor MCP se ejecuta en un contenedor Docker, así que asegúrate de que Docker esté activo:

docker ps

Si Docker no está en funcionamiento, inícialo a través de Docker Desktop (Mac) o sudo systemctl start docker (Linux). Esto es crucial para el entorno aislado del servidor.

Configurando el Servidor MCP de CUA para Claude Desktop

Ahora, configuremos el servidor MCP de CUA para trabajar con Claude 3.7 en Claude Desktop, configurando las claves API y las variables de entorno necesarias.

claude desktop

1. Obtener una Clave API de Anthropic: Regístrate en anthropic.com, navega a la sección de API y genera una clave API. Guárdala de forma segura (¡no la compartas!). Esta clave permite que Claude 3.7 se comunique con el servidor MCP de CUA.

2. Actualizar la Configuración de Claude Desktop: Agrega el servidor MCP de CUA al archivo de configuración de Claude Desktop, típicamente en ~/.config/claude-desktop/claude_desktop_config.json (Mac). Créalo si no existe:

{
  "mcpServers": {
    "cua-agent": {
      "command": "/bin/bash",
      "args": ["~/.cua/start_mcp_server.sh"],
      "env": {
        "CUA_AGENT_LOOP": "OMNI",
        "CUA_MODEL_PROVIDER": "ANTHROPIC",
        "CUA_MODEL_NAME": "claude-3-7-sonnet-20250219",
        "ANTHROPIC_API_KEY": "tu-clave-api"
      }
    }
  }
}

Reemplaza tu-clave-api con tu clave API de Anthropic. Esta configuración:

3. Opcional: Integración con Cursor: ¿Quieres usar CUA con Cursor? Crea un archivo de configuración MCP:

Probando tu Servidor MCP de CUA con Claude 3.7

¡Es hora de probar el servidor MCP de CUA haciendo que Claude 3.7 abra una terminal y liste el contenido del directorio! Crearemos un script para simular la tarea y lo ejecutaremos en VS Code.

1. Crear un Script de Prueba: En VS Code, con tu proyecto cua abierto, crea un archivo llamado test.py en la carpeta cua. Pega este código:

import os
import asyncio
from computer import Computer
from agent import ComputerAgent, LLM, AgentLoop, LLMProvider

async def run_task() -> str:
    async with Computer(verbosity='DEBUG') as computer:
        agent = ComputerAgent(
            computer=computer,
            loop=AgentLoop.OMNI,
            model=LLM(
                provider=LLMProvider.ANTHROPIC,
                model_name="claude-3-7-sonnet-20250219",
                api_key="tu-clave-api"
            )
        )
        task = "Abre una terminal y lista el contenido del directorio actual"
        async for result in agent.run(task):
            return result

async def main():
    result = await run_task()
    print("\n\nResultado:", result)

if __name__ == "__main__":
    asyncio.run(main())

Reemplaza tu-clave-api con tu clave API de Anthropic (alternativamente, establece ANTHROPIC_API_KEY como una variable de entorno en tu perfil de shell). Este script:

2. Seleccionar el Intérprete de Python en VS Code: Asegúrate de que VS Code use el entorno de Python de tu proyecto:

3. Ejecutar el Script: Asegúrate de que Docker esté en funcionamiento y que la configuración de Claude Desktop esté establecida. Con test.py abierto, haz clic en el botón “Ejecutar” en VS Code (triángulo en la parte superior derecha) o, en la terminal (con el entorno virtual activo):

python test.py

El servidor MCP de CUA se iniciará, Claude 3.7 procesará la tarea y se abrirá una terminal, ejecutando ls. Obtuve “Resultado: cua test.py venv” en mi Mac, ¡bastante impresionante! Si falla, verifica Docker, la clave API y el puerto 11434 (si usas la caída de Ollama). Consulta ~/Library/Logs/Claude/mcp*.log (Mac) para obtener información de depuración.

4. Probar en Claude Desktop: Abre Claude Desktop, escribe: “Abre una terminal y lista el contenido del directorio actual.” Claude utilizará el servidor MCP de CUA para ejecutar la tarea, mostrando los resultados en el chat. ¡Mi prueba listó mis archivos del proyecto al instante!

salida del resultado de cua

Herramientas de CUA Disponibles y Uso

El servidor MCP de CUA expone dos herramientas poderosas a Claude 3.7:

Puedes usar estas en Claude Desktop o Cursor pidiendo:

Claude automáticamente envía esto al agente de CUA, facilitando la automatización.

Mis Impresiones sobre CUA con Claude 3.7

Después de probar CUA con Claude 3.7, aquí está mi opinión:

Si encuentras problemas, verifica Docker y tu clave API, y revisa los problemas en GitHub de CUA para soluciones.

Consejos Profesionales para el Éxito de CUA

Pensamientos Finales: Tu Aventura con CUA y Claude 3.7 Comienza

¡Lo has logrado! Has configurado el servidor MCP de CUA y has desatado a Claude 3.7 para controlar tu computadora. Desde abrir una terminal hasta listar archivos, has visto cómo CUA hace que la automatización se sienta como magia. Prueba tareas como lanzar aplicaciones o organizar archivos a continuación, y comparte tus éxitos. ¿Cuál es tu próximo paso? ¿Un asistente de codificación de CUA? ¿Un bot de captura de pantalla? Y para más, consulta el GitHub de CUA, y ¡feliz automatización!

button
apidog

Practica el diseño de API en Apidog

Descubre una forma más fácil de construir y usar APIs