CUA 테스트: 컴퓨터 사용 에이전트를 위한 MCP 서버에 대한 나의 의견

Young-jae

Young-jae

23 April 2025

CUA 테스트: 컴퓨터 사용 에이전트를 위한 MCP 서버에 대한 나의 의견

CUA는 컴퓨터 사용 에이전트 프레임워크와 세련된 MCP 서버인 Cua를 통해 AI 에이전트가 자연어로 macOS 또는 Linux 시스템을 제어할 수 있게 해줍니다. 저는 Apple Silicon Mac에서 CUA MCP 서버를 설정하는 데 뛰어들었고, 이건 로컬 작업 자동화에 큰 변화를 가져다주는 것임을 말씀드리고 싶습니다. 이 초보자 가이드에서는 CUA의 MCP 서버를 설치하고 테스트하는 방법을 공유할 예정이며, 재미있는 예제로는 터미널을 열고 디렉토리 내용을 나열하는 것을 보여드리겠습니다. 기술적인 스킬은 필요 없습니다—그저 호기심만 있으면 됩니다! AI를 컴퓨터의 속삭임이 되게 할 준비가 되셨나요? 시작해봅시다!

💡
아름다운 API 문서를 생성하는 훌륭한 API 테스트 도구가 필요하신가요?

개발 팀이 함께 최대의 생산성으로 작업할 수 있는 통합된 올인원 플랫폼이 필요하신가요?

Apidog는 모든 요구를 충족시켜주며, Postman을 더 저렴한 가격에 대체합니다!
button

CUA와 CUA MCP 서버란?

CUA (컴퓨터 사용 에이전트)는 AI 에이전트가 화면 제어, 키보드/마우스 자동화, macOS와 Linux의 샌드박스 가상 머신(vms)을 통해 컴퓨터와 상호작용할 수 있도록 해주는 오픈 소스 프레임워크입니다. Cua MCP 서버는 모델 컨텍스트 프로토콜(MCP) 구성 요소로, Claude Desktop이나 Cursor와 같은 AI 클라이언트가 자연어를 통해 CUA 작업을 실행할 수 있게 해주는 브리지 역할을 합니다. 시스템에 대한 원격 제어를 AI에게 제공하는 것과 같아서 클라우드 종속성 없이 안전하게 명령을 실행합니다. 우리는 이를 설정하고 간단한 작업으로 테스트할 것이며, 모든 것을 개인적이고 재미있게 유지할 것입니다. 시작해봅시다!

cua image

환경 설정: CUA 준비하기

CUA MCP 서버를 실행하기 전에 시스템을 준비합시다. 각 단계가 설명되어 있어 초보자에게 친숙합니다.

1. 사전 요구사항 확인: 다음 도구가 준비되어 있는지 확인하세요:

2. 프로젝트 폴더 만들기: 전용 폴더로 깔끔하게 유지합시다:

mkdir cua-mcp-test
cd cua-mcp-test

이 폴더는 CUA 프로젝트를 저장할 것이며, cd는 다음 단계로 전환하는 것을 도와줍니다.

3. Cua 저장소 복제: GitHub에서 CUA 소스 코드를 가져옵니다:

git clone https://github.com/trycua/cua.git
cd cua

git clone은 libs/mcp-server에 MCP 서버 코드를 포함하여 Cua 저장소를 가져옵니다. cd cua는 프로젝트 디렉토리로 이동합니다.

4. 가상 환경 설정: 패키지 충돌을 피하기 위해 Python 가상 환경을 만듭니다:

python -m venv venv

활성화합니다:

5. VS Code에서 열기: 쉽게 코딩하기 위해 Visual Studio Code에서 프로젝트를 시작합니다:

code .

VS Code는 cua 폴더를 열어 스크립팅 준비가 되어 있습니다. VS Code가 없다면 code.visualstudio.com에서 다운로드하거나 다른 편집기를 사용하세요. 하지만 VS Code의 Python 통합은 최고입니다.

CUA MCP 서버 설치

CUA MCP 서버를 Claude 3.7과 함께 작업하기 위해 설치해봅시다. 간단한 스크립트를 사용하여 수월한 설정을 보장하고, 모든 의존성이 설치되도록 합니다.

1. 간편한 설치 스크립트 실행: CUA 저장소는 설치를 간소화하는 한 줄의 코드를 제공합니다:

curl -fsSL https://raw.githubusercontent.com/trycua/cua/main/libs/mcp-server/scripts/install_mcp_server.sh | bash

이 스크립트는 많은 작업을 자동으로 처리합니다:

2. Python 의존성 설치: 수동 설치를 선호하거나 문제가 발생한 경우, CUA MCP 서버를 직접 설치합니다:

pip install cua-mcp-server

다음이 설치됩니다:

3. Docker 확인: MCP 서버는 Docker 컨테이너에서 실행되므로 Docker가 활성화되어 있는지 확인합니다:

docker ps

Docker가 실행 중이지 않으면 Docker Desktop (Mac)을 통해 시작하거나 sudo systemctl start docker (Linux) 명령어로 시작하세요. 이는 서버의 샌드박스 환경에서 매우 중요합니다.

Claude Desktop을 위한 CUA MCP 서버 구성

이제 CUA MCP 서버를 Claude 3.7(에서 작업할 수 있도록 설정하고, 필요한 API 키와 환경 변수를 설정합니다. Claude Desktop와 함께하겠습니다.

claude desktop

1. Anthropic API 키 받기: anthropic.com에 가입하고 API 섹션으로 이동하여 API 키를 생성합니다. 안전하게 저장하세요 (공유하지 마세요!). 이 키는 Claude 3.7이 CUA MCP 서버와 통신할 수 있게 해줍니다.

2. Claude Desktop 구성 업데이트: Claude Desktop의 config 파일에 CUA MCP 서버를 추가하는데, 일반적으로 ~/.config/claude-desktop/claude_desktop_config.json에 위치합니다 (Mac). 존재하지 않는 경우 생성합니다:

{
  "mcpServers": {
    "cua-agent": {
      "command": "/bin/bash",
      "args": ["~/.cua/start_mcp_server.sh"],
      "env": {
        "CUA_AGENT_LOOP": "OMNI",
        "CUA_MODEL_PROVIDER": "ANTHROPIC",
        "CUA_MODEL_NAME": "claude-3-7-sonnet-20250219",
        "ANTHROPIC_API_KEY": "your-api-key"
      }
    }
  }
}

your-api-key를 자신의 Anthropic API 키로 대체하세요. 이 구성은:

3. 선택 사항: Cursor 통합: CUA를 Cursor와 함께 사용하고 싶으신가요? MCP 구성 파일을 생성합니다:

Claude 3.7으로 CUA MCP 서버 테스트하기

이제 CUA MCP 서버를 테스트할 차례입니다. Claude 3.7이 터미널을 열고 디렉토리 내용을 나열하게 해볼 것입니다! 스크립트를 만들어서 이 작업을 시뮬레이션하고, VS Code에서 실행하겠습니다.

1. 테스트 스크립트 만들기: VS Code에서 cua 프로젝트를 열고, cua 폴더에 test.py라는 이름의 파일을 만듭니다. 아래 코드를 붙여넣습니다:

import os
import asyncio
from computer import Computer
from agent import ComputerAgent, LLM, AgentLoop, LLMProvider

async def run_task() -> str:
    async with Computer(verbosity='DEBUG') as computer:
        agent = ComputerAgent(
            computer=computer,
            loop=AgentLoop.OMNI,
            model=LLM(
                provider=LLMProvider.ANTHROPIC,
                model_name="claude-3-7-sonnet-20250219",
                api_key="your-api-key"
            )
        )
        task = "Open a terminal and list the contents of the current directory"
        async for result in agent.run(task):
            return result

async def main():
    result = await run_task()
    print("\n\nResult:", result)

if __name__ == "__main__":
    asyncio.run(main())

your-api-key를 자신의 Anthropic API 키로 대체하세요 (대안으로, 쉘 프로필에서 ANTHROPIC_API_KEY를 환경 변수로 설정할 수도 있습니다). 이 스크립트는:

2. VS Code에서 Python 인터프리터 선택: VS Code가 프로젝트의 Python 환경을 사용하도록 합니다:

3. 스크립트 실행: Docker가 실행 중인지 확인하고 Claude Desktop 구성도 설정되어 있는지 확인합니다. test.py 파일을 열면, VS Code의 “실행” 버튼 (상단 오른쪽 삼각형)을 클릭하거나 터미널에서 (가상 환경이 활성화된 상태에서):

python test.py

CUA MCP 서버가 시작되면 Claude 3.7이 작업을 처리하고 터미널이 열려 ls를 실행합니다. 제 Mac에서는 “결과: cua test.py venv”가 출력되었습니다—꽤 멋지죠! 만약 실패한다면 Docker, API 키 및 포트 11434 (Ollama 대체 사용 시)를 확인하세요. ~/Library/Logs/Claude/mcp*.log (Mac)에서 디버그 정보를 체크하세요.

4. Claude Desktop에서 테스트: Claude Desktop을 열고, “터미널을 열고 현재 디렉토리 내용을 나열하라.”라고 입력하세요. Claude는 CUA MCP 서버를 사용하여 작업을 실행하고 결과를 채팅창에 표시합니다. 제 테스트는 프로젝트 파일을 즉시 나열했습니다!

cua result output

사용 가능한 CUA 도구 및 사용법

CUA MCP 서버는 Claude 3.7에 두 가지 강력한 도구를 제공합니다:

위의 질문 형태로 Claude Desktop이나 Cursor에서 사용할 수 있습니다:

Claude는 자동으로 이러한 작업을 CUA 에이전트에 전달하여 자동화를 쉽게 만듭니다.

Claude 3.7과 함께한 CUA에 대한 제 생각

CUA와 Claude 3.7을 테스트한 후, 저의 느낌은 다음과 같습니다:

문제가 발생한다면 Docker와 API 키를 다시 확인하고, CUA GitHub의 문제를 스킴해보세요.

CUA 성공을 위한 전문가 팁

최종 생각: 귀하의 CUA와 Claude 3.7 모험이 시작됩니다

당신은 해냈습니다—CUA MCP 서버를 설정하고 Claude 3.7을 컴퓨터를 제어하도록 해방했습니다! 터미널을 열고 파일을 나열하는 것에서부터 CUA가 어떻게 자동화가 마치 마법 같은 느낌을 주는지 보셨습니다. 다음에는 앱을 실행하거나 파일을 정리하는 작업을 시도해보고, 성공 사례를 공유해보세요. 다음 계획은 무엇인가요? CUA 코딩 어시스턴트? 스크린샷 봇? 그리고 더 많은 정보를 원하신다면 CUA GitHub를 확인하세요. 행복한 자동화 되세요!

button
apidog

Apidog에서 API 설계-첫 번째 연습

API를 더 쉽게 구축하고 사용하는 방법을 발견하세요