Cursor는 2026년 5월 18일에 Composer 2.5를 출시했으며, 헤드라인은 무시하기 어렵습니다. 실제 소프트웨어 벤치마크에서 Opus 4.7 및 GPT-5.5와 동등한 코딩 모델이 작업당 1달러 미만의 비용으로 제공됩니다. 코딩을 직업으로 하는 경우, 이 가격 대비 품질 비율은 하루를 계획하는 방식을 바꿀 것입니다.
이 가이드는 개발자들이 계속 찾는 세 가지를 다룹니다. Composer 2.5가 실제로 무엇인지, Cursor 내에서 Composer 2.5에 액세스하는 방법, 그리고 프로덕션 작업에서 Composer 2.5를 잘 활용하는 방법입니다. 벤치마크 수치, 가격 책정 계산, 그리고 모델을 Apidog와 페어링하여 API 코드를 첫 실행에 정확하게 작성할 수 있도록 하는 실용적인 워크플로우를 얻을 수 있습니다.
Cursor Composer 2.5는 무엇인가요?
Composer 2.5는 Cursor 자체의 에이전틱 코딩 모델로, Cursor 편집기 내에서 계획을 세우고, 파일을 편집하고, 터미널 명령을 실행하며, 자체 작업을 검증하도록 구축되었습니다. Composer 2의 후속 모델이며, 모델을 "빠른 자동 완성 파트너"에서 "긴 작업을 흐름을 놓치지 않고 완료하는 에이전트"로 전환시킵니다.

다음과 같은 몇 가지 사실로 정의됩니다:
- 약 1조 개의 매개변수로 구성된 오픈 소스 Moonshot Kimi K2.5 체크포인트를 기반으로 구축되었습니다.
- Cursor는 기본 모델뿐만 아니라 학습 컴퓨팅 예산의 약 85%를 후처리 학습 및 강화 학습에 투입했습니다.
- Composer 2보다 25배 더 많은 합성 작업을 학습했으며, Cursor가 기능을 삭제하고 모델이 테스트를 통과할 때까지 재구축해야 하는 연습도 포함됩니다.
실질적인 결과는 긴 세션 동안 컨텍스트를 유지하는 모델입니다. Composer 2는 빨랐지만 다단계 작업에서 때때로 방향을 잃었습니다. Composer 2.5는 긴 작업 전반에 걸쳐 노력을 지속하고, 복잡한 지시를 더 안정적으로 따르며, 요청이 실제로 필요로 하는 작업량을 과도하거나 부족하지 않게 조절합니다.
모델 제품군에 대한 더 심층적인 배경 지식을 원하시면, Composer 2 가이드에서 2.5가 기반으로 하는 아키텍처를 설명합니다.
내부적으로 변경된 사항
세 가지 학습 아이디어가 도약을 이끌었습니다:
- 텍스트 피드백을 통한 타겟팅 RL. 작업 끝에 하나의 보상을 주는 대신, Cursor는 원하는 수정 사항을 설명하는 짧은 힌트를 작성하고, 그 힌트를 로컬 컨텍스트에 넣고, 그 동작을 모델에 다시 주입합니다. 모델이 사용 불가능한 도구를 호출하는 것을 멈추는 방법을 배운 것이 바로 이 방식입니다.
- 대규모 합성 데이터. 합성 작업이 25배 증가하여 모델이 분위기가 아닌 테스트로 검증된 실제 리포지토리 작업에 대해 훨씬 더 많은 연습을 할 수 있게 합니다.
- 듀얼 메시 HSDP를 사용하는 샤딩된 뮤온(Muon) 최적화 도구. 이것은 여러분이 직접 다루는 기능이 아니라 학습 인프라입니다. 하지만 Cursor가 0.2초의 최적화 도구 단계로 1조 개의 매개변수 모델을 학습시킬 수 있었던 이유입니다. 더 빠른 학습 루프는 품질에 대한 더 많은 반복을 의미합니다.
모델을 사용하기 위해 이 모든 것을 외울 필요는 없습니다. 이는 Composer 2.5가 이전 에이전트를 망가뜨렸던 길고 복잡한 작업에서 왜 더 안정적으로 느껴지는지 설명하기 때문에 중요합니다.
Composer 2.5 벤치마크: 실제 성능은 얼마나 좋은가요?
Cursor는 세 가지 스위트에서 점수를 보고하고 이를 Opus 4.7 및 GPT-5.5와 비교합니다. 다음은 그 결과입니다:
| 벤치마크 | Composer 2.5 | Opus 4.7 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Multilingual | 79.8% | 80.5% | 77.8% |
| Terminal-Bench 2.0 | 69.3% | 69.4% | 82.7% |
| CursorBench v3.1 | 63.2% | 64.8% (최대) / 61.6% (기본) | 59.2% (기본) |
자세히 살펴보면 일관된 결과를 알 수 있습니다. 언어 간 실제 GitHub 문제를 해결하는 표준 테스트인 SWE-bench Multilingual에서 Composer 2.5는 79.8%를 기록하여 Opus 4.7에 1점 이내로 근접하고 GPT-5.5를 앞섰습니다. 이는 Composer 2의 73.7%에서 크게 개선된 것입니다. Cursor 자체의 작업 스위트인 CursorBench에서는 Opus 4.7의 기본 설정을 넘어섰습니다.
유일하게 뒤처지는 부분은 Terminal-Bench 2.0으로, GPT-5.5가 82.7%로 선두를 달립니다. 긴 터미널 시퀀스 작업이 많은 경우 이 점을 명심하십시오.
모든 것을 재구성하는 숫자는 작업당 비용입니다. Cursor는 CursorBench에서 평균 작업당 1달러 미만의 비용으로 약 63%를 보고하는 반면, Opus 4.7 및 GPT-5.5는 비슷하거나 더 낮은 결과에 대해 작업당 수 달러가 듭니다. 일부 비교에서는 경쟁사 비용이 11달러에 달하기도 합니다. The Decoder의 독립적인 보도에서도 동일한 결론에 도달했습니다: 최첨단에 가까운 품질을 훨씬 저렴한 가격에 제공합니다.
따라서 Composer 2.5가 모든 차트에서 단연코 최고의 모델은 아닙니다. 하지만 최첨단 품질의 95%를 약 10분의 1 비용으로 얻을 수 있는 모델이며, 이는 대부분의 팀이 원하는 절충안입니다.
Composer 2.5는 얼마인가요?
Cursor는 두 가지 가격대로 두 가지 변형을 제공합니다:
| 변형 | 입력 | 출력 | 사용 시기 |
|---|---|---|---|
| 표준 | $0.50 / M 토큰 | $2.50 / M 토큰 | 대부분의 에이전트 작업에 기본; 최고의 비용 효율성 |
| 고속 | $3.00 / M 토큰 | $15.00 / M 토큰 | 지연 시간에 민감한 작업; 동일한 지능, 더 짧은 대기 시간 |
고속 변형은 더 낮은 지연 시간으로 동일한 모델 품질을 제공하며, 제품의 기본 설정입니다. 다른 최첨단 모델의 고속 티어보다 여전히 저렴한 가격입니다.

청구 방식은 플랜에 따라 다릅니다:
- 개인 플랜 (Pro 및 유사 플랜)에는 충분한 사용량이 포함된 독립적인 Composer 사용 풀이 있어, 대부분의 개인 개발자는 일상적으로 토큰당 요금에 도달하지 않을 것입니다.
- 팀 및 기업 플랜은 API 요율로 직접 청구됩니다.
- 출시 프로모션: Cursor는 출시 후 첫 주 동안 Composer 2.5 사용량을 두 배로 늘려, 얼리 어답터들이 테스트할 수 있는 추가 시간을 제공했습니다.
Cursor가 모델 사용량을 측정하는 방식에 대한 더 자세한 내용은 Cursor Composer 가격 책정 가이드를 참조하십시오. 비용을 들이지 않고 실행하려는 경우, 무료 Composer 가이드에서 포함된 사용량 경로를 다룹니다.
Cursor Composer 2.5에 액세스하는 방법
모델에 액세스하는 데 약 1분 정도 걸립니다.
- Cursor 업데이트. Composer 2.5는 최신 빌드가 필요합니다. Cursor를 열고, 업데이트를 확인하고(macOS에서는 Cursor 메뉴, 다른 곳에서는 도움말 메뉴), 업데이트가 설치되면 다시 시작하십시오.
- 포함된 플랜으로 로그인하십시오. Pro 및 Business 플랜에는 Composer 사용이 포함됩니다. 무료 계정도 포함된 허용량을 통해 시도할 수 있지만, 많은 사용량에는 유료 플랜이 필요합니다.
- 모델 선택기를 여십시오. 채팅 또는 에이전트 세션을 시작한 다음, 모델 드롭다운을 엽니다.
composer-2.5를 선택하십시오. 일반적으로 고속 변형이 기본적으로 선택되어 있을 것입니다. - 에이전트 모드를 확인하십시오. Composer는 에이전트 작업을 위해 구축되었으므로, 파일 편집, 터미널 액세스 및 도구 사용을 위해 일반 채팅보다는 에이전트 모드를 사용하십시오.
이것이 전체 설정입니다. 이 모델은 Cursor가 노출하는 모든 에이전트 도구에 액세스할 수 있습니다: 파일 읽기 및 편집, 터미널 명령 실행, 도구 호출. Cursor가 변경하는 경우 공식 Composer 2.5 모델 문서에 현재 기본값이 나열되어 있습니다.
이전에 Cursor를 사용했지만 에이전트를 사용해본 적이 없다면, Cursor 2.0 개요가 에이전트 인터페이스 작동 방식에 대한 좋은 입문서가 될 것입니다.
Composer 2.5를 효과적으로 사용하는 방법
액세스는 쉽습니다. 강력한 출력을 얻으려면 약간의 기술이 필요합니다.
- 긴 작업을 실행하게 하세요. Composer 2.5의 주요 개선 사항은 지속적인 성능입니다. 한 줄씩 세밀하게 관리하는 대신 명확한 최종 상태를 가진 실제 작업("주문 엔드포인트에 페이지 매김을 추가하고 테스트를 업데이트")을 제공하십시오. 이 모델은 테스트가 통과할 때까지 계속 작업하도록 훈련되었습니다.
- 프롬프트에 성공 조건을 작성하세요. 이 모델은 테스트 검증에 맞춰 훈련되었습니다. 작업 완료를 어떻게 판단할지 ("모든 기존 테스트가 통과하고 새 엔드포인트가 유효하지 않은 입력에 대해 422를 반환") 알려주면, 모델은 그 목표를 향해 자체적으로 수정합니다.
- 올바른 변형을 선택하세요. 비용에 민감한 배치 작업에는 표준 변형을 사용하고, 실시간으로 반복하고 각 응답을 기다릴 때는 고속 변형을 사용하세요. 품질은 동일하며, 지연 시간과 비용을 맞바꾸는 것입니다.
- 컨텍스트를 정직하게 유지하세요. 에이전트 모델은 강력하지만, API의 실제 형태를 모를 때는 여전히 추측합니다. 이는 해결해야 할 실패 모드이며, API 툴링이 중요한 부분입니다.
Composer 2.5와 API 워크플로우
대부분의 실제 코딩 작업은 API와 관련됩니다. Composer 2.5에게 "결제 서비스를 위한 클라이언트를 작성해줘"라고 요청하면 깔끔한 코드를 생성할 것입니다. 문제는 엔드포인트, 필드 및 인증이 서비스가 실제로 노출하는 것이 아니라 모델이 가정하는 것과 일치할 수 있다는 것입니다. 틀렸지만 자신감 있는 코드는 코드 없는 것보다 느립니다.
두 가지 방법을 통해 이를 해결할 수 있습니다:
첫째, 모델이 추측하게 하는 대신 실제 API 사양을 제공하십시오. Apidog MCP 서버는 Apidog API 사양을 Cursor에 직접 연결하여 Composer 2.5가 실제 스키마에 따라 요청 코드, 유형 및 테스트를 생성하도록 합니다. 다른 에이전트도 실행하는 경우, Cursor를 위한 최고의 MCP 서버 개요에서 보완적인 옵션을 다룹니다.
둘째, 생성된 호출이 팀원의 브랜치에 도달하기 전에 검증하십시오. Composer 2.5가 작성한 엔드포인트를 Apidog에 넣어 실제 요청을 보내고, 상태 코드와 응답 형태를 확인한 다음, 작동하는 호출을 자동화된 테스트 및 목(mock) 서버로 전환하십시오. 모델이 초안을 작성하면 Apidog가 작동을 확인합니다. 실제 사양에 대해 생성하고 실제 서버에 대해 테스트하는 이러한 루프는 에이전트 속도가 디버깅 부채로 변하는 것을 방지합니다.
Composer 2.5 대 경쟁 모델
일상적인 도구를 선택하는 경우를 위한 빠른 안내:
- Opus 4.7 대비: SWE-bench Multilingual 및 CursorBench에서 거의 동일한 성능을 보이며, 작업당 비용이 훨씬 저렴합니다. Opus는 CursorBench의 최대 설정에서 여전히 선두를 달립니다.
- GPT-5.5 대비: Composer 2.5는 SWE-bench Multilingual 및 CursorBench에서 우위를 차지하며, GPT-5.5는 Terminal-Bench 2.0에서 명확한 선두를 달립니다.
- Claude Code 대비: 도구의 형태가 다릅니다. Composer 2.5는 Cursor 편집기 내에서 작동하고, Claude Code는 터미널 에이전트입니다. Claude Code 대 Cursor 비교는 어떤 워크플로우에 어떤 모델이 더 적합한지 분석합니다.
- GitHub Copilot 대비: Copilot은 인라인 자동 완성 기능이 가장 강력하며, Composer 2.5는 다중 파일 에이전트 작업을 위해 구축되었습니다. Cursor 대 GitHub Copilot 가이드에서 더 자세히 다룹니다.
Cursor는 또한 xAI와 함께 약 10배 더 많은 컴퓨팅을 사용하여 훨씬 더 큰 모델을 훈련하고 있다고 밝혔습니다. 따라서 2.5는 가파른 곡선 위에 있는 체크포인트이며, 한계가 아닙니다.
자주 묻는 질문
- Composer 2.5는 무료인가요? 완전 무료 티어는 없지만, 개인 플랜에는 일반적인 일상 작업을 감당할 수 있는 Composer 사용 풀이 포함되어 있으며, Cursor는 출시 주간에 사용량을 두 배로 늘렸습니다. 무료 Composer 가이드에서 포함된 허용량이 얼마나 되는지 설명합니다.
- Composer 2.5는 Composer 2보다 좋은가요? 네, 측정 가능하게 더 좋습니다. SWE-bench Multilingual은 73.7%에서 79.8%로 상승했으며, 이 모델은 긴 작업에서 컨텍스트를 훨씬 더 잘 유지합니다. Composer 2 가이드는 개선된 기본선입니다.
- Composer 2.5는 어떤 모델을 기반으로 하나요? Moonshot의 오픈 소스 Kimi K2.5 체크포인트를 기반으로 구축되었으며, 이후 Cursor가 강화 학습 및 합성 작업을 통해 집중적으로 후처리 학습했습니다.
- 표준 또는 고속 중 어떤 변형을 선택해야 하나요? 동일한 지능, 다른 지연 시간 및 가격. 비용 효율적인 배치 작업에는 표준을 사용하고, 실시간으로 반복할 때는 고속을 사용하십시오.
- Composer 2.5는 API 사양 및 MCP와 함께 작동하나요? 네. MCP를 포함하여 Cursor의 모든 에이전트 도구 세트를 지원합니다. Apidog MCP 서버를 통해 API 사양을 연결하면 실제 스키마에 따라 코드를 작성할 수 있습니다.
결론
Composer 2.5는 "최첨단 품질 코딩"과 "고비용"이 분리되고 있음을 보여주는 가장 명확한 신호입니다. 에이전트 작업을 위해 구축된 편집기 내에서 작업당 1달러 미만의 비용으로 실제 소프트웨어 작업에서 Opus 4.7 수준의 결과를 얻을 수 있습니다. Cursor를 업데이트하고, 모델 드롭다운에서 composer-2.5를 선택한 다음, 한 줄짜리 작업 대신 실제 다단계 작업을 제공하십시오.
엄격한 검증 루프와 함께 사용하면 속도가 실제로 배가됩니다. 실제 사양에 따라 API 코드를 생성한 다음, Apidog를 다운로드하여 실시간 요청을 보내고, 응답을 확인하며, 작동하는 호출을 자동화된 테스트 및 목(mock)으로 고정하십시오. 검증된 빠른 코드는 디버깅해야 하는 빠른 코드보다 낫습니다.
