Cursor에서 DeepSeek V4-Pro 사용하는 방법: 추론 프록시 설정 가이드 (2026)

Ashley Innocent

Ashley Innocent

25 May 2026

Cursor에서 DeepSeek V4-Pro 사용하는 방법: 추론 프록시 설정 가이드 (2026)

Apidog 엔터프라이즈

온프레미스 배포

SSO & RBAC

SOC 2 준수

Apidog Enterprise 살펴보기

기본 OpenAI 호환 설정으로 DeepSeek V4-Pro를 Cursor에 연결하면 첫 번째 도구 호출에서 400 오류가 발생합니다. 이유는 사소하지만 고질적입니다. V4-Pro는 `reasoning_content` 블록을 반환하는 사고 모델인데, Cursor는 후속 요청에서 해당 필드를 제거하고, DeepSeek API는 사고 체인이 누락된 도구 호출 메시지를 거부하기 때문입니다. yxlao/deepseek-cursor-proxy의 오픈 소스 프록시는 사고 콘텐츠를 캐시하고 외부 요청 시 다시 삽입합니다. 프록시가 실행되면 V4-Pro는 Cursor의 사용자 지정 모델 패널에서 접을 수 있는 마크다운으로 렌더링되는 사고 토큰과 함께 다른 모델처럼 작동합니다. 아래는 전체 설정, 비용 계산 및 문제 해결 목록입니다.

요약 (TL;DR)

애초에 프록시가 필요한 이유

V4-Pro는 모든 응답에서 두 가지를 반환합니다. 일반적인 content 필드와 사고 과정을 담는 reasoning_content 필드입니다. 일반적인 채팅에서는 reasoning_content를 무시할 수 있습니다. 문제는 도구 호출에서 시작됩니다.

사고 모델에 대한 DeepSeek의 API 계약은 reasoning_content 블록이 포함된 대화를 계속할 때, 다음 요청에 tool_calls 결과와 함께 해당 블록을 포함해야 한다고 요구합니다. 사고 체인은 대화 상태의 일부입니다. Cursor는 이 요구 사항을 알지 못합니다. Cursor는 OpenAI 스타일의 채팅 클라이언트를 제공하며, reasoning_content는 OpenAI 스키마의 일부가 아니므로 해당 필드를 제거합니다. 다음 도구 호출은 HTTP 400 오류와 함께 reasoning_content 누락에 대한 메시지를 반환합니다.

이것은 정확히 Cursor의 버그는 아닙니다. API 표면의 대부분을 공유하는 두 제공자 간의 계약 불일치입니다. Cursor가 V4-Pro에 대한 일등 지원을 추가하거나 DeepSeek이 계약을 완화할 때까지, 해결책은 Cursor가 잊어버린 것을 기억하는 프록시입니다.

프록시의 기능, 세 줄 요약

또한 Cursor의 사용자 지정 모델 설정이 HTTPS를 요구하고 localhost URL을 허용하지 않기 때문에 ngrok 터널을 통해 로컬 포트를 노출합니다.

캐시는 ~/.deepseek-cursor-proxy/reasoning_content.sqlite3에 저장됩니다. SHA-256 키 지정은 두 개의 병렬 대화가 충돌하지 않음을 의미합니다. 사고 콘텐츠는 DeepSeek이 반환한 그대로 저장되므로 DeepSeek 자체의 프롬프트 캐시가 여전히 적중하며, 이는 새로운 영구 가격 책정에 중요합니다.

사전 요구 사항

시작하기 전에 네 가지가 필요합니다.

uv를 설치해 본 적이 없다면 공식 uv 설치 문서를 참조하세요. ngrok의 경우 ngrok 퀵스타트가 인증 토큰 단계를 안내합니다.

1단계: 프록시 설치

가장 빠른 방법은 uv를 사용하는 것입니다. 아무 디렉토리에서나 다음을 실행하세요.

uv tool install deepseek-cursor-proxy

pip를 선호하는 경우, 저장소를 복제하고 편집 가능한 패키지로 설치하세요.

git clone https://github.com/yxlao/deepseek-cursor-proxy.git
cd deepseek-cursor-proxy
pip install -e .

어떤 방법을 사용하든 deepseek-cursor-proxy 명령이 PATH에 추가됩니다. deepseek-cursor-proxy --help로 확인하세요.

2단계: ngrok 설정

Cursor의 사용자 지정 모델 필드는 http://localhost를 허용하지 않으므로 프록시는 공개 HTTPS URL이 필요합니다. ngrok이 터널을 제공합니다.

ngrok config add-authtoken YOUR_NGROK_AUTHTOKEN

가입 후 ngrok 대시보드에서 인증 토큰을 가져오세요. 무료 계층은 다시 시작할 때마다 무작위 서브도메인을 제공합니다. 이것이 문제라면 대시보드에서 예약 도메인을 신청하고 --ngrok-url https://your-reserved.ngrok-free.app를 사용하여 프록시에 전달하세요.

3단계: 프록시 시작

대부분의 설정에는 기본값이 적합합니다.

deepseek-cursor-proxy

첫 실행 시 프록시는 ~/.deepseek-cursor-proxy/config.yaml을 생성하고, 터널을 열고, 공개 URL을 출력합니다. 출력은 다음과 같습니다.

Starting deepseek-cursor-proxy
Tunnel: https://random-name.ngrok-free.app
Local:  http://127.0.0.1:9000
Cache:  /Users/you/.deepseek-cursor-proxy/reasoning_content.sqlite3

유용한 플래그:

프록시를 별도의 터미널에서 계속 실행하거나, macOS에서는 launchctl 작업으로 묶으세요. Cursor는 모든 요청에서 프록시와 통신합니다.

4단계: Cursor 설정

Cursor 설정을 열고, '모델'로 이동하여 사용자 지정 모델을 추가하세요. 필요한 필드는 다음과 같습니다.

Cursor는 "모델 확인" 검사를 실행합니다. 이 검사는 단일 채팅 완성을 보냅니다. 녹색 체크 표시는 완료되었음을 의미합니다. 연결 오류는 일반적으로 ngrok URL을 나타냅니다. 프록시 출력에서 다시 복사하고 /v1로 끝나는지 확인하세요.

5단계: 모델 선택 및 도구 호출 시도

채팅 패널에서 모델 선택기를 열고 새 사용자 지정 모델을 선택하세요. 원래 400 오류가 발생했던 곳이 도구 호출이므로, 도구 사용을 강제하는 프롬프트를 먼저 시도해 보세요.

“이 저장소의 README를 열고 모든 코드 블록을 나열한 다음, 어떤 코드 블록에 언어 힌트가 누락되어 있는지 알려주세요.”

Cursor는 read_file 도구 호출을 실행할 것입니다. 프록시가 제대로 작동하면 응답 체인은 다음과 같습니다.

  1. Cursor는 사용자 메시지를 프록시로 보냅니다.
  2. 프록시는 reasoning_content 없이 DeepSeek으로 전달합니다(첫 번째 턴이므로).
  3. DeepSeek은 텍스트와 reasoning_content 블록, 그리고 tool_calls 요청을 반환합니다.
  4. 프록시는 대화 접두사 해시를 키로 사용하여 reasoning_content를 캐시합니다.
  5. Cursor는 도구를 실행한 다음, 도구 결과와 함께 후속 요청을 보냅니다. Cursor가 reasoning_content를 제거했기 때문에 후속 요청에는 이 필드가 없습니다.
  6. 프록시는 접두사 해시를 통해 캐시된 reasoning_content를 찾아 DeepSeek으로 전달하기 전에 다시 삽입합니다.
  7. DeepSeek은 요청을 수락하고, 추론을 계속하며, 최종 답변을 반환합니다.

--verbose 플래그를 사용하여 실행하면 로그에서 삽입 과정이 일어나는 것을 볼 수 있습니다.

실제 비용

Cursor 내 V4-Pro는 Cursor의 번들 크레딧 가격이 아닌 DeepSeek의 표준 API 요율을 따릅니다. 이 요율은 2026년 5월 기준으로 영구적입니다.

토큰 유형 백만 토큰당 요율
입력 (캐시 미스) $0.435
입력 (캐시 히트) $0.003625
출력 $0.87

사용량이 많은 Cursor 사용일은 대략 50번의 채팅 턴과 20번의 도구 호출 체인으로 구성됩니다. 각 턴은 평균 8,000개의 프롬프트 토큰(파일 컨텍스트, 시스템 프롬프트, 기록 포함)과 1,500개의 출력 토큰을 사용합니다. 이는 다음과 같습니다.

총계: 사용량이 많은 날 하루에 약 $1입니다. Cursor Pro의 번들 GPT-5.5 할당량을 통해 동일한 워크로드를 실행하는 것과 비교할 때, 할당량 제한이 시작되기 전에 이것은 훨씬 저렴합니다. 전체 가격 인하 계산은 DeepSeek V4-Pro 75% 가격 인하가 영구화되었습니다에 있습니다.

DeepSeek 제품군의 나머지 정보는 DeepSeek V4란 무엇인가DeepSeek V4 API 사용 방법을 참조하세요.

Cursor 내에서 V4-Pro를 사용할 때의 느낌

기본 Cursor 모델과 비교할 때 세 가지 차이점이 나타납니다.

1. 사고 토큰이 보입니다. 기본적으로 프록시는 DeepSeek의 추론을 각 응답 위에 접을 수 있는 마크다운 블록으로 렌더링합니다. Cursor의 채팅 패널은 이를 <details> 요소로 표시합니다. 프롬프트 디버깅에 유용하지만, 일상적인 작업에는 번잡할 수 있습니다. --no-display-reasoning으로 전환할 수 있습니다.

2. 첫 번째 도구 호출의 지연 시간이 더 깁니다. V4-Pro는 사고 모델이며, 도구 호출 전에 체인이 실행됩니다. 첫 번째 도구가 실행되기까지 2~4초 정도 예상해야 하며, 그 다음 후속 작업에서는 표준 처리량이 나타납니다.

3. Cursor의 "적용" 제안이 복잡한 리팩토링에서 향상됩니다. 이것이 핵심입니다. V4-Pro의 추론 체인은 플랫 완성 모델이 놓치는 다중 파일 종속성을 포착합니다. GPT-5.5로는 세 번의 라운드가 필요했던 이름 변경, 시그니처 변경, 설정 기반 리팩토링이 V4-Pro로는 한 번에 처리되는 경우가 많습니다.

이전 모델에 대한 다른 DeepSeek-with-Cursor 사용법 안내서도 있습니다. 이전 패턴에 대해서는 Cursor와 함께 DeepSeek R1 로컬로 사용하는 방법DeepSeek V3와 Cursor: 단계별 안내를 참조하세요. 이 안내서의 프록시는 해당 게시물에 설명된 수동 추론 삽입 해킹을 대체합니다.

Apidog로 DeepSeek 설정 테스트하기

Cursor 통합은 Cursor 내부에서만 경로를 증명합니다. V4-Pro를 다른 환경(CI 봇, 백엔드 에이전트, 사용자 지정 IDE 플러그인 등)으로 배포하는 경우, 프록시가 전달하는 것과 동일한 엔드포인트에 대해 결정론적인 테스트 하네스를 원할 것입니다.

여기서 Apidog가 제 역할을 합니다. Apidog 환경을 https://api.deepseek.com/v1로 설정하고, API 키를 입력한 다음 OpenAI 채팅 완성 스키마를 가져옵니다. 다음을 수행할 수 있습니다.

Apidog를 다운로드하고 DeepSeek OpenAPI 사양을 가져오면 5분 안에 작동하는 V4-Pro 테스트 벤치를 갖게 됩니다. DeepSeek V4 API 사용 방법에서 다루는 것과 동일한 워크플로입니다.

일반적인 문제점

첫 번째 도구 호출 후 400 오류. 이 프록시가 해결하기 위해 만들어진 전형적인 실패 모드입니다. 설정 후에도 여전히 이 오류가 발생한다면 프록시가 실행되고 있지 않거나 Cursor가 잘못된 기본 URL을 가리키고 있는 것입니다. URL이 /v1로 끝나는지 다시 확인하고 프록시 로그에 들어오는 요청이 표시되는지 확인하세요.

ngrok 터널이 계속 재연결됩니다. 무료 계층 터널은 재시작 시 변경됩니다. Cursor의 검증은 통과했지만 몇 분 후에 실패한다면 터널이 순환된 것입니다. 예약 도메인으로 이동(ngrok 대시보드에서 원클릭)하고 --ngrok-url로 전달하세요.

추론 내용이 중복되어 나타납니다. 동일한 SQLite 캐시 경로로 두 개의 프록시 인스턴스가 실행될 때 발생합니다. 두 인스턴스를 모두 중지하고 ~/.deepseek-cursor-proxy/reasoning_content.sqlite3를 삭제한 다음 하나의 인스턴스만 시작하세요.

캐시 적중률이 낮아 보입니다. DeepSeek의 프롬프트 캐시는 바이트 단위로 동일한 접두사를 요구합니다. Cursor는 일부 시스템 프롬프트에 타임스탬프와 세션 ID를 삽입하여 캐시 적중을 방해합니다. 이 수정은 프록시 내부에 있지 않습니다. 비용을 감수하거나 V4-Pro 세션에 대해 Cursor의 "시스템 프롬프트 없음" 모드를 사용하세요.

Cursor가 "모델을 찾을 수 없음"을 보고합니다. Cursor 설정의 모델 이름은 실제 DeepSeek 모델과 일치해야 합니다. 오늘날 유효한 값은 deepseek-v4-pro, deepseek-v4-flash, deepseek-v3-2-pro, deepseek-r1-1입니다. 프록시는 이름을 번역하지 않고 그대로 전달합니다.

프록시가 적합하지 않은 경우의 대안

프록시가 현재 가장 깔끔한 방법이지만, 두 가지 대안이 있습니다.

자세히 다루어진 다른 Cursor 모델 통합: Cursor와 함께 Claude Opus 4.6, Cursor와 함께 Kimi K2.5, Cursor와 함께 Gemini 3.0 Pro.

자주 묻는 질문

Cursor가 DeepSeek V4-Pro를 네이티브로 지원하지 않는 이유는 무엇인가요? Cursor의 채팅 클라이언트는 OpenAI 채팅 완성 스키마를 따릅니다. reasoning_content는 해당 스키마의 일부가 아닙니다. 이는 R1 제품군과 함께 등장하여 V4-Pro에 유지된 DeepSeek 특정 확장 기능입니다. Cursor는 해당 필드를 통과시키기 위해 제공자별 처리를 추가해야 할 것입니다. 그럴 수도 있지만, 그때까지는 프록시가 해결책입니다.

프록시가 DeepSeek R1 또는 V3.2와도 작동하나요? 네. reasoning_content를 반환하고 도구 호출 후속 요청에서 이를 요구하는 모든 DeepSeek 사고 모델이 지원됩니다. Cursor 설정에서 모델 이름을 실제 DeepSeek 모델 식별자로 설정하세요.

프록시를 계속 실행해도 안전한가요? 네, 한 가지 주의할 점이 있습니다. SQLite 캐시는 세션의 원시 추론 내용을 포함합니다. 다중 사용자 설정을 실행하거나 머신을 공유하는 경우, 캐시 디렉토리의 권한을 제한하거나 --no-cache(메모리 내 전용으로, 프록시 재시작 후 도구 호출이 실패함을 의미)로 실행하세요.

ngrok 없이 프록시를 사용할 수 있나요? 네, --no-ngrok와 함께 사용할 수 있습니다. 그러면 프록시는 http://127.0.0.1:9000만 노출합니다. Cursor의 사용자 지정 모델 UI는 표준 릴리스에서 http:// URL을 거부하지만, 일부 사이드로딩된 빌드 및 패치된 설정은 localhost를 허용합니다. 대부분의 사용자는 ngrok 또는 이에 상응하는 것(Cloudflare Tunnel, Tailscale Funnel)을 원할 것입니다.

이것이 Cursor Composer 2.5와도 작동하나요? Composer는 채팅 패널과 동일한 모델 라우팅 파이프라인을 사용하므로, 네. Composer 에이전트 내의 첫 번째 도구 호출은 동일한 reasoning_content 요구 사항을 트리거하며 프록시가 이를 동일한 방식으로 해결합니다.

프록시의 지연 시간 오버헤드는 어느 정도인가요? 무시할 수 있는 수준입니다. 프록시는 요청당 하나의 로컬 네트워크 홉, 하나의 SQLite 조회, 몇 KB의 JSON 조작을 추가합니다. 측정된 오버헤드는 호출당 5~15ms입니다. ngrok은 가장 가까운 에지에 따라 30~80ms를 추가합니다. 프록시는 병목 현상이 아닙니다.

프록시는 무엇을 캐시할지 어떻게 결정하나요? 대화 접두사(최신 사용자 또는 도구 메시지 이전의 모든 것)를 해시하고, 해당 해시의 SHA-256을 마지막 DeepSeek 응답의 reasoning_content에 대한 키로 사용하여 둘 다 SQLite에 저장합니다. 다음 요청 시, 새 접두사의 해시를 계산하고 일치하는 항목을 찾습니다. 이는 보수적인 방법입니다. 부분 접두사 일치는 캐시 적중을 트리거하지 않으므로, 거의 동일한 두 대화가 서로 오염되지 않습니다.

Anthropic, OpenAI 또는 Cursor가 이를 중단시킬 수 있나요? Anthropic과 OpenAI는 관련이 없습니다. Cursor는 네이티브 사고 모델 지원을 추가하거나(이 경우 프록시가 필요 없어짐) 프록시를 손상시키는 방식으로 요청 형식을 변경할 수 있습니다. 저장소는 유지 관리되고 있으니, 호환성 업데이트를 위해 문제를 주시하세요.

마무리

V4-Pro의 코딩 능력은 GPT-5.5와 몇 벤치마크 포인트 내에 있지만(DataCamp 비교), 출력 가격은 약 1/34 수준입니다. Cursor 사용자에게 유일한 장애물은 reasoning_content에 대한 API 계약 불일치였습니다. deepseek-cursor-proxy 저장소는 100줄 미만의 의미 있는 코드와 5분간의 설정으로 이 문제를 해결합니다.

세 가지 구체적인 다음 단계:

사고 토큰 세금은 지불되었습니다. 하지만 가격은 그렇지 않습니다.

버튼

Apidog에서 API 설계-첫 번째 연습

API를 더 쉽게 구축하고 사용하는 방법을 발견하세요