DeepSeek V4는 2026년 4월 23일에 출시되었으며, 대부분의 최첨단 출시와 달리 무료 경로가 실제로 제공됩니다. 공식 웹 채팅은 신용카드 없이 V4-Pro를 실행합니다. 가중치는 MIT 라이선스로 배포되며 오늘 바로 다운로드할 수 있습니다. OpenRouter 및 Chutes와 같은 애그리게이터는 일반적으로 DeepSeek 출시 후 며칠 내에 무료 티어를 공개합니다. 이를 종합하면, 계정을 충전할지 결정하기 전에 심각한 V4 작업을 무료로 실행할 수 있습니다.
이 가이드는 우리가 확인할 수 있는 모든 무료 경로, 각 사용 사례에 적합한 경로, 그리고 사용량이 증가할 때 유료 결제로의 전환이 원활하도록 Apidog에서 프로덕션 준비가 된 컬렉션을 설정하는 방법을 안내합니다.
제품 수준의 개요는 DeepSeek V4란 무엇인가를 참조하십시오. 전체 API 사용법은 DeepSeek V4 API 사용 방법을 참조하십시오.
요약 (TL;DR)
- chat.deepseek.com — Think High 및 Think Max 토글이 있는 V4-Pro 무료 웹 채팅. 카드 불필요. 오늘부터 사용 가능.
- Hugging Face 가중치 + 자체 GPU — MIT 라이선스, V4-Flash는 2~4개의 H100에서 실행 가능, V4-Pro는 클러스터 필요.
- OpenRouter 및 Chutes 무료 티어 — DeepSeek 모델 출시 후 일주일 이내에 보통 무료 할당량을 제공하는 타사 게이트웨이.
- Hugging Face 추론 제공자 — 초기 실험을 위해 V4를 노출하는 공유 및 속도 제한 엔드포인트.
- Kaggle, Colab, RunPod 평가판 크레딧 — 자체 호스팅을 테스트할 때 일회성 실행을 위한 무료 컴퓨팅.
- 모든 무료 경로는 사용량이 제한됩니다. 프로덕션 워크로드의 경우, 제한에 걸리기 전에 유료 결제로 전환하십시오.

경로 1: chat.deepseek.com (기본 무료 경로)
가장 빠르고 신뢰할 수 있는 무료 경로는 공식 채팅 인터페이스입니다. V4-Pro가 기본 모델이며, 작성기 상단의 토글을 통해 Non-Think, Think High, Think Max 추론 모드를 전환할 수 있습니다.

설정
- chat.deepseek.com을 엽니다.
- 이메일, Google 또는 WeChat으로 로그인합니다.
- 활성 모델이 V4-Pro인지 확인합니다.
- 입력을 시작합니다.
제공되는 기능
- 전체 1M 토큰 컨텍스트 창.
- PDF, 이미지 및 코드 번들 파일 업로드.
- 온디맨드 웹 검색.
- Think Max를 포함한 세 가지 추론 모드 모두.
- 대화 기록 및 폴더.
제한 사항
DeepSeek은 일일 메시지 개수를 명확히 공개하지 않으며, 무료 티어는 부하 시 소프트 스로틀링됩니다. 과도한 사용은 응답을 느리게 하거나 요청을 대기시킬 수 있지만, 하드 블록은 거의 발생하지 않습니다. 지속적인 속도 제한이 보이기 시작하면, 사용 빈도를 늦추거나 API로 전환해야 한다는 신호입니다.
웹 UI에 적합한 작업: 가장 어려운 프롬프트에서 V4가 Claude를 능가하는지 테스트, 아키텍처 검토를 위해 리포지토리 tarball 붙여넣기, 변호사에게 돈을 주고 읽게 할 계약서에 대해 Think Max 실행. 적합하지 않은 작업: 자동화 또는 재현성이 필요한 모든 것.
경로 2: 자체 GPU에 V4-Flash 자체 호스팅
V4-Flash는 대부분의 사람들이 실제로 자체 호스팅할 수 있는 MIT 라이선스 변형입니다. 총 284B, 활성 13B로, 여러 H100 박스는 FP8에서 상당한 처리량으로 이를 실행하며, INT4 양자화는 단일 80GB 카드에 로드할 수 있습니다.
여기서 비용은 라이선스가 아닌 하드웨어입니다. 이미 GPU 용량이 있다면, 이것이 가장 지속 가능한 무료 경로이며, 속도 제한, 사용 중단 또는 회수될 수 없습니다.
가중치 가져오기
pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
--local-dir ./models/deepseek-v4-flash
FP8에서 약 500GB를 예상하십시오. 디스크 공간을 확보하십시오.
vLLM으로 서빙
pip install "vllm>=0.9.0"
vllm serve deepseek-ai/DeepSeek-V4-Flash \
--tensor-parallel-size 4 \
--max-model-len 1048576 \
--dtype auto \
--port 8000
설정되면, 모든 OpenAI 호환 클라이언트를 http://localhost:8000/v1로 지정하십시오. 이 엔드포인트는 유료 DeepSeek API와 동일한 요청 형식을 허용합니다. Apidog는 이를 다른 기본 URL로 인식하며, 저장된 모든 컬렉션이 변경 없이 작동합니다.
하드웨어 현실 점검
| 버전 | 최소 카드 (FP8) | 최소 카드 (INT4) | 실질 처리량 |
|---|---|---|---|
| V4-Flash | 2 × H100 80GB | 1 × H100 80GB | 50 ~ 150 토큰/초 |
| V4-Pro | 16 × H100 80GB | 8 × H100 80GB | 클러스터에 따라 다름 |
유휴 카드가 없다면, 시간당 GPU를 임대하는 것보다 API가 일반적으로 유리합니다. 자체 호스팅 경로는 주로 기존 용량을 보유하거나 엄격한 규정 준수 요구사항이 있는 팀을 위한 것입니다.
경로 3: OpenRouter 무료 티어
OpenRouter는 하나의 API 뒤에서 오픈 가중치 모델과 비공개 모델을 통합하는 요청 수준 게이트웨이입니다. 이 플랫폼은 DeepSeek의 새로운 릴리스에 대해 정기적으로 무료 티어를 개방하며, 이러한 패턴은 V3, V3.1, V3.2에서도 유지되었습니다.

설정
- openrouter.ai에서 가입합니다.
- API 키를 생성합니다.
- 모델 카탈로그에서
deepseek/deepseek-v4-pro또는deepseek/deepseek-v4-flash를 확인하십시오. 무료 변형은 일반적으로:free접미사가 붙습니다. - OpenAI 호환 SDK로 호출합니다.
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)
print(response.choices[0].message.content)
제한 사항
OpenRouter의 무료 티어는 일반적으로 키당 하루에 수백 건의 요청으로 제한되며, 부하 시 우선순위가 낮아집니다. 프로토타이핑에는 완벽하지만, 프로덕션에는 신뢰할 수 없습니다.
경로 4: Hugging Face 추론 제공자
Hugging Face는 V4 체크포인트를 출시 직후 노출하는 호스팅 추론 서비스를 운영합니다. 속도 제한이 엄격하고 지연 시간이 다양하지만, 무료로 호출할 수 있습니다.
from huggingface_hub import InferenceClient
client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")
response = client.chat.completions(
messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
max_tokens=512,
)
print(response.choices[0].message.content)
HF 토큰은 무료입니다. 더 많이 사용하려면 Pro 계정으로 업그레이드하십시오. 속도 제한은 완화되지만, 유사한 워크로드에 대한 비용은 여전히 공식 API보다 훨씬 낮습니다.
경로 5: Colab, Kaggle, RunPod, Lambda 평가판 크레딧
모든 주요 GPU 렌탈 제공업체는 평가판 크레딧을 제공합니다. 잘 활용하면 실제 돈을 전혀 쓰지 않고도 일회성 V4-Flash 실험을 수행할 수 있습니다.
- Google Colab. 무료 T4 티어는 V4에 너무 작습니다. Colab Pro+는 월 500 컴퓨팅 단위를 제공하며, A100에서 소수의 V4-Flash 실험을 수행하기에 충분합니다.
- Kaggle. T4 및 P100에서 주간 무료 GPU 시간을 제공합니다. V4-Pro에는 너무 작지만, 때때로 양자화된 V4-Flash 실험에는 충분할 수 있습니다.
- RunPod. 10달러 평가판 크레딧으로 H100에서 몇 시간을 사용할 수 있습니다. vLLM을 실행하고 벤치마크 스위트를 돌린 다음 종료하기에 충분합니다.
- Lambda. H100 및 H200에서 가끔 무료 시간 프로모션을 제공합니다. 활성 프로모션을 위해 가입 페이지를 확인하십시오.
이 중 어떤 것도 장기적인 무료 경로는 아닙니다. 제한된 실험에는 잘 작동하지만 그 이상은 아닙니다.
프로바이더 독립적인 Apidog 컬렉션 구축
이 많은 무료 경로의 실질적인 이점은 작업을 중복하지 않고 모든 경로에서 동일한 프롬프트를 테스트할 수 있다는 것입니다. 워크플로우:
- Apidog를 다운로드합니다.
chat(플레이스홀더),deepseek(https://api.deepseek.com/v1),openrouter(https://openrouter.ai/api/v1),self-hosted(http://localhost:8000/v1)의 네 가지 환경을 가진 하나의 컬렉션을 생성합니다.{{BASE_URL}}/chat/completions에 대한 단일 POST 요청을 저장합니다.- 각 제공업체의 키를 비밀 변수로 저장하여 요청 본문이 환경 간에 동일하도록 합니다.
- 환경을 전환하여 모든 백엔드에서 동일한 프롬프트에 대해 A/B 테스트를 수행합니다.
이것은 GPT-5.5 무료 티어 컬렉션에 사용된 것과 동일한 패턴입니다. 하나의 도구, 모든 제공업체, 중복 작업 없음.
어떤 무료 경로를 선택해야 할까요?
네 가지 휴리스틱이 대부분의 결정을 커버합니다.
- 5분 안에 의견을 정하고 싶습니다. chat.deepseek.com을 사용하십시오.
- 제품 프로토타입을 만들고 싶습니다. 제한에 도달할 때까지 OpenRouter의 무료 티어를 사용하고, 그 후 DeepSeek을 충전하십시오.
- GPU와 규정 준수 이력이 있습니다. vLLM에 V4-Flash를 자체 호스팅하십시오.
- 장기적으로 무료 사용이 필요합니다. 그런 것은 없습니다. 모든 호스팅된 무료 티어에는 어딘가에 제한이 있습니다. 대화형 작업을 위해 chat.deepseek.com을 사용하고, 자동화를 위해 적당한 유료 충전을 결합하십시오.
무료 사용을 중단해야 할 때
세 가지 신호는 무료 티어를 벗어날 때가 되었음을 알려줍니다.
- 하루에 한 번 이상 속도 제한에 걸립니다. 이는 워크로드가 예산을 할당받을 만큼 충분히 크다는 의미입니다.
- SLA가 필요합니다. 무료 티어는 SLA를 제공하지 않습니다. 공식 API는 제공합니다.
- 로깅, 감사 또는 규정 준수가 필요합니다. 유료 API는 명확한 결제 기록을 반환하지만, 대부분의 애그리게이터 무료 티어는 그렇지 않습니다.
이 중 어느 하나라도 해당된다면, 공식 API로 전환하십시오. 최소 충전 금액은 2달러이며, 토큰당 가격은 최첨단 티어 중 가장 저렴합니다.
자주 묻는 질문
chat.deepseek.com은 정말 무료인가요?네. 신용카드나 평가판 기간 제한이 없습니다. 서비스는 소프트 스로틀링되지만 유료 전환을 강요하지 않습니다.
가중치를 다운로드하려면 Hugging Face 계정이 필요한가요?기술적으로는 아니요, 리포지토리는 공개되어 있습니다. 하지만 실제로는 그렇습니다. 로그인된 계정은 다운로드 시 더 나은 속도 제한을 제공합니다.
어떤 무료 경로가 실제 V4-Pro를 실행하나요?chat.deepseek.com이 전체 V4-Pro를 실행합니다. OpenRouter 무료 티어는 V4-Flash를 더 자주 제공합니다. V4-Pro 출력이 필요하고 비용을 지불하고 싶지 않다면, 웹 채팅이 신뢰할 수 있는 경로입니다.
제품 뒤에 무료 티어를 사용할 수 있나요?책임감 있게는 안 됩니다. 무료 티어는 속도 제한이 있고, 약관이 변경될 수 있으며, 때로는 사라지기도 합니다. 고객에게 V4를 제공하는 경우, 유료 API를 사용하거나 자체 호스팅하십시오.
자체 호스팅이 실제로 무료인가요?라이선스는 무료입니다. 하지만 하드웨어는 그렇지 않습니다. 이미 GPU 용량을 소유하고 있다면, 한계 비용은 전기료입니다. 임대하는 경우, 비용 측면에서 일반적으로 유료 API에 비해 손해입니다.
테스트를 위한 Apidog 무료 티어가 있나요?Apidog 자체는 API 설계 및 테스트에 무료로 사용할 수 있습니다. 유료 API를 통해 호출할 때만 크레딧이 소모됩니다. 따라서 예, 무료 Apidog 워크스페이스를 chat.deepseek.com 또는 OpenRouter와 결합하여 완전히 무료 워크플로우를 구성할 수 있습니다.
