DeepSeek V4は2026年4月23日にリリースされましたが、ほとんどの最先端モデルのローンチとは異なり、無料利用が可能です。公式ウェブチャットではV4-Proがクレジットカードなしで利用できます。モデルのウェイトはMITライセンスで、今日からダウンロード可能です。OpenRouterやChutesのようなアグリゲーターは、DeepSeekのリリースから数日以内に無料枠を提供することが一般的です。これらを合わせると、アカウントにチャージするかどうかを決める前に、本格的なV4のワークロードを無料で実行できます。
このガイドでは、私たちが確認できるすべての無料パス、それぞれがどのユースケースに適しているか、そして利用が増加した際に有料課金への移行がスムーズになるように、Apidogで本番環境に対応したコレクションを構築する方法を説明します。
製品レベルの概要については、DeepSeek V4とはをご覧ください。APIの完全なウォークスルーについては、DeepSeek V4 APIの使用方法をご覧ください。
要するに
- chat.deepseek.com — V4-Proで利用できる無料ウェブチャット。Think HighとThink Maxの切り替えが可能。カード不要。今すぐ利用可能。
- Hugging Faceのウェイト + 自身のGPU — MITライセンス。V4-Flashは2~4台のH100で動作し、V4-Proにはクラスターが必要。
- OpenRouterとChutesの無料枠 — DeepSeekモデルのリリースから1週間以内に無料クォータを開放するのが一般的なサードパーティ製ゲートウェイ。
- Hugging Face推論プロバイダー — V4を初期実験用に公開する、共有されレート制限のあるエンドポイント。
- Kaggle、Colab、RunPodのトライアルクレジット — セルフホスティングを試したい場合の、一度きりの実行に使える無料計算リソース。
- どの無料パスも使用量に上限があります。本番ワークロードでは、上限に達する前に有料課金に移行してください。

パス1:chat.deepseek.com(デフォルトの無料パス)
最も速く、最も信頼性の高い無料パスは、公式チャットインターフェースです。V4-Proがデフォルトモデルで、コンポーザーの上部にある切り替えで、非思考、思考高、思考最大推論モードを切り替えることができます。

セットアップ
- chat.deepseek.comを開きます。
- メール、Google、またはWeChatでサインインします。
- アクティブなモデルがV4-Proであることを確認します。
- 入力を開始します。
得られるもの
- 完全な1Mトークンのコンテキストウィンドウ。
- PDF、画像、コードバンドルのファイルアップロード。
- オンデマンドのウェブ検索。
- Think Maxを含む3つの推論モードすべて。
- 会話履歴とフォルダ。
上限について
DeepSeekは1日あたりのメッセージ数を厳密には公開していません。無料枠は負荷がかかるとソフトに制限されます。大量に使用すると、応答が遅くなったり、リクエストがキューに入れられたりすることがありますが、ハードブロックされることは稀です。継続的なレート制限が見られるようになった場合は、使用頻度を落とすか、APIに移行する時期であるという兆候です。
ウェブUIに適したタスク:最も難しいプロンプトでV4がClaudeに勝るかどうかのテスト、アーキテクチャレビューのためにリポジトリのtarballを貼り付けること、弁護士に読んでもらうために費用を払うような契約書に対してThink Maxを実行すること。不適切なタスク:自動化や再現性が必要なもの。
パス2:自身のGPUでV4-Flashをセルフホストする
V4-Flashは、ほとんどの人が現実的にセルフホストできるMITライセンスのバリアントです。合計284B、アクティブ13BのV4-Flashは、複数のH100を備えたマシンでFP8で高いスループットを発揮し、INT4量子化により単一の80GBカードに収めることができます。
ここでのコストはライセンスではなくハードウェアです。すでにGPU容量がある場合、これは最も持続可能な無料パスです。レート制限されたり、非推奨になったり、取り消されたりすることはありません。
ウェイトをプルする
pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
--local-dir ./models/deepseek-v4-flash
FP8で約500GBを想定してください。ディスク容量を確保してください。
vLLMで提供する
pip install "vllm>=0.9.0"
vllm serve deepseek-ai/DeepSeek-V4-Flash \
--tensor-parallel-size 4 \
--max-model-len 1048576 \
--dtype auto \
--port 8000
起動したら、任意のOpenAI互換クライアントをhttp://localhost:8000/v1に向けます。このエンドポイントは、有料のDeepSeek APIと同じリクエスト形式を受け入れます。Apidogはこれを別のベースURLとして認識し、保存されたすべてのコレクションは変更せずに機能します。
ハードウェアの現実的な確認
| バリアント | 最小カード数 (FP8) | 最小カード数 (INT4) | 現実的なスループット |
|---|---|---|---|
| V4-Flash | H100 80GB × 2 | H100 80GB × 1 | 50~150トークン/秒 |
| V4-Pro | H100 80GB × 16 | H100 80GB × 8 | クラスターに依存 |
遊休カードがない場合、通常はGPUを時間単位でレンタルするよりもAPIを利用する方が費用対効果が高いです。セルフホストパスは、既存のキャパシティがあるチームや、厳格なコンプライアンス要件があるチーム向けです。
パス3:OpenRouterの無料枠
OpenRouterは、オープンウェイトモデルとクローズドモデルを単一のAPIの背後に集約するリクエストレベルのゲートウェイです。このプラットフォームは、新しいDeepSeekのリリース時に定期的に無料枠を開放しており、このパターンはV3、V3.1、V3.2でも維持されています。

セットアップ
- openrouter.aiでサインアップします。
- APIキーを作成します。
- モデルカタログで
deepseek/deepseek-v4-proまたはdeepseek/deepseek-v4-flashを確認します。無料バリアントには通常:freeがサフィックスとして付加されます。 - OpenAI互換SDKで呼び出します。
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)
print(response.choices[0].message.content)
上限
OpenRouterの無料枠は通常、キーごとに1日あたり数百リクエストに制限され、負荷がかかると優先度が低下します。プロトタイプ作成には最適ですが、本番環境には信頼性が低いです。
パス4:Hugging Face推論プロバイダー
Hugging Faceは、V4チェックポイントをリリース後すぐに公開するホスト型推論サービスを運営しています。レート制限は厳しく、レイテンシーは変動しますが、無料で呼び出すことができます。
from huggingface_hub import InferenceClient
client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")
response = client.chat_completion(
messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
max_tokens=512,
)
print(response.choices[0].message.content)
HFトークンは無料です。より頻繁に利用する場合は、Proアカウントにアップグレードしてください。レート制限は緩和されますが、同等のワークロードであれば、公式APIよりも桁違いに費用が安くなります。
パス5:Colab、Kaggle、RunPod、Lambdaのトライアルクレジット
主要なGPUレンタルプロバイダーはすべてトライアルクレジットを提供しています。これらをうまく利用すれば、実際の費用をかけることなく一度限りのV4-Flash実験を行うことができます。
- Google Colab. 無料のT4ティアはV4には小さすぎます。Colab Pro+は月に500計算ユニットを提供し、A100でのV4-Flash実験をいくつか行うのに十分です。
- Kaggle. T4とP100で毎週無料のGPU時間。V4-Proには小さすぎますが、量子化されたV4-Flashの実験には十分な場合があります。
- RunPod. 10ドルのトライアルクレジットで、H100で数時間利用できます。vLLMを起動し、ベンチマークスイートを実行し、その後シャットダウンするのに十分です。
- Lambda. H100およびH200で時折無料時間プロモーションがあります。アクティブなオファーについてはサインアップページをチェックしてください。
これらはいずれも長期的な無料パスではありません。限定的な実験には適していますが、それ以上ではありません。
プロバイダーにとらわれないApidogコレクションを構築する
これほど多くの無料パスがあることの実用的な利点は、作業を重複させることなく、すべてのパスで同じプロンプトをテストできることです。ワークフローは次のとおりです。
- Apidogをダウンロードします。
- 4つの環境を持つ1つのコレクションを作成します:
chat(プレースホルダー),deepseek(https://api.deepseek.com/v1),openrouter(https://openrouter.ai/api/v1),self-hosted(http://localhost:8000/v1)。 {{BASE_URL}}/chat/completionsへの単一のPOSTリクエストを保存します。- 各プロバイダーのキーをシークレット変数として保存し、リクエストボディが環境間で同一になるようにします。
- 環境を切り替えて、すべてのバックエンドで同じプロンプトをA/Bテストします。
これは、GPT-5.5無料枠コレクションで使用されているのと同じパターンです。1つのツールで、すべてのプロバイダーに対応し、重複作業はありません。
どの無料パスを選ぶべきか?
ほとんどの決定は、4つのヒューリスティックでカバーできます。
- 5分で意見を形成したい。 chat.deepseek.comを利用します。
- 製品のプロトタイプを作成したい。 OpenRouterの無料枠を上限に達するまで利用し、その後DeepSeekにチャージします。
- GPUとコンプライアンス要件がある。 vLLMでV4-Flashをセルフホストします。
- 長期的な無料利用が必要。 そのようなものはありません。どのホスト型無料枠もどこかで上限があります。対話的な作業にはchat.deepseek.comを、自動化には少額の有料チャージを組み合わせて利用してください。
無料利用から移行する時期
無料枠では対応しきれなくなったことを示す3つの兆候があります。
- 1日に複数回レート制限に達する。 それはワークロードが予算を組むに値するほど大きいことを意味します。
- SLAが必要。 無料枠には含まれていません。公式APIには含まれています。
- ログ記録、監査、コンプライアンス遵守が必要。 有料APIは明確な請求記録を提供しますが、ほとんどのアグリゲーターの無料枠では提供されません。
これらいずれかの状況になったら、公式APIに移行してください。最低チャージ額は2ドルで、トークンあたりの料金は最先端ティアで最も低いです。
よくある質問
chat.deepseek.comは本当に無料ですか?はい。クレジットカードもトライアル期間もありません。サービスはソフトに制限されますが、有料化されてはいません。
ウェイトをダウンロードするためにHugging Faceアカウントが必要ですか?技術的には不要で、リポジトリは公開されています。しかし実際には、ログインしたアカウントの方がダウンロード時のレート制限が緩くなります。
どの無料パスで実際のV4-Proが実行されますか?chat.deepseek.comでは完全なV4-Proが実行されます。OpenRouterの無料枠ではV4-Flashが提供されることが多いです。V4-Proの出力が必要で費用をかけたくない場合は、ウェブチャットが信頼できるパスです。
製品のバックエンドに無料枠を利用できますか?責任をもって利用することはできません。無料枠はレート制限があり、利用規約が変更されたり、時には消滅したりします。顧客にV4を提供する場合は、有料APIを利用するか、セルフホストしてください。
セルフホストは本当に無料ですか?ライセンスは無料ですが、ハードウェアは無料ではありません。すでにGPU容量を所有している場合、限界費用は電気代です。レンタルする場合、通常は有料APIの方が費用対効果が高いです。
テスト用のApidog無料枠はありますか?Apidog自体はAPI設計とテストのために無料で利用できます。有料APIを介して利用する場合にのみクレジットがかかります。したがって、無料のApidogワークスペースとchat.deepseek.comまたはOpenRouterを組み合わせることで、完全に無料のワークフローを実現できます。
