DeepSeek V4を無料で使う方法

Ashley Innocent

Ashley Innocent

24 4月 2026

DeepSeek V4を無料で使う方法

Apidog エンタープライズ

オンプレミスデプロイ

SSO & RBAC

SOC 2 準拠

Apidog Enterpriseを見る

DeepSeek V4は2026年4月23日にリリースされましたが、ほとんどの最先端モデルのローンチとは異なり、無料利用が可能です。公式ウェブチャットではV4-Proがクレジットカードなしで利用できます。モデルのウェイトはMITライセンスで、今日からダウンロード可能です。OpenRouterやChutesのようなアグリゲーターは、DeepSeekのリリースから数日以内に無料枠を提供することが一般的です。これらを合わせると、アカウントにチャージするかどうかを決める前に、本格的なV4のワークロードを無料で実行できます。

このガイドでは、私たちが確認できるすべての無料パス、それぞれがどのユースケースに適しているか、そして利用が増加した際に有料課金への移行がスムーズになるように、Apidogで本番環境に対応したコレクションを構築する方法を説明します。

ボタン

製品レベルの概要については、DeepSeek V4とはをご覧ください。APIの完全なウォークスルーについては、DeepSeek V4 APIの使用方法をご覧ください。

要するに

画像

パス1:chat.deepseek.com(デフォルトの無料パス)

最も速く、最も信頼性の高い無料パスは、公式チャットインターフェースです。V4-Proがデフォルトモデルで、コンポーザーの上部にある切り替えで、非思考、思考高、思考最大推論モードを切り替えることができます。

画像

セットアップ

  1. chat.deepseek.comを開きます。
  2. メール、Google、またはWeChatでサインインします。
  3. アクティブなモデルがV4-Proであることを確認します。
  4. 入力を開始します。

得られるもの

上限について

DeepSeekは1日あたりのメッセージ数を厳密には公開していません。無料枠は負荷がかかるとソフトに制限されます。大量に使用すると、応答が遅くなったり、リクエストがキューに入れられたりすることがありますが、ハードブロックされることは稀です。継続的なレート制限が見られるようになった場合は、使用頻度を落とすか、APIに移行する時期であるという兆候です。

ウェブUIに適したタスク:最も難しいプロンプトでV4がClaudeに勝るかどうかのテスト、アーキテクチャレビューのためにリポジトリのtarballを貼り付けること、弁護士に読んでもらうために費用を払うような契約書に対してThink Maxを実行すること。不適切なタスク:自動化や再現性が必要なもの。

パス2:自身のGPUでV4-Flashをセルフホストする

V4-Flashは、ほとんどの人が現実的にセルフホストできるMITライセンスのバリアントです。合計284B、アクティブ13BのV4-Flashは、複数のH100を備えたマシンでFP8で高いスループットを発揮し、INT4量子化により単一の80GBカードに収めることができます。

ここでのコストはライセンスではなくハードウェアです。すでにGPU容量がある場合、これは最も持続可能な無料パスです。レート制限されたり、非推奨になったり、取り消されたりすることはありません。

ウェイトをプルする

pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
  --local-dir ./models/deepseek-v4-flash

FP8で約500GBを想定してください。ディスク容量を確保してください。

vLLMで提供する

pip install "vllm>=0.9.0"

vllm serve deepseek-ai/DeepSeek-V4-Flash \
  --tensor-parallel-size 4 \
  --max-model-len 1048576 \
  --dtype auto \
  --port 8000

起動したら、任意のOpenAI互換クライアントをhttp://localhost:8000/v1に向けます。このエンドポイントは、有料のDeepSeek APIと同じリクエスト形式を受け入れます。Apidogはこれを別のベースURLとして認識し、保存されたすべてのコレクションは変更せずに機能します。

ハードウェアの現実的な確認

バリアント 最小カード数 (FP8) 最小カード数 (INT4) 現実的なスループット
V4-Flash H100 80GB × 2 H100 80GB × 1 50~150トークン/秒
V4-Pro H100 80GB × 16 H100 80GB × 8 クラスターに依存

遊休カードがない場合、通常はGPUを時間単位でレンタルするよりもAPIを利用する方が費用対効果が高いです。セルフホストパスは、既存のキャパシティがあるチームや、厳格なコンプライアンス要件があるチーム向けです。

パス3:OpenRouterの無料枠

OpenRouterは、オープンウェイトモデルとクローズドモデルを単一のAPIの背後に集約するリクエストレベルのゲートウェイです。このプラットフォームは、新しいDeepSeekのリリース時に定期的に無料枠を開放しており、このパターンはV3、V3.1、V3.2でも維持されています。

画像

セットアップ

  1. openrouter.aiでサインアップします。
  2. APIキーを作成します。
  3. モデルカタログでdeepseek/deepseek-v4-proまたはdeepseek/deepseek-v4-flashを確認します。無料バリアントには通常:freeがサフィックスとして付加されます。
  4. OpenAI互換SDKで呼び出します。
from openai import OpenAI

client = OpenAI(
    api_key=OPENROUTER_KEY,
    base_url="https://openrouter.ai/api/v1",
)

response = client.chat.completions.create(
    model="deepseek/deepseek-v4-flash:free",
    messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)

print(response.choices[0].message.content)

上限

OpenRouterの無料枠は通常、キーごとに1日あたり数百リクエストに制限され、負荷がかかると優先度が低下します。プロトタイプ作成には最適ですが、本番環境には信頼性が低いです。

パス4:Hugging Face推論プロバイダー

Hugging Faceは、V4チェックポイントをリリース後すぐに公開するホスト型推論サービスを運営しています。レート制限は厳しく、レイテンシーは変動しますが、無料で呼び出すことができます。

from huggingface_hub import InferenceClient

client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")

response = client.chat_completion(
    messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
    max_tokens=512,
)

print(response.choices[0].message.content)

HFトークンは無料です。より頻繁に利用する場合は、Proアカウントにアップグレードしてください。レート制限は緩和されますが、同等のワークロードであれば、公式APIよりも桁違いに費用が安くなります。

パス5:Colab、Kaggle、RunPod、Lambdaのトライアルクレジット

主要なGPUレンタルプロバイダーはすべてトライアルクレジットを提供しています。これらをうまく利用すれば、実際の費用をかけることなく一度限りのV4-Flash実験を行うことができます。

これらはいずれも長期的な無料パスではありません。限定的な実験には適していますが、それ以上ではありません。

プロバイダーにとらわれないApidogコレクションを構築する

これほど多くの無料パスがあることの実用的な利点は、作業を重複させることなく、すべてのパスで同じプロンプトをテストできることです。ワークフローは次のとおりです。

  1. Apidogをダウンロードします。
  2. 4つの環境を持つ1つのコレクションを作成します: chat (プレースホルダー), deepseek (https://api.deepseek.com/v1), openrouter (https://openrouter.ai/api/v1), self-hosted (http://localhost:8000/v1)。
  3. {{BASE_URL}}/chat/completionsへの単一のPOSTリクエストを保存します。
  4. 各プロバイダーのキーをシークレット変数として保存し、リクエストボディが環境間で同一になるようにします。
  5. 環境を切り替えて、すべてのバックエンドで同じプロンプトをA/Bテストします。

これは、GPT-5.5無料枠コレクションで使用されているのと同じパターンです。1つのツールで、すべてのプロバイダーに対応し、重複作業はありません。

どの無料パスを選ぶべきか?

ほとんどの決定は、4つのヒューリスティックでカバーできます。

無料利用から移行する時期

無料枠では対応しきれなくなったことを示す3つの兆候があります。

  1. 1日に複数回レート制限に達する。 それはワークロードが予算を組むに値するほど大きいことを意味します。
  2. SLAが必要。 無料枠には含まれていません。公式APIには含まれています。
  3. ログ記録、監査、コンプライアンス遵守が必要。 有料APIは明確な請求記録を提供しますが、ほとんどのアグリゲーターの無料枠では提供されません。

これらいずれかの状況になったら、公式APIに移行してください。最低チャージ額は2ドルで、トークンあたりの料金は最先端ティアで最も低いです。

よくある質問

chat.deepseek.comは本当に無料ですか?はい。クレジットカードもトライアル期間もありません。サービスはソフトに制限されますが、有料化されてはいません。

ウェイトをダウンロードするためにHugging Faceアカウントが必要ですか?技術的には不要で、リポジトリは公開されています。しかし実際には、ログインしたアカウントの方がダウンロード時のレート制限が緩くなります。

どの無料パスで実際のV4-Proが実行されますか?chat.deepseek.comでは完全なV4-Proが実行されます。OpenRouterの無料枠ではV4-Flashが提供されることが多いです。V4-Proの出力が必要で費用をかけたくない場合は、ウェブチャットが信頼できるパスです。

製品のバックエンドに無料枠を利用できますか?責任をもって利用することはできません。無料枠はレート制限があり、利用規約が変更されたり、時には消滅したりします。顧客にV4を提供する場合は、有料APIを利用するか、セルフホストしてください。

セルフホストは本当に無料ですか?ライセンスは無料ですが、ハードウェアは無料ではありません。すでにGPU容量を所有している場合、限界費用は電気代です。レンタルする場合、通常は有料APIの方が費用対効果が高いです。

テスト用のApidog無料枠はありますか?Apidog自体はAPI設計とテストのために無料で利用できます。有料APIを介して利用する場合にのみクレジットがかかります。したがって、無料のApidogワークスペースとchat.deepseek.comまたはOpenRouterを組み合わせることで、完全に無料のワークフローを実現できます。

ApidogでAPIデザイン中心のアプローチを取る

APIの開発と利用をよりシンプルなことにする方法を発見できる