DeepSeek V4 diluncurkan pada 23 April 2026 dengan harga API yang cukup rendah sehingga sebagian besar tim tidak perlu lagi mencari jalur gratis. Namun, jalur gratis yang sebenarnya tersedia bagi pengembang yang ingin memanggil V4 secara terprogram sebelum berkomitmen dengan kartu pembayaran. Gateway agregator menyediakan varian :free, Hugging Face menyediakan titik akhir inferensi bersama, dan API resmi memberikan kredit uji coba kepada akun baru. Gabungkan ketiga hal ini, buat rantai fallback di Apidog, dan Anda dapat membuat prototipe produk bertenaga V4 tanpa mengeluarkan biaya sepeser pun.
Panduan ini adalah jalur gratis khusus API. Untuk panduan yang lebih luas yang mencakup obrolan web dan hosting mandiri, lihat cara menggunakan DeepSeek V4 secara gratis. Untuk panduan berbayar, lihat cara menggunakan API DeepSeek V4. Untuk ikhtisar produk, lihat apa itu DeepSeek V4.
TL;DR
- OpenRouter tingkat gratis —
deepseek/deepseek-v4-flash:freedan terkadangdeepseek-v4-pro:free. Kompatibel dengan OpenAI, beberapa ratus permintaan per hari per kunci. - Penyedia Inferensi Hugging Face — titik akhir bersama gratis di
https://router.huggingface.co/hf-inference; dibatasi tarif, berguna untuk pembuatan prototipe. - Chutes tingkat gratis — jaringan GPU komunitas yang sering menyediakan titik akhir DeepSeek gratis dalam seminggu setelah peluncuran.
- Kredit uji coba DeepSeek — akun baru di
platform.deepseek.comterkadang menerima saldo awal kecil. - Self-hosted V4-Flash di GPU Anda sendiri juga gratis pada tingkat lisensi; lihat cara menjalankan DeepSeek V4 secara lokal.
- Buat rantai fallback di Apidog agar bentuk permintaan tetap identik di seluruh penyedia.

Mengapa jalur API gratis ada
Tarif berbayar DeepSeek sudah menjadi yang terendah di kategori terdepan, jadi mengapa mencari yang gratis? Ada tiga alasan.
- Prototyping sebelum pembayaran. Anda ingin memanggil V4 dari kode sebelum berkomitmen dengan metode pembayaran, baik karena alasan pengadaan atau untuk bukti konsep cepat.
- Pekerjaan mahasiswa, penelitian, dan sumber terbuka. Proyek-proyek kecil yang tidak memiliki anggaran tetap menginginkan kualitas terdepan yang nyata.
- Perbandingan penyedia. Menjalankan prompt yang sama terhadap V4 pada tiga titik akhir gratis yang berbeda akan memperlihatkan perbedaan latensi, kualitas, dan keandalan yang hanya terlihat dalam lalu lintas produksi.
Jika salah satu dari hal tersebut sesuai, panduan ini cocok untuk Anda. Jika Anda sedang membangun produk yang akan diluncurkan, lewati ke panduan API berbayar; pengisian ulang minimum $2 di API resmi DeepSeek lebih baik daripada harus berurusan dengan pembatasan tarif.
Jalur 1: Tingkat gratis OpenRouter
OpenRouter adalah gateway tingkat permintaan yang mengagregasi model-model terdepan di balik satu API yang kompatibel dengan OpenAI. Platform ini secara andal menyediakan varian gratis pada rilis DeepSeek; pola ini berlaku untuk V3, V3.1, V3.2, dan sekarang V4.
Pengaturan
- Daftar di openrouter.ai.
- Buat kunci API di bawah Pengaturan → Kunci.
- Periksa katalog model untuk entri yang diakhiri dengan
:free, biasanyadeepseek/deepseek-v4-flash:free. - Panggil titik akhir dengan SDK yang kompatibel dengan OpenAI.
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_API_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Refactor this Go function to use channels."}],
)
print(response.choices[0].message.content)
Seperti apa batasannya
Permintaan tingkat gratis di OpenRouter mengantri di belakang lalu lintas berbayar saat beban tinggi. Batasan tipikal berkisar antara 50 hingga 200 permintaan per hari per kunci dengan konkurensi yang ketat. Varian ini dapat dibatasi atau hilang tanpa pemberitahuan; ini adalah alat prototipe, bukan backend produksi.
Versi Node
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.OPENROUTER_API_KEY,
baseURL: "https://openrouter.ai/api/v1",
});
const response = await client.chat.completions.create({
model: "deepseek/deepseek-v4-flash:free",
messages: [{ role: "user", content: "Explain MoE routing like I'm 12." }],
});
console.log(response.choices[0].message.content);
Jalur 2: Penyedia Inferensi Hugging Face
Hugging Face menjalankan titik akhir inferensi bersama yang menyediakan checkpoint V4 tak lama setelah rilis. Ini gratis untuk dipanggil dengan token HF yang sudah masuk, tetapi pembatasan tarif adalah yang paling ketat di antara jalur gratis lainnya.
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
model="deepseek-ai/DeepSeek-V4-Flash",
token=os.environ["HF_TOKEN"],
)
response = client.chat_completion(
messages=[
{"role": "user", "content": "Write a Python decorator that retries with jitter."}
],
max_tokens=512,
)
print(response.choices[0].message.content)
Token HF gratis dari huggingface.co/settings/tokens. Latensi bervariasi dengan beban dan token dihitung terhadap anggaran harian bersama per akun. Tingkatkan ke HF Pro untuk melonggarkan batasan tanpa harus beralih ke API DeepSeek berbayar.
Jalur 3: Chutes dan gateway komunitas
Chutes adalah jaringan GPU terdesentralisasi yang sering menghosting model DeepSeek dengan harga gratis atau hampir gratis. Ia menyediakan titik akhir yang kompatibel dengan OpenAI di https://llm.chutes.ai/v1.
client = OpenAI(
api_key=CHUTES_API_KEY,
base_url="https://llm.chutes.ai/v1",
)
response = client.chat.completions.create(
model="deepseek-ai/DeepSeek-V4-Flash",
messages=[{"role": "user", "content": "Compare CSA and HCA attention in two sentences."}],
)
Ketersediaan berubah dengan cepat. Selalu verifikasi ID model dan biaya saat ini di dasbor penyedia sebelum membangun dependensi padanya.
Jalur 4: Kredit uji coba DeepSeek
DeepSeek secara historis memberikan kredit uji coba kecil kepada akun baru. Jumlah dan batas waktu bervariasi; terkadang $1 masuk ke saldo Anda setelah verifikasi email. Selalu periksa dasbor penagihan di platform.deepseek.com setelah mendaftar.
Bahkan uji coba $1 dapat menghasilkan banyak hal dengan tarif V4. Sejumlah $1 penuh mencakup sekitar 7 juta token input pada V4-Flash atau 570K token input pada V4-Pro. Itu cukup untuk ratusan panggilan prototipe tingkat produksi.
Membangun rantai gratis agnostik penyedia di Apidog
Manfaat dari mendukung begitu banyak jalur gratis ini adalah prototipe yang tangguh yang dapat menurun secara elegan ketika salah satu penyedia mengalami pembatasan. Alur kerjanya:
- Unduh Apidog dan buat proyek baru.
- Buat empat lingkungan:
openrouter,huggingface,chutes,deepseek-trial. - Di setiap lingkungan, simpan kunci API masing-masing sebagai variabel rahasia dan atur
BASE_URL. - Simpan satu permintaan POST ke
{{BASE_URL}}/chat/completionsdengan bidangmodelyang diparameterisasi. - Gunakan pengalihan lingkungan untuk menjalankan kembali prompt yang sama di setiap penyedia dengan satu klik.
Pendekatan yang sama berlaku untuk jalur gratis API GPT-5.5 yang sesuai; salin koleksi dan ganti penyedianya.
Menyusun rantai fallback dalam kode
Ketika penyedia gratis dibatasi, perbaikan paling bersih adalah fallback otomatis. Menggunakan OpenAI SDK:
import os
from openai import OpenAI, RateLimitError, APIError
PROVIDERS = [
{
"base_url": "https://openrouter.ai/api/v1",
"api_key": os.environ["OPENROUTER_API_KEY"],
"model": "deepseek/deepseek-v4-flash:free",
},
{
"base_url": "https://llm.chutes.ai/v1",
"api_key": os.environ["CHUTES_API_KEY"],
"model": "deepseek-ai/DeepSeek-V4-Flash",
},
{
"base_url": "https://api.deepseek.com/v1",
"api_key": os.environ["DEEPSEEK_API_KEY"],
"model": "deepseek-v4-flash",
},
]
def call_v4(messages):
for provider in PROVIDERS:
try:
client = OpenAI(
api_key=provider["api_key"],
base_url=provider["base_url"],
)
return client.chat.completions.create(
model=provider["model"],
messages=messages,
)
except (RateLimitError, APIError) as e:
print(f"{provider['base_url']} failed: {e}")
continue
raise RuntimeError("all providers exhausted")
Untuk apa setiap jalur gratis sebenarnya berguna
| Jalur | Terbaik untuk | Terburuk untuk |
|---|---|---|
| OpenRouter gratis | Prototyping, pengembangan harian | Apa pun dengan SLA yang ketat |
| Inferensi HF | Panggilan eksplorasi, notebook | Beban kerja latensi rendah |
| Chutes | Pekerjaan komunitas eksperimental | Ketergantungan jangka panjang |
| Uji coba DeepSeek | Pengujian fidelitas penuh | Produksi berkelanjutan |
| V4-Flash yang di-hosting sendiri | Pekerjaan terikat kepatuhan | Tim tanpa kapasitas GPU |
Perhitungan kuota yang penting
Pemeriksaan realitas cepat mengenai throughput harian sebelum Anda berkomitmen pada jalur gratis apa pun.
- OpenRouter gratis: ~100 permintaan/hari/kunci, ~50K token masing-masing. Berguna untuk sekitar 30 hingga 50 panggilan pengembangan nyata per hari.
- Inferensi HF gratis: batasan tarif bersama, sekitar 1K permintaan/hari total per akun; terkadang lebih lambat di bawah beban.
- Chutes: bervariasi; perlakukan sebagai upaya terbaik.
- Uji coba DeepSeek ($1): sekitar 700 panggilan masing-masing 10K token input pada V4-Flash. Terbatas namun murah hati.
- V4-Flash yang di-hosting sendiri: throughput dibatasi oleh perangkat keras Anda. Kotak 4 × H100 dapat mempertahankan 50 hingga 150 tok/dtk.
Jika prototipe Anda membutuhkan lebih dari itu, ekonominya akan terbalik. Dengan $0.14 / M pada V4-Flash, 10.000 panggilan dengan konteks 2K dan 500 token output berharga sekitar $2.80. API berbayar biasanya merupakan pilihan yang lebih sederhana setelah tahap prototipe.
Kapan harus beralih ke API berbayar
Tiga sinyal yang menunjukkan Anda telah melampaui tingkat gratis:
- Pembatasan tarif terjadi lebih dari sekali sehari.
- Anda menggabungkan beberapa penyedia gratis hanya untuk menutupi satu beban kerja.
- Pengujian Anda membutuhkan latensi atau SLA yang dapat diprediksi.
Pengisian ulang minimum di platform.deepseek.com adalah $2. Satu hari prototipe berat pada tingkatan gratis sering kali menghabiskan lebih banyak waktu pengembang daripada biaya yang dikenakan oleh API berbayar. Lihat panduan harga DeepSeek V4 untuk daftar tarif lengkap.
FAQ
- Apakah ada jalur ini yang gratis secara permanen?Tidak. Tingkat gratis dapat berubah tanpa pemberitahuan. Perlakukan mereka sebagai alat prototipe, bukan backend produksi.
- Apakah OpenRouter
:freemenjalankan V4 yang sebenarnya?Ya, tetapi pada infrastruktur bersama dengan batasan tarif yang ketat. Kualitas cocok; throughput tidak. - Dapatkah saya menggunakan keluaran jalur gratis dalam produk yang akan dikirimkan?Periksa ketentuan setiap penyedia. OpenRouter mengizinkan penggunaan komersial dalam batasan tarif. Inferensi HF mengizinkan penggunaan komersial tetapi membatasinya dengan ketat. Kredit uji coba DeepSeek sendiri mengikuti ketentuan utama.
- Jalur gratis mana yang memiliki latensi terbaik?Kredit uji coba DeepSeek sendiri; Anda menggunakan infrastruktur produksi. OpenRouter adalah yang kedua. Inferensi HF dan Chutes bervariasi.
- Dapatkah saya menghosting V4 sendiri secara gratis?Lisensinya adalah MIT, jadi ya pada tingkat lisensi. Perangkat keras adalah biayanya. Lihat cara menjalankan DeepSeek V4 secara lokal untuk pengaturannya.
- Bagaimana cara melacak jalur gratis mana yang saya gunakan hari ini?Gunakan Apidog dan sematkan
usagedi penampil respons. Sebagian besar agregator juga menyediakan dasbor penggunaan di konsol admin mereka.
