DeepSeek V4 เปิดตัวเมื่อวันที่ 23 เมษายน 2026 และแตกต่างจากการเปิดตัวเทคโนโลยีชั้นนำส่วนใหญ่ ตรงที่ช่องทางฟรีนั้นเป็นของจริง แชทบนเว็บอย่างเป็นทางการใช้ V4-Pro โดยไม่ต้องใช้บัตรเครดิต น้ำหนักโมเดลเป็นแบบ MIT-licensed และสามารถดาวน์โหลดได้ตั้งแต่วันนี้ ผู้รวมบริการอย่าง OpenRouter และ Chutes มักจะเปิดให้ใช้บริการฟรีภายในไม่กี่วันหลังจาก DeepSeek ปล่อยรุ่นออกมา เมื่อรวมกันแล้ว คุณสามารถใช้งาน V4 ในงานที่จริงจังได้โดยไม่มีค่าใช้จ่าย ก่อนที่คุณจะตัดสินใจเติมเงินเข้าบัญชีด้วยซ้ำ
คู่มือนี้จะแนะนำทุกเส้นทางที่ไม่มีค่าใช้จ่ายที่เราสามารถยืนยันได้ ว่าเส้นทางใดเหมาะสมกับกรณีการใช้งานใด และวิธีการตั้งค่าคอลเล็กชันที่พร้อมใช้งานจริงใน Apidog เพื่อให้การเปลี่ยนไปใช้การเรียกเก็บเงินแบบจ่ายเงินเป็นไปอย่างราบรื่นเมื่อการใช้งานเพิ่มขึ้น
สำหรับภาพรวมระดับผลิตภัณฑ์ โปรดดู DeepSeek V4 คืออะไร สำหรับการแนะนำการใช้งาน API อย่างละเอียด โปรดดู วิธีการใช้ DeepSeek V4 API
TL;DR (สรุปสั้นๆ)
- chat.deepseek.com — แชทบนเว็บฟรีบน V4-Pro พร้อมสลับโหมด Think High และ Think Max ไม่ต้องใช้บัตร ใช้งานได้แล้ววันนี้
- น้ำหนักโมเดล Hugging Face + GPU ของคุณเอง — ใบอนุญาต MIT, V4-Flash ทำงานบน H100 2 ถึง 4 ตัว, V4-Pro ต้องการคลัสเตอร์
- บริการฟรีของ OpenRouter และ Chutes — เกตเวย์ของบุคคลที่สามที่มักจะเปิดโควต้าฟรีสำหรับโมเดล DeepSeek ภายในหนึ่งสัปดาห์หลังการเปิดตัว
- Hugging Face Inference Providers — ปลายทางที่ใช้ร่วมกันและมีการจำกัดอัตราการใช้งาน ซึ่งเปิดให้ใช้ V4 สำหรับการทดลองเบื้องต้น
- เครดิตทดลอง Kaggle, Colab และ RunPod — ทรัพยากรคอมพิวเตอร์ฟรีสำหรับการรันครั้งเดียวเมื่อคุณต้องการทดสอบการโฮสต์ด้วยตัวเอง
- ทุกเส้นทางฟรีมีการจำกัดการใช้งาน สำหรับการทำงานระดับโปรดักชัน ให้เปลี่ยนไปใช้การเรียกเก็บเงินแบบจ่ายเงินก่อนที่จะถึงขีดจำกัด

เส้นทางที่ 1: chat.deepseek.com (เส้นทางฟรีเริ่มต้น)
เส้นทางฟรีที่เร็วที่สุดและน่าเชื่อถือที่สุดคืออินเทอร์เฟซแชทอย่างเป็นทางการ V4-Pro เป็นโมเดลเริ่มต้น สวิตช์ที่ด้านบนของส่วนเขียนข้อความจะสลับระหว่างโหมดการให้เหตุผล Non-Think, Think High และ Think Max

การตั้งค่า
- เปิด chat.deepseek.com
- ลงชื่อเข้าใช้ด้วยอีเมล, Google หรือ WeChat
- ยืนยันว่าโมเดลที่ใช้งานคือ V4-Pro
- เริ่มพิมพ์ได้เลย
สิ่งที่คุณจะได้รับ
- หน้าต่างบริบทขนาด 1M โทเค็นเต็มรูปแบบ
- อัปโหลดไฟล์สำหรับ PDF, รูปภาพ และชุดโค้ด
- ค้นหาเว็บตามต้องการ
- โหมดการให้เหตุผลทั้งสามโหมด รวมถึง Think Max
- ประวัติการสนทนาและโฟลเดอร์
ลักษณะของขีดจำกัด
DeepSeek ไม่ได้เผยแพร่จำนวนข้อความสูงสุดต่อวันที่ชัดเจน; บริการฟรีจะถูกจำกัดการใช้งานแบบนุ่มนวลภายใต้ภาระงานที่สูง การใช้งานหนักอาจทำให้การตอบสนองช้าลงหรือมีการจัดคิวคำขอ แต่ไม่ค่อยบล็อกอย่างถาวร หากคุณเริ่มเห็นการจำกัดอัตราการใช้งานอย่างต่อเนื่อง นั่นคือสัญญาณที่ต้องลดความถี่ในการใช้งานหรือย้ายไปใช้ API
งานที่เหมาะสมสำหรับ UI บนเว็บ: การทดสอบว่า V4 สามารถเอาชนะ Claude ในพรอมต์ที่ยากที่สุดของคุณได้หรือไม่, การวางไฟล์ tarball ของ repo เพื่อตรวจสอบสถาปัตยกรรม, การรัน Think Max กับสัญญาที่คุณอาจต้องจ่ายเงินให้ทนายอ่าน งานที่ไม่เหมาะสม: ทุกสิ่งที่ต้องการระบบอัตโนมัติหรือความสามารถในการทำซ้ำ
เส้นทางที่ 2: โฮสต์ V4-Flash ด้วยตัวเองบน GPU ของคุณ
V4-Flash เป็นโมเดลที่ได้รับใบอนุญาต MIT ซึ่งคนส่วนใหญ่สามารถโฮสต์ด้วยตัวเองได้อย่างสมจริง ด้วยขนาด 284B ทั้งหมดและ 13B ที่ใช้งานอยู่ กล่องที่มี H100 หลายตัวสามารถรันโมเดลนี้ใน FP8 ด้วย throughput ที่จริงจัง และการ quantized แบบ INT4 สามารถวางลงบนการ์ดขนาด 80GB ใบเดียวได้
ค่าใช้จ่ายในที่นี้คือค่าฮาร์ดแวร์ ไม่ใช่ค่าลิขสิทธิ์ หากคุณมี GPU ที่ว่างอยู่แล้ว นี่เป็นเส้นทางฟรีที่ทนทานที่สุด เพราะไม่สามารถถูกจำกัดอัตราการใช้งาน, ถูกยกเลิก หรือถูกถอนออกได้
ดึงน้ำหนักโมเดล
pip install -U "huggingface_hub[cli]"
huggingface-cli login
huggingface-cli download deepseek-ai/DeepSeek-V4-Flash \
--local-dir ./models/deepseek-v4-flash
คาดการณ์น้ำหนักประมาณ 500GB ที่ FP8 โปรดสำรองพื้นที่ดิสก์ให้เพียงพอ
ให้บริการด้วย vLLM
pip install "vllm>=0.9.0"
vllm serve deepseek-ai/DeepSeek-V4-Flash \
--tensor-parallel-size 4 \
--max-model-len 1048576 \
--dtype auto \
--port 8000
เมื่อเปิดใช้งานแล้ว ให้ชี้ไคลเอนต์ที่เข้ากันได้กับ OpenAI ไปยัง http://localhost:8000/v1 ปลายทางนี้ยอมรับรูปแบบคำขอเดียวกันกับ DeepSeek API แบบจ่ายเงิน; Apidog ถือว่าเป็น URL พื้นฐานอีกตัวหนึ่ง และคอลเล็กชันที่คุณบันทึกไว้ทั้งหมดจะยังคงทำงานได้โดยไม่ต้องแก้ไข
ตรวจสอบความเป็นจริงของฮาร์ดแวร์
| รุ่น | การ์ดขั้นต่ำ (FP8) | การ์ดขั้นต่ำ (INT4) | ปริมาณงานที่สมจริง |
|---|---|---|---|
| V4-Flash | 2 × H100 80GB | 1 × H100 80GB | 50 ถึง 150 โทเค็น/วินาที |
| V4-Pro | 16 × H100 80GB | 8 × H100 80GB | ขึ้นอยู่กับคลัสเตอร์ |
หากคุณไม่มีการ์ดว่างอยู่ การคำนวณมักจะเอื้อประโยชน์ให้กับการใช้ API มากกว่าการเช่า GPU รายชั่วโมง เส้นทางที่โฮสต์ด้วยตัวเองส่วนใหญ่เหมาะสำหรับทีมที่มีความสามารถในการประมวลผลอยู่แล้วหรือมีข้อกำหนดด้านการปฏิบัติตามกฎระเบียบที่เข้มงวด
เส้นทางที่ 3: OpenRouter บริการฟรี
OpenRouter เป็นเกตเวย์ระดับคำขอที่รวมโมเดลแบบ open-weights และ closed models ไว้ภายใต้ API เดียว แพลตฟอร์มนี้มักจะเปิดบริการฟรีสำหรับ DeepSeek รุ่นใหม่ และรูปแบบนี้ก็ยังคงใช้ได้กับ V3, V3.1 และ V3.2

การตั้งค่า
- สมัครสมาชิกที่ openrouter.ai
- สร้างคีย์ API
- ตรวจสอบแคตตาล็อกโมเดลสำหรับ
deepseek/deepseek-v4-proหรือdeepseek/deepseek-v4-flash; รุ่นฟรีมักจะมีคำต่อท้ายว่า:free - เรียกใช้ด้วย SDK ที่เข้ากันได้กับ OpenAI
from openai import OpenAI
client = OpenAI(
api_key=OPENROUTER_KEY,
base_url="https://openrouter.ai/api/v1",
)
response = client.chat.completions.create(
model="deepseek/deepseek-v4-flash:free",
messages=[{"role": "user", "content": "Write a Python CLI for semver bumping."}],
)
print(response.choices[0].message.content)
ขีดจำกัด
บริการฟรีบน OpenRouter มักจะจำกัดที่คำขอไม่กี่ร้อยครั้งต่อวันต่อคีย์ และลดลำดับความสำคัญภายใต้ภาระงานที่สูง เหมาะสำหรับการสร้างต้นแบบ แต่ไม่น่าเชื่อถือสำหรับการใช้งานจริง
เส้นทางที่ 4: Hugging Face Inference Providers
Hugging Face มีบริการโฮสต์ Inference ที่เปิดให้ใช้ V4 checkpoint หลังจากที่เปิดตัวไม่นาน แม้ว่าจะมีข้อจำกัดด้านอัตราการใช้งานและเวลาแฝงที่ผันผวน แต่ก็สามารถเรียกใช้ได้ฟรี
from huggingface_hub import InferenceClient
client = InferenceClient(model="deepseek-ai/DeepSeek-V4-Flash")
response = client.chat_completion(
messages=[{"role": "user", "content": "Summarize the V4 technical report in 5 bullets."}],
max_tokens=512,
)
print(response.choices[0].message.content)
โทเค็น HF นั้นฟรี สำหรับการใช้งานที่หนักขึ้น ให้สมัครเป็นบัญชี Pro; การจำกัดอัตราการใช้งานจะผ่อนคลายลง แต่ค่าใช้จ่ายยังคงน้อยกว่า API อย่างเป็นทางการมากสำหรับการทำงานที่เทียบเท่ากัน
เส้นทางที่ 5: เครดิตทดลองบน Colab, Kaggle, RunPod และ Lambda
ผู้ให้บริการเช่า GPU รายใหญ่ทุกรายมีเครดิตทดลอง หากใช้อย่างชาญฉลาด เครดิตเหล่านี้สามารถครอบคลุมการทดลอง V4-Flash ครั้งเดียวโดยไม่ต้องเสียเงินจริง
- Google Colab. บริการฟรีระดับ T4 มีขนาดเล็กเกินไปสำหรับ V4 Colab Pro+ ให้ 500 compute units ต่อเดือน ซึ่งเพียงพอสำหรับการทดลอง V4-Flash สองสามครั้งบน A100
- Kaggle. ชั่วโมง GPU ฟรีรายสัปดาห์บน T4 และ P100 มีขนาดเล็กเกินไปสำหรับ V4-Pro บางครั้งเพียงพอสำหรับการทดลอง V4-Flash แบบ Quantized
- RunPod. เครดิตทดลอง $10 ครอบคลุมการใช้งาน H100 สองสามชั่วโมง เพียงพอที่จะเปิด vLLM, รันชุดทดสอบ Benchmark และปิดเครื่อง
- Lambda. โปรโมชันฟรีเป็นครั้งคราวสำหรับ H100 และ H200; ตรวจสอบหน้าลงทะเบียนสำหรับข้อเสนอที่ใช้งานอยู่
ไม่มีเส้นทางใดเหล่านี้ที่เป็นเส้นทางฟรีระยะยาว เหมาะสำหรับการทดลองที่มีขอบเขตจำกัดเท่านั้น
สร้างคอลเล็กชัน Apidog ที่ไม่ขึ้นกับผู้ให้บริการ
ประโยชน์ที่ใช้งานได้จริงของเส้นทางฟรีจำนวนมากนี้คือคุณสามารถทดสอบพรอมต์เดียวกันกับทุกเส้นทางโดยไม่ต้องทำงานซ้ำ ขั้นตอนการทำงาน:
- ดาวน์โหลด Apidog
- สร้างคอลเล็กชันเดียวที่มีสี่สภาพแวดล้อม:
chat(ตัวยึด),deepseek(https://api.deepseek.com/v1),openrouter(https://openrouter.ai/api/v1),self-hosted(http://localhost:8000/v1) - บันทึกคำขอ POST เดียวไปยัง
{{BASE_URL}}/chat/completions - จัดเก็บคีย์ของผู้ให้บริการแต่ละรายเป็นตัวแปรลับ เพื่อให้เนื้อหาคำขอเหมือนกันในทุกสภาพแวดล้อม
- สลับสภาพแวดล้อมเพื่อ A/B ทดสอบพรอมต์เดียวกันกับทุกแบ็กเอนด์
นี่คือรูปแบบเดียวกับที่ใช้สำหรับ คอลเล็กชัน GPT-5.5 บริการฟรี; เครื่องมือเดียว, ทุกผู้ให้บริการ, ไม่มีการทำงานซ้ำ
คุณควรเลือกเส้นทางฟรีเส้นทางไหน?
กฎเกณฑ์สี่ข้อครอบคลุมการตัดสินใจส่วนใหญ่
- ฉันต้องการสร้างความคิดเห็นภายในห้านาที ใช้ chat.deepseek.com
- ฉันต้องการสร้างต้นแบบผลิตภัณฑ์ ใช้บริการฟรีของ OpenRouter จนกว่าจะถึงขีดจำกัด จากนั้นเติมเงินใน DeepSeek
- ฉันมี GPU และต้องปฏิบัติตามข้อกำหนด โฮสต์ V4-Flash ด้วยตัวเองบน vLLM
- ฉันต้องการใช้งานฟรีในระยะยาว ไม่มีสิ่งนั้น ทุกบริการฟรีที่โฮสต์จะมีขีดจำกัดบางอย่าง จับคู่ chat.deepseek.com สำหรับงานแบบโต้ตอบกับการเติมเงินเล็กน้อยสำหรับระบบอัตโนมัติ
เมื่อไหร่ที่ควรย้ายออกจากบริการฟรี
สัญญาณสามข้อที่บ่งบอกว่าคุณใช้งานเกินระดับฟรีแล้ว
- คุณถูกจำกัดอัตราการใช้งานมากกว่าวันละครั้ง นั่นหมายความว่าภาระงานมีขนาดใหญ่พอที่จะได้รับงบประมาณ
- คุณต้องการ SLA (ข้อตกลงระดับบริการ) บริการฟรีไม่มี SLA API อย่างเป็นทางการมี
- คุณต้องการบันทึก, ตรวจสอบ หรือผ่านการปฏิบัติตามข้อกำหนด API แบบจ่ายเงินจะส่งคืนบันทึกการเรียกเก็บเงินที่ชัดเจน; บริการฟรีส่วนใหญ่ของผู้รวบรวมไม่มี
เมื่อถึงจุดใดจุดหนึ่งเหล่านี้ ให้ย้ายไปใช้ API อย่างเป็นทางการ การเติมเงินขั้นต่ำคือ $2 และราคาต่อโทเค็นนั้นต่ำที่สุดในกลุ่มบริการระดับสูงสุด
คำถามที่พบบ่อย
chat.deepseek.com ฟรีจริงหรือ?ใช่ ไม่มีบัตรเครดิต ไม่มีนาฬิกาจับเวลาทดลอง บริการนี้มีการจำกัดการใช้งานแบบนุ่มนวลแต่ไม่ได้ต้องจ่ายเงิน
ฉันต้องมีบัญชี Hugging Face เพื่อดาวน์โหลดน้ำหนักโมเดลหรือไม่?ในทางเทคนิคไม่จำเป็น เพราะ repo เป็นแบบสาธารณะ ในทางปฏิบัติจำเป็น; บัญชีที่ลงชื่อเข้าใช้จะช่วยให้คุณได้รับการจำกัดอัตราการดาวน์โหลดที่ดีขึ้น
เส้นทางฟรีใดที่รัน V4-Pro จริง?chat.deepseek.com รัน V4-Pro เต็มรูปแบบ บริการฟรีของ OpenRouter มักจะใช้ V4-Flash หากคุณต้องการผลลัพธ์จาก V4-Pro และไม่ต้องการจ่ายเงิน การใช้แชทบนเว็บเป็นเส้นทางที่เชื่อถือได้
ฉันสามารถนำบริการฟรีไปใช้กับผลิตภัณฑ์ได้หรือไม่?ไม่ควรอย่างรับผิดชอบ บริการฟรีมีการจำกัดอัตราการใช้งาน, มีการเปลี่ยนแปลงข้อกำหนด และบางครั้งก็หายไป หากคุณกำลังนำ V4 ไปให้บริการลูกค้า ให้ใช้ API แบบจ่ายเงินหรือโฮสต์ด้วยตัวเอง
การโฮสต์ด้วยตัวเองฟรีจริงหรือ?ใบอนุญาตฟรี ฮาร์ดแวร์ไม่ฟรี หากคุณมี GPU ที่ว่างอยู่แล้ว ค่าใช้จ่ายส่วนเพิ่มคือค่าไฟฟ้า หากคุณเช่า การคำนวณมักจะแพ้ API แบบจ่ายเงิน
จะมีบริการฟรีของ Apidog สำหรับการทดสอบหรือไม่?Apidog เองก็ฟรีสำหรับการออกแบบและทดสอบ API; จะมีค่าใช้จ่ายเมื่อคุณเรียกใช้ API แบบจ่ายเงินผ่าน Apidog ดังนั้น ใช่ คุณสามารถใช้พื้นที่ทำงาน Apidog ฟรีร่วมกับ chat.deepseek.com หรือ OpenRouter เพื่อให้ได้ขั้นตอนการทำงานที่ฟรีทั้งหมด
