DeepSeek V4 คืออะไร

Ashley Innocent

Ashley Innocent

24 April 2026

DeepSeek V4 คืออะไร

Apidog สำหรับองค์กร

ติดตั้งภายในองค์กร

SSO & RBAC

รองรับ SOC 2

สำรวจ Apidog Enterprise

DeepSeek เปิดตัว V4 เมื่อวันที่ 23 เมษายน 2026 ซึ่งไม่ใช่การอัปเดตย่อย ห้องปฏิบัติการหางโจวได้เปิดตัวเช็คพอยต์สี่ตัวพร้อมกัน โดยมี DeepSeek-V4-Pro เป็นตัวท็อป ด้วยพารามิเตอร์รวม 1.6 ล้านล้านตัว, ใบอนุญาต MIT และวินโดว์บริบท 1 ล้านโทเค็น DeepSeek-V4-Flash ซึ่งเป็นรุ่นน้องที่เล็กกว่า มีพารามิเตอร์ 2.84 แสนล้านตัว พร้อมบริบทและน้ำหนักเปิด (open weights) เดียวกัน ผลการทดสอบแสดงให้เห็นว่ารุ่น Pro เหนือกว่า Claude Opus 4.6 ใน LiveCodeBench และ Codeforces และใกล้เคียงกับ GPT-5.4 xHigh ใน MMLU-Pro

หากคุณกำลังตัดสินใจว่าจะเปลี่ยนจาก Claude, GPT-5.5 หรือ Qwen มาใช้ DeepSeek V4 หรือไม่ คู่มือนี้จะอธิบายว่าโมเดลนี้คืออะไร มีอะไรเปลี่ยนแปลงไปจาก V3.2 บ้าง ตัวเลือกสถาปัตยกรรมที่เป็นปัจจัยขับเคลื่อนผลการทดสอบ และจะใช้งานได้ที่ไหนในวันนี้

สำหรับคู่มือการใช้งานสำหรับนักพัฒนาที่เกี่ยวข้อง เรามี คู่มือ API ของ DeepSeek V4, คู่มือการเข้าถึงฟรี และ คู่มือการใช้งาน DeepSeek V4 ฉบับเต็ม รูปแบบคำขอเข้ากันได้ดีกับรูปแบบของ OpenAI ดังนั้นคุณสามารถสร้างคอลเลกชันล่วงหน้าใน Apidog ก่อนที่คุณจะได้รับคีย์

ปุ่ม

สรุป

DeepSeek V4 คืออะไรกันแน่

DeepSeek V4 เป็นรุ่นต่อจาก V3 และ V3.2 ที่ทำให้ห้องปฏิบัติการเป็นที่รู้จักเมื่อปีที่แล้ว สถาปัตยกรรมยังคงเป็น Mixture-of-Experts แต่รูปร่างของโมเดลได้เปลี่ยนไป V4-Pro เปิดใช้งานเพียง 4.9 หมื่นล้านพารามิเตอร์จากทั้งหมด 1.6 ล้านล้านพารามิเตอร์ต่อโทเค็น ดังนั้นค่าใช้จ่ายในการประมวลผลต่อโทเค็นจึงใกล้เคียงกับโมเดลหนาแน่นขนาด 5 หมื่นล้านพารามิเตอร์มากกว่าระบบแนวหน้าที่มีพารามิเตอร์เป็นล้านล้านตัว อ่านรายงานทางเทคนิคฉบับเต็มได้ที่ การ์ดโมเดล DeepSeek V4

ภาพรวมโมเดล DeepSeek V4

มีสี่เช็คพอยต์ที่เปิดตัวพร้อมกัน:

ทั้งสี่รุ่นอยู่ภายใต้ใบอนุญาต MIT ซึ่งเป็นเรื่องราวที่น่าสนใจ GPT-5.5 เป็นแบบปิดและมีค่าใช้จ่าย 5 ดอลลาร์ต่อล้านโทเค็นอินพุต; Claude Opus 4.6 เป็นแบบปิดและมีราคาใกล้เคียง 15 ดอลลาร์ DeepSeek V4-Pro มีน้ำหนักโมเดลแบบเปิดที่คุณสามารถดาวน์โหลด, ทำสำเนา, ปรับแต่ง และใช้งานบนฮาร์ดแวร์ของคุณเองได้โดยไม่มีค่าธรรมเนียมใบอนุญาต

มีอะไรเปลี่ยนแปลงจาก V3.2 บ้าง

V3 มีความสามารถในการให้เหตุผลและการเขียนโค้ดที่แข่งขันได้อยู่แล้ว V4 ได้เขียนใหม่ทั้งส่วนของ attention stack และ pipeline การฝึกอบรม เพื่อผลักดันบริบทที่ยาวขึ้นและประสิทธิภาพพร้อมกัน

ความสามารถ V3.2 V4-Pro
พารามิเตอร์ทั้งหมด 685B 1.6T
พารามิเตอร์ที่ใช้งานอยู่ 37B 49B
วินโดว์บริบท 128K 1M
FLOPs ในการอนุมาน (บริบท 1M) พื้นฐาน 27% ของ V3.2
แคช KV (บริบท 1M) พื้นฐาน 10% ของ V3.2
ความแม่นยำ FP8 FP4 + FP8 ผสม
ใบอนุญาต DeepSeek License MIT
โหมดการให้เหตุผล เดี่ยว สาม

สามสิ่งที่เป็นตัวขับเคลื่อนการก้าวกระโดดนี้ ประการแรก, attention stack แบบไฮบริดใหม่ที่จับคู่ Compressed Sparse Attention กับ Heavily Compressed Attention ซึ่งเป็นที่มาของตัวเลขแคช KV 10% ประการที่สอง, Manifold-Constrained Hyper-Connections ที่ช่วยรักษาความเสถียรของเกรเดียนต์ในระดับความลึกที่ V4 ต้องการ ประการที่สาม, การเปลี่ยนไปใช้ Muon optimizer เพื่อการคอนเวอร์เจนซ์ที่เร็วขึ้น ชุดข้อมูลการฝึกอบรมยังเติบโตเกิน 32 ล้านล้านโทเค็น และการฝึกอบรมหลังการเรียนรู้ใช้ไปป์ไลน์สองขั้นตอนที่บ่มเพาะผู้เชี่ยวชาญเฉพาะด้านก่อน จากนั้นจึงรวมเข้าด้วยกันด้วย on-policy distillation

แผนภาพสถาปัตยกรรม DeepSeek V4

ผลการทดสอบที่สำคัญ

ตัวเลขที่ DeepSeek รายงานแสดงให้เห็นว่า V4-Pro อยู่ในระดับแนวหน้าสำหรับการเขียนโค้ดและความรู้ โดยมีช่องว่างในด้านการดึงข้อมูลบริบทขนาดยาว

การเปรียบเทียบผลการทดสอบ DeepSeek V4

สำหรับ V4-Flash ซึ่งเป็นรุ่นที่เล็กกว่า DeepSeek รายงานว่า MMLU-Pro 86.2, GPQA Diamond 88.1, LiveCodeBench 91.6, Codeforces 3052, และ SWE Verified 79.0 นั่นเป็นระดับแนวหน้าสำหรับโมเดลที่ใช้งานอยู่ 1.3 หมื่นล้านพารามิเตอร์ และเป็นเหตุผลว่าทำไม Flash จึงเป็นเช็คพอยต์ที่น่าสนใจสำหรับผู้ที่ใช้งานบนฮาร์ดแวร์ของตนเอง ดู การ์ด DeepSeek V4-Flash สำหรับตารางฉบับเต็ม

โดยสรุปคือ: V4-Pro ชนะด้านการเขียนโค้ด ชนะด้านการเรียกคืนข้อมูลเชิงข้อเท็จจริงแบบปลายเปิด ตามหลัง Gemini 3.1 Pro ในด้านความรู้ทั่วไป และตามหลัง Claude Opus ในการทดสอบการดึงข้อมูล 1 ล้านโทเค็น หากงานของคุณคือการเขียนโค้ดแบบ agentic หรือการวิเคราะห์ที่ต้องใช้การให้เหตุผลเป็นหลัก V4-Pro ก็เป็นตัวเลือกที่น่าสนใจ หากเป็นการดึงข้อมูลแบบหาเข็มในกองฟางจากล้านโทเค็น Claude ยังคงได้เปรียบ

โหมดการให้เหตุผลสามโหมด

เช็คพอยต์ V4 ทุกตัวมีโหมดการให้เหตุผลสามแบบ และการเลือกโหมดที่เหมาะสมเป็นปัจจัยสำคัญที่สุดในการควบคุมค่าใช้จ่าย

สลับระหว่างโหมดเหล่านี้ด้วยพารามิเตอร์ thinking_mode ตัวเดียวใน API หรือแฟล็กในสคริปต์การอนุมานภายในเครื่อง DeepSeek แนะนำการสุ่มตัวอย่างโดยใช้ temperature=1.0, top_p=1.0 สำหรับทั้งสามโหมด

สถาปัตยกรรมในภาษาที่เข้าใจง่าย

เอกสารสถาปัตยกรรม V4 นั้นมีความซับซ้อน แต่มีสามทางเลือกที่อธิบายเรื่องประสิทธิภาพ

  1. Hybrid attention (กลไกความสนใจแบบไฮบริด) เลเยอร์ของ Transformer ส่วนใหญ่ใช้ Compressed Sparse Attention ซึ่งจะคงกลุ่มโทเค็นที่มีค่าสูงขนาดเล็กไว้ให้ได้รับความสนใจอย่างเต็มที่และบีบอัดส่วนที่เหลือ เลเยอร์จำนวนหนึ่งใช้ Heavily Compressed Attention ซึ่งมีค่าใช้จ่ายใกล้เคียงกับเชิงเส้นในความยาวของลำดับ การผสมผสานนี้คือสิ่งที่ทำให้ได้ FLOPs 27% และแคช KV 10% ที่ 1 ล้านโทเค็น
  2. Manifold-Constrained Hyper-Connections แทนที่จะใช้ residual connections แบบธรรมดา V4 ห่อหุ้ม residuals ของแต่ละเลเยอร์ไว้ในข้อจำกัดที่ช่วยให้ activations อยู่บน manifold ที่เสถียร ผลกระทบในทางปฏิบัติคือคุณสามารถซ้อนเลเยอร์ได้มากขึ้นโดยไม่มีความวุ่นวายของ gradient
  3. Muon optimizer ใช้แทน AdamW สำหรับการฝึกอบรมส่วนใหญ่ Muon คอนเวอร์เจนซ์ได้เร็วกว่าและจัดการกับ gradient norms ขนาดใหญ่ที่โมเดล MoE สร้างขึ้นได้ดีกว่า AdamW

แนวคิดเหล่านี้ไม่มีสิ่งใดที่แปลกใหม่ด้วยตัวมันเอง การมีส่วนร่วมของ V4 คือการทำให้ทั้งสามสิ่งนี้ทำงานร่วมกันในระดับพารามิเตอร์ล้านล้านตัวโดยไม่ทำให้การฝึกอบรมล้มเหลว

สถานะการใช้งานในปัจจุบัน

DeepSeek เปิดตัวเช็คพอยต์ทั้งสี่และ API ในวันเดียวกัน นี่คือภาพรวม ณ วันที่ 24 เมษายน 2026

ช่องทาง การเข้าถึง
chat.deepseek.com แชทเว็บฟรี, V4-Pro เป็นค่าเริ่มต้น, ต้องเข้าสู่ระบบ
DeepSeek API ใช้งานได้แล้วที่ api.deepseek.com; ID โมเดลคือ deepseek-v4-pro, deepseek-v4-flash
น้ำหนักโมเดลบน Hugging Face V4-Pro, V4-Flash, ทั้งคู่เป็น MIT
ModelScope น้ำหนักโมเดลสำรองสำหรับผู้ใช้ในจีน
OpenRouter และผู้รวบรวม คาดว่าจะพร้อมในไม่กี่วัน; รูปแบบการเปิดตัว DeepSeek ทั่วไป
deepseek-chat / deepseek-reasoner เลิกใช้งานวันที่ 24 กรกฎาคม 2026

ประกาศการเลิกใช้งานนี้ควรให้ความสนใจเป็นพิเศษ หากคุณยังคงเรียกใช้ deepseek-chat ในการใช้งานจริง คุณมีเวลาสามเดือนในการย้ายไปใช้ deepseek-v4-pro หรือ deepseek-v4-flash

เปรียบเทียบกับ GPT-5.5 และ Claude อย่างไร

การเปรียบเทียบสามทางที่ทีมส่วนใหญ่ให้ความสนใจ:

จะสร้างอะไรด้วย DeepSeek V4

สี่ประเภทงานที่เข้ากันได้ดีกับจุดแข็งของ V4:

  1. วงจรการเขียนโค้ดแบบ Agentic ตัวเลข SWE Verified 79.0 และ Codeforces 3206 ชี้ตรงไปที่การดีบักหลายไฟล์, การ refactor ที่รับรู้ถึง repo และการแก้ไขการทดสอบแบบอัตโนมัติ จับคู่กับไคลเอนต์ API ที่ดีอย่าง Apidog เพื่อตรวจสอบทุกคำขอและคำตอบในขณะที่คุณปรับแต่งพรอมต์
  2. การให้เหตุผลจากเอกสารขนาดยาว 1 ล้านโทเค็นเพียงพอสำหรับ monorepos ส่วนใหญ่, สัญญาต่างๆ ส่วนใหญ่ และชุดข้อมูลวิจัยส่วนใหญ่ โหมด Think High เป็นโหมดที่เหมาะสมสำหรับเรื่องนี้
  3. ผลิตภัณฑ์ AI ที่โฮสต์เอง หากข้อกำหนดด้านการปฏิบัติตามกฎระเบียบของคุณต้องการการอนุมานภายในองค์กร V4-Flash เป็นโมเดลน้ำหนักเปิดตัวแรกที่สามารถแข่งขันกับ API แนวหน้าแบบปิดในด้านคุณภาพได้
  4. การวิจัยและการปรับแต่ง เช็คพอยต์ Base มีไว้สำหรับการฝึกอบรมแบบกำหนดเองโดยเฉพาะ จับคู่กับข้อมูลโดเมนของคุณ แล้วคุณจะได้โมเดลผู้เชี่ยวชาญระดับโปรดักชัน

กรณีที่ไม่เหมาะสม: การจำแนกประเภทปริมาณมาก, การดึงฝังตัว (embedding retrieval) หรือการสนทนาด้วยพรอมต์สั้น V4-Flash ยังคงเป็นการใช้เกินความจำเป็นสำหรับงานเหล่านั้น และเช็คพอยต์ DeepSeek รุ่นเก่ากว่ามีค่าใช้จ่ายน้อยกว่า

ราคาโดยสรุป

DeepSeek ยังไม่ได้เผยแพร่ตารางอัตรา API ฉบับสมบูรณ์ในขณะที่เขียนนี้ V3.2 มีค่าใช้จ่ายประมาณ 0.28 ดอลลาร์ต่อล้านโทเค็นอินพุต และ 0.42 ดอลลาร์ต่อล้านโทเค็นเอาต์พุต และห้องปฏิบัติการนี้มีประวัติในการรักษาราคาของซีรีส์ V ให้ใกล้เคียงกับระดับต่ำสุดนั้น คาดว่า V4-Flash จะอยู่ในช่วงราคาเดียวกัน และ V4-Pro จะมีราคาสูงขึ้นเล็กน้อย คู่แข่งแบบปิดมีราคาอยู่ที่ 5 ถึง 15 ดอลลาร์ต่อล้านโทเค็นอินพุต ดังนั้นแม้จะเพิ่มขึ้น 3 เท่าจาก V3.2 DeepSeek ก็ยังคงต่ำกว่าค่ากลางของ API แนวหน้าเป็นอย่างมาก ติดตามตัวเลขปัจจุบันได้ที่ หน้าการกำหนดราคาของ DeepSeek

วิธีทดสอบ V4 ในวันนี้

สามช่องทาง จัดอันดับตามเวลาที่ใช้ในการได้รับโทเค็นแรก

  1. แชทเว็บ เปิด chat.deepseek.com และลงชื่อเข้าใช้ V4-Pro เป็นค่าเริ่มต้น; สลับไปที่ Think High ใน UI ฟรี ไม่ต้องใช้บัตร ใช้งานได้ทันที
  2. API ขอคีย์, ชี้ไคลเอนต์ของคุณไปที่ https://api.deepseek.com, ตั้งค่า "model": "deepseek-v4-pro", แล้วเริ่มใช้งานได้เลย รูปแบบคำขอเข้ากันได้กับ OpenAI ดังนั้นไคลเอนต์ OpenAI ที่มีอยู่สามารถทำงานได้เพียงแค่เปลี่ยน URL พื้นฐาน ดูคู่มือฉบับเต็มได้ที่ คู่มือ API ของ DeepSeek V4
  3. น้ำหนักโมเดลภายในเครื่อง ดึงจาก Hugging Face หรือ ModelScope V4-Flash สามารถทำงานบน H100 2 ถึง 4 ตัว; V4-Pro ต้องการคลัสเตอร์ขนาดใหญ่ โค้ดอนุมานอยู่ในโฟลเดอร์ /inference ของ repo โมเดล

สำหรับคู่มือฉบับเต็ม รวมถึงการวนซ้ำพรอมต์ที่ใช้ Apidog โปรดดู วิธีการใช้ DeepSeek V4 หากต้องการให้ค่าใช้จ่ายเป็นศูนย์ โปรดดู วิธีการใช้ DeepSeek V4 ฟรี ดาวน์โหลด Apidog และสร้างคอลเลกชันของคุณล่วงหน้า; รูปแบบที่เข้ากันได้กับ OpenAI หมายความว่าคำขอเดียวสามารถใช้งานได้กับ DeepSeek, OpenAI และ API แนวหน้าอื่นๆ ทุกตัว

คำถามที่พบบ่อย

DeepSeek V4 เป็นโอเพ่นซอร์สจริงหรือ?ใช่ เช็คพอยต์ทั้งสี่อยู่ภายใต้ใบอนุญาต MIT ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์, แก้ไข และแจกจ่ายซ้ำได้โดยไม่ต้องมีข้อตกลงการใช้งานแยกต่างหาก

ฉันจำเป็นต้องมี GPU cluster เพื่อรัน V4-Flash หรือไม่?คุณต้องใช้ H100 หรือ H200 สองถึงสี่ตัวสำหรับ V4-Flash ที่ความแม่นยำเต็มที่ ซึ่งน้อยลงหากคุณทำการ quantize V4-Pro ต้องการคลัสเตอร์ที่แท้จริง หากคุณต้องการลองใช้ V4 โดยไม่มีฮาร์ดแวร์ ให้ใช้ API หรือ chat.deepseek.com

V4 จะเข้าสู่ DeepSeek API เมื่อใด?ใช้งานได้แล้วตั้งแต่วันที่ 23 เมษายน 2026 ID โมเดลคือ deepseek-v4-pro และ deepseek-v4-flash ID deepseek-chat และ deepseek-reasoner รุ่นเก่าจะเลิกใช้งานในวันที่ 24 กรกฎาคม 2026

V4 เปรียบเทียบกับ Kimi และ Qwen อย่างไร?V4-Pro มีคะแนน LiveCodeBench และ Codeforces สูงกว่า Kimi K2 และ Qwen 3 Max ในตารางที่ DeepSeek รายงาน ทั้งสามเป็นระบบ MoE แบบน้ำหนักเปิดที่มีโปรไฟล์การใช้งานที่คล้ายกัน เลือกตามผลการทดสอบที่ใกล้เคียงกับภาระงานของคุณมากที่สุด

ฉันสามารถ fine-tune V4 ด้วยข้อมูลของตัวเองได้หรือไม่?ได้ เช็คพอยต์ Base มีไว้สำหรับเรื่องนั้น; จับคู่กับข้อมูลโดเมนของคุณและไปป์ไลน์ SFT มาตรฐาน ใบอนุญาต MIT ครอบคลุมการแจกจ่ายโมเดลที่ได้ไปใช้ในเชิงพาณิชย์

V4 จะทำงานร่วมกับเครื่องมือที่เข้ากันได้กับ OpenAI ที่มีอยู่ของฉันได้หรือไม่?ได้ API รองรับทั้งรูปแบบข้อความของ OpenAI และ Anthropic ที่ https://api.deepseek.com และ https://api.deepseek.com/anthropic ตามลำดับ ไคลเอนต์ OpenAI ที่มีอยู่ส่วนใหญ่สามารถทำงานได้ด้วยการเปลี่ยน URL พื้นฐานเพียงครั้งเดียว ดู คู่มือการใช้งาน API ของ GPT-5.5 ที่เกี่ยวข้องสำหรับรูปแบบที่คล้ายกัน

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API

DeepSeek V4 คืออะไร