DeepSeek เปิดตัว V4 เมื่อวันที่ 23 เมษายน 2026 ซึ่งไม่ใช่การอัปเดตย่อย ห้องปฏิบัติการหางโจวได้เปิดตัวเช็คพอยต์สี่ตัวพร้อมกัน โดยมี DeepSeek-V4-Pro เป็นตัวท็อป ด้วยพารามิเตอร์รวม 1.6 ล้านล้านตัว, ใบอนุญาต MIT และวินโดว์บริบท 1 ล้านโทเค็น DeepSeek-V4-Flash ซึ่งเป็นรุ่นน้องที่เล็กกว่า มีพารามิเตอร์ 2.84 แสนล้านตัว พร้อมบริบทและน้ำหนักเปิด (open weights) เดียวกัน ผลการทดสอบแสดงให้เห็นว่ารุ่น Pro เหนือกว่า Claude Opus 4.6 ใน LiveCodeBench และ Codeforces และใกล้เคียงกับ GPT-5.4 xHigh ใน MMLU-Pro
หากคุณกำลังตัดสินใจว่าจะเปลี่ยนจาก Claude, GPT-5.5 หรือ Qwen มาใช้ DeepSeek V4 หรือไม่ คู่มือนี้จะอธิบายว่าโมเดลนี้คืออะไร มีอะไรเปลี่ยนแปลงไปจาก V3.2 บ้าง ตัวเลือกสถาปัตยกรรมที่เป็นปัจจัยขับเคลื่อนผลการทดสอบ และจะใช้งานได้ที่ไหนในวันนี้
สำหรับคู่มือการใช้งานสำหรับนักพัฒนาที่เกี่ยวข้อง เรามี คู่มือ API ของ DeepSeek V4, คู่มือการเข้าถึงฟรี และ คู่มือการใช้งาน DeepSeek V4 ฉบับเต็ม รูปแบบคำขอเข้ากันได้ดีกับรูปแบบของ OpenAI ดังนั้นคุณสามารถสร้างคอลเลกชันล่วงหน้าใน Apidog ก่อนที่คุณจะได้รับคีย์
สรุป
- DeepSeek V4 คือกลุ่มโมเดล Mixture-of-Experts ที่เปิดตัวเมื่อวันที่ 23 เมษายน 2026 ภายใต้ ใบอนุญาต MIT
- มีสี่เช็คพอยต์ที่เปิดตัวพร้อมกัน: V4-Pro, V4-Pro-Base, V4-Flash, และ V4-Flash-Base
- V4-Pro มีพารามิเตอร์ทั้งหมด 1.6 ล้านล้านตัว โดยมีพารามิเตอร์ที่ใช้งานอยู่ 4.9 หมื่นล้านตัว; V4-Flash มีพารามิเตอร์ทั้งหมด 2.84 แสนล้านตัว โดยมีพารามิเตอร์ที่ใช้งานอยู่ 1.3 หมื่นล้านตัว
- ทั้งสองเวอร์ชันมี วินโดว์บริบท 1 ล้านโทเค็น และโหมดการให้เหตุผลสามโหมด: Non-Think, Think High, และ Think Max
- คะแนนเด่น: LiveCodeBench 93.5, Codeforces 3206, MMLU-Pro 87.5 (รุ่น Pro)
- API ใช้งานได้แล้วที่
api.deepseek.comโดยมีdeepseek-v4-proและdeepseek-v4-flashเป็น ID โมเดล; น้ำหนักโมเดลอยู่บน Hugging Face และ ModelScope
DeepSeek V4 คืออะไรกันแน่
DeepSeek V4 เป็นรุ่นต่อจาก V3 และ V3.2 ที่ทำให้ห้องปฏิบัติการเป็นที่รู้จักเมื่อปีที่แล้ว สถาปัตยกรรมยังคงเป็น Mixture-of-Experts แต่รูปร่างของโมเดลได้เปลี่ยนไป V4-Pro เปิดใช้งานเพียง 4.9 หมื่นล้านพารามิเตอร์จากทั้งหมด 1.6 ล้านล้านพารามิเตอร์ต่อโทเค็น ดังนั้นค่าใช้จ่ายในการประมวลผลต่อโทเค็นจึงใกล้เคียงกับโมเดลหนาแน่นขนาด 5 หมื่นล้านพารามิเตอร์มากกว่าระบบแนวหน้าที่มีพารามิเตอร์เป็นล้านล้านตัว อ่านรายงานทางเทคนิคฉบับเต็มได้ที่ การ์ดโมเดล DeepSeek V4

มีสี่เช็คพอยต์ที่เปิดตัวพร้อมกัน:
- DeepSeek-V4-Pro — รุ่นเรือธง พารามิเตอร์รวม 1.6 ล้านล้านตัว, ใช้งานอยู่ 4.9 หมื่นล้านตัว, บริบท 1M นี่คือรุ่นที่ทีมส่วนใหญ่จะเรียกใช้ผ่าน API
- DeepSeek-V4-Pro-Base — โมเดลพื้นฐานที่ได้รับการฝึกฝนล่วงหน้าโดยไม่มีการฝึกฝนเพิ่มเติม มุ่งเป้าไปที่นักวิจัยและทีมที่สร้างการปรับแต่งเฉพาะ
- DeepSeek-V4-Flash — รุ่นที่เน้นประสิทธิภาพ พารามิเตอร์รวม 2.84 แสนล้านตัว, ใช้งานอยู่ 1.3 หมื่นล้านตัว, บริบท 1M เท่ากัน กำหนดเป้าหมายสำหรับงานที่ต้องการความหน่วงต่ำและการใช้งานภายในเครื่องบน H100 สองหรือสามตัว
- DeepSeek-V4-Flash-Base — เช็คพอยต์พื้นฐานที่ตรงกันสำหรับ Flash
ทั้งสี่รุ่นอยู่ภายใต้ใบอนุญาต MIT ซึ่งเป็นเรื่องราวที่น่าสนใจ GPT-5.5 เป็นแบบปิดและมีค่าใช้จ่าย 5 ดอลลาร์ต่อล้านโทเค็นอินพุต; Claude Opus 4.6 เป็นแบบปิดและมีราคาใกล้เคียง 15 ดอลลาร์ DeepSeek V4-Pro มีน้ำหนักโมเดลแบบเปิดที่คุณสามารถดาวน์โหลด, ทำสำเนา, ปรับแต่ง และใช้งานบนฮาร์ดแวร์ของคุณเองได้โดยไม่มีค่าธรรมเนียมใบอนุญาต
มีอะไรเปลี่ยนแปลงจาก V3.2 บ้าง
V3 มีความสามารถในการให้เหตุผลและการเขียนโค้ดที่แข่งขันได้อยู่แล้ว V4 ได้เขียนใหม่ทั้งส่วนของ attention stack และ pipeline การฝึกอบรม เพื่อผลักดันบริบทที่ยาวขึ้นและประสิทธิภาพพร้อมกัน
| ความสามารถ | V3.2 | V4-Pro |
|---|---|---|
| พารามิเตอร์ทั้งหมด | 685B | 1.6T |
| พารามิเตอร์ที่ใช้งานอยู่ | 37B | 49B |
| วินโดว์บริบท | 128K | 1M |
| FLOPs ในการอนุมาน (บริบท 1M) | พื้นฐาน | 27% ของ V3.2 |
| แคช KV (บริบท 1M) | พื้นฐาน | 10% ของ V3.2 |
| ความแม่นยำ | FP8 | FP4 + FP8 ผสม |
| ใบอนุญาต | DeepSeek License | MIT |
| โหมดการให้เหตุผล | เดี่ยว | สาม |
สามสิ่งที่เป็นตัวขับเคลื่อนการก้าวกระโดดนี้ ประการแรก, attention stack แบบไฮบริดใหม่ที่จับคู่ Compressed Sparse Attention กับ Heavily Compressed Attention ซึ่งเป็นที่มาของตัวเลขแคช KV 10% ประการที่สอง, Manifold-Constrained Hyper-Connections ที่ช่วยรักษาความเสถียรของเกรเดียนต์ในระดับความลึกที่ V4 ต้องการ ประการที่สาม, การเปลี่ยนไปใช้ Muon optimizer เพื่อการคอนเวอร์เจนซ์ที่เร็วขึ้น ชุดข้อมูลการฝึกอบรมยังเติบโตเกิน 32 ล้านล้านโทเค็น และการฝึกอบรมหลังการเรียนรู้ใช้ไปป์ไลน์สองขั้นตอนที่บ่มเพาะผู้เชี่ยวชาญเฉพาะด้านก่อน จากนั้นจึงรวมเข้าด้วยกันด้วย on-policy distillation

ผลการทดสอบที่สำคัญ
ตัวเลขที่ DeepSeek รายงานแสดงให้เห็นว่า V4-Pro อยู่ในระดับแนวหน้าสำหรับการเขียนโค้ดและความรู้ โดยมีช่องว่างในด้านการดึงข้อมูลบริบทขนาดยาว

สำหรับ V4-Flash ซึ่งเป็นรุ่นที่เล็กกว่า DeepSeek รายงานว่า MMLU-Pro 86.2, GPQA Diamond 88.1, LiveCodeBench 91.6, Codeforces 3052, และ SWE Verified 79.0 นั่นเป็นระดับแนวหน้าสำหรับโมเดลที่ใช้งานอยู่ 1.3 หมื่นล้านพารามิเตอร์ และเป็นเหตุผลว่าทำไม Flash จึงเป็นเช็คพอยต์ที่น่าสนใจสำหรับผู้ที่ใช้งานบนฮาร์ดแวร์ของตนเอง ดู การ์ด DeepSeek V4-Flash สำหรับตารางฉบับเต็ม
โดยสรุปคือ: V4-Pro ชนะด้านการเขียนโค้ด ชนะด้านการเรียกคืนข้อมูลเชิงข้อเท็จจริงแบบปลายเปิด ตามหลัง Gemini 3.1 Pro ในด้านความรู้ทั่วไป และตามหลัง Claude Opus ในการทดสอบการดึงข้อมูล 1 ล้านโทเค็น หากงานของคุณคือการเขียนโค้ดแบบ agentic หรือการวิเคราะห์ที่ต้องใช้การให้เหตุผลเป็นหลัก V4-Pro ก็เป็นตัวเลือกที่น่าสนใจ หากเป็นการดึงข้อมูลแบบหาเข็มในกองฟางจากล้านโทเค็น Claude ยังคงได้เปรียบ
โหมดการให้เหตุผลสามโหมด
เช็คพอยต์ V4 ทุกตัวมีโหมดการให้เหตุผลสามแบบ และการเลือกโหมดที่เหมาะสมเป็นปัจจัยสำคัญที่สุดในการควบคุมค่าใช้จ่าย
- Non-Think — เส้นทางที่รวดเร็ว การสร้างแบบผ่านครั้งเดียว ไม่มี chain-of-thought ไม่มีโทเค็นการให้เหตุผลเพิ่มเติม ใช้สำหรับการจำแนกประเภท, การกำหนดเส้นทาง, สรุปย่อ และงานใดๆ ที่ความหน่วงมีความสำคัญมากกว่าความแม่นยำ
- Think High — ค่าเริ่มต้นสำหรับงานที่ซับซ้อน โมเดลจะเขียนโทเค็นการให้เหตุผลก่อนที่จะตอบคำถาม, วางแผนการเรียกใช้เครื่องมือ และตรวจสอบผลลัพธ์ของตนเอง ตรงกับสิ่งที่ GPT-5.5 เรียกว่า “thinking mode” และสิ่งที่ Claude เรียกว่า “extended thinking.”
- Think Max — ระดับสูงสุด การติดตามการให้เหตุผลที่ยาวนานขึ้น, การวิพากษ์วิจารณ์ตนเองที่เข้มข้นขึ้น และคำแนะนำวินโดว์บริบทขั้นต่ำ 384K โทเค็น นี่คือสิ่งที่ทำให้ได้คะแนน LiveCodeBench 93.5; คาดการณ์ว่าจะมีค่าใช้จ่ายโทเค็นที่เพิ่มขึ้นตามไปด้วย
สลับระหว่างโหมดเหล่านี้ด้วยพารามิเตอร์ thinking_mode ตัวเดียวใน API หรือแฟล็กในสคริปต์การอนุมานภายในเครื่อง DeepSeek แนะนำการสุ่มตัวอย่างโดยใช้ temperature=1.0, top_p=1.0 สำหรับทั้งสามโหมด
สถาปัตยกรรมในภาษาที่เข้าใจง่าย
เอกสารสถาปัตยกรรม V4 นั้นมีความซับซ้อน แต่มีสามทางเลือกที่อธิบายเรื่องประสิทธิภาพ
- Hybrid attention (กลไกความสนใจแบบไฮบริด) เลเยอร์ของ Transformer ส่วนใหญ่ใช้ Compressed Sparse Attention ซึ่งจะคงกลุ่มโทเค็นที่มีค่าสูงขนาดเล็กไว้ให้ได้รับความสนใจอย่างเต็มที่และบีบอัดส่วนที่เหลือ เลเยอร์จำนวนหนึ่งใช้ Heavily Compressed Attention ซึ่งมีค่าใช้จ่ายใกล้เคียงกับเชิงเส้นในความยาวของลำดับ การผสมผสานนี้คือสิ่งที่ทำให้ได้ FLOPs 27% และแคช KV 10% ที่ 1 ล้านโทเค็น
- Manifold-Constrained Hyper-Connections แทนที่จะใช้ residual connections แบบธรรมดา V4 ห่อหุ้ม residuals ของแต่ละเลเยอร์ไว้ในข้อจำกัดที่ช่วยให้ activations อยู่บน manifold ที่เสถียร ผลกระทบในทางปฏิบัติคือคุณสามารถซ้อนเลเยอร์ได้มากขึ้นโดยไม่มีความวุ่นวายของ gradient
- Muon optimizer ใช้แทน AdamW สำหรับการฝึกอบรมส่วนใหญ่ Muon คอนเวอร์เจนซ์ได้เร็วกว่าและจัดการกับ gradient norms ขนาดใหญ่ที่โมเดล MoE สร้างขึ้นได้ดีกว่า AdamW
แนวคิดเหล่านี้ไม่มีสิ่งใดที่แปลกใหม่ด้วยตัวมันเอง การมีส่วนร่วมของ V4 คือการทำให้ทั้งสามสิ่งนี้ทำงานร่วมกันในระดับพารามิเตอร์ล้านล้านตัวโดยไม่ทำให้การฝึกอบรมล้มเหลว
สถานะการใช้งานในปัจจุบัน
DeepSeek เปิดตัวเช็คพอยต์ทั้งสี่และ API ในวันเดียวกัน นี่คือภาพรวม ณ วันที่ 24 เมษายน 2026
| ช่องทาง | การเข้าถึง |
|---|---|
| chat.deepseek.com | แชทเว็บฟรี, V4-Pro เป็นค่าเริ่มต้น, ต้องเข้าสู่ระบบ |
| DeepSeek API | ใช้งานได้แล้วที่ api.deepseek.com; ID โมเดลคือ deepseek-v4-pro, deepseek-v4-flash |
| น้ำหนักโมเดลบน Hugging Face | V4-Pro, V4-Flash, ทั้งคู่เป็น MIT |
| ModelScope | น้ำหนักโมเดลสำรองสำหรับผู้ใช้ในจีน |
| OpenRouter และผู้รวบรวม | คาดว่าจะพร้อมในไม่กี่วัน; รูปแบบการเปิดตัว DeepSeek ทั่วไป |
deepseek-chat / deepseek-reasoner |
เลิกใช้งานวันที่ 24 กรกฎาคม 2026 |
ประกาศการเลิกใช้งานนี้ควรให้ความสนใจเป็นพิเศษ หากคุณยังคงเรียกใช้ deepseek-chat ในการใช้งานจริง คุณมีเวลาสามเดือนในการย้ายไปใช้ deepseek-v4-pro หรือ deepseek-v4-flash
เปรียบเทียบกับ GPT-5.5 และ Claude อย่างไร
การเปรียบเทียบสามทางที่ทีมส่วนใหญ่ให้ความสนใจ:
- ค่าใช้จ่าย V4-Pro และ V4-Flash มีน้ำหนักโมเดลแบบเปิด GPT-5.5 และ Claude Opus 4.6 ไม่มี หากคุณสามารถโฮสต์เองได้ V4 จะได้เปรียบในด้านเศรษฐศาสตร์ต่อหน่วยในระดับที่จริงจัง
- การเขียนโค้ด คะแนนของ V4-Pro ที่ 93.5 ใน LiveCodeBench และ 3206 ใน Codeforces เหนือกว่าทั้งผลการทดสอบของ GPT-5.5 และ Claude Opus ในชุดการทดสอบเดียวกัน
- ความกว้างของความรู้ Gemini 3.1 Pro ยังคงนำ MMLU-Pro ที่ 91.0 GPT-5.5 และ V4-Pro เสมอกันที่ 87.5 ใน SimpleQA-Verified V4 ชนะ GPT-5.5 และ Claude ด้วยคะแนนสองหลัก
- การดึงข้อมูลบริบทขนาดยาว Claude Opus ชนะ MRCR 1M ไปประมาณ 9 คะแนน หากงานของคุณคือ “หาประโยคเดียวในล้านโทเค็น” Claude ยังคงเป็นตัวเลือกที่ปลอดภัยกว่า
- ใบอนุญาต MIT หมายความว่าคุณสามารถจัดส่ง V4-Pro ภายในผลิตภัณฑ์ได้โดยไม่มีข้อตกลงการใช้งาน ไม่มีข้อเสนอใดๆ จาก OpenAI หรือ Anthropic ที่เทียบเท่าได้
จะสร้างอะไรด้วย DeepSeek V4
สี่ประเภทงานที่เข้ากันได้ดีกับจุดแข็งของ V4:
- วงจรการเขียนโค้ดแบบ Agentic ตัวเลข SWE Verified 79.0 และ Codeforces 3206 ชี้ตรงไปที่การดีบักหลายไฟล์, การ refactor ที่รับรู้ถึง repo และการแก้ไขการทดสอบแบบอัตโนมัติ จับคู่กับไคลเอนต์ API ที่ดีอย่าง Apidog เพื่อตรวจสอบทุกคำขอและคำตอบในขณะที่คุณปรับแต่งพรอมต์
- การให้เหตุผลจากเอกสารขนาดยาว 1 ล้านโทเค็นเพียงพอสำหรับ monorepos ส่วนใหญ่, สัญญาต่างๆ ส่วนใหญ่ และชุดข้อมูลวิจัยส่วนใหญ่ โหมด Think High เป็นโหมดที่เหมาะสมสำหรับเรื่องนี้
- ผลิตภัณฑ์ AI ที่โฮสต์เอง หากข้อกำหนดด้านการปฏิบัติตามกฎระเบียบของคุณต้องการการอนุมานภายในองค์กร V4-Flash เป็นโมเดลน้ำหนักเปิดตัวแรกที่สามารถแข่งขันกับ API แนวหน้าแบบปิดในด้านคุณภาพได้
- การวิจัยและการปรับแต่ง เช็คพอยต์ Base มีไว้สำหรับการฝึกอบรมแบบกำหนดเองโดยเฉพาะ จับคู่กับข้อมูลโดเมนของคุณ แล้วคุณจะได้โมเดลผู้เชี่ยวชาญระดับโปรดักชัน
กรณีที่ไม่เหมาะสม: การจำแนกประเภทปริมาณมาก, การดึงฝังตัว (embedding retrieval) หรือการสนทนาด้วยพรอมต์สั้น V4-Flash ยังคงเป็นการใช้เกินความจำเป็นสำหรับงานเหล่านั้น และเช็คพอยต์ DeepSeek รุ่นเก่ากว่ามีค่าใช้จ่ายน้อยกว่า
ราคาโดยสรุป
DeepSeek ยังไม่ได้เผยแพร่ตารางอัตรา API ฉบับสมบูรณ์ในขณะที่เขียนนี้ V3.2 มีค่าใช้จ่ายประมาณ 0.28 ดอลลาร์ต่อล้านโทเค็นอินพุต และ 0.42 ดอลลาร์ต่อล้านโทเค็นเอาต์พุต และห้องปฏิบัติการนี้มีประวัติในการรักษาราคาของซีรีส์ V ให้ใกล้เคียงกับระดับต่ำสุดนั้น คาดว่า V4-Flash จะอยู่ในช่วงราคาเดียวกัน และ V4-Pro จะมีราคาสูงขึ้นเล็กน้อย คู่แข่งแบบปิดมีราคาอยู่ที่ 5 ถึง 15 ดอลลาร์ต่อล้านโทเค็นอินพุต ดังนั้นแม้จะเพิ่มขึ้น 3 เท่าจาก V3.2 DeepSeek ก็ยังคงต่ำกว่าค่ากลางของ API แนวหน้าเป็นอย่างมาก ติดตามตัวเลขปัจจุบันได้ที่ หน้าการกำหนดราคาของ DeepSeek
วิธีทดสอบ V4 ในวันนี้
สามช่องทาง จัดอันดับตามเวลาที่ใช้ในการได้รับโทเค็นแรก
- แชทเว็บ เปิด chat.deepseek.com และลงชื่อเข้าใช้ V4-Pro เป็นค่าเริ่มต้น; สลับไปที่ Think High ใน UI ฟรี ไม่ต้องใช้บัตร ใช้งานได้ทันที
- API ขอคีย์, ชี้ไคลเอนต์ของคุณไปที่
https://api.deepseek.com, ตั้งค่า"model": "deepseek-v4-pro", แล้วเริ่มใช้งานได้เลย รูปแบบคำขอเข้ากันได้กับ OpenAI ดังนั้นไคลเอนต์ OpenAI ที่มีอยู่สามารถทำงานได้เพียงแค่เปลี่ยน URL พื้นฐาน ดูคู่มือฉบับเต็มได้ที่ คู่มือ API ของ DeepSeek V4 - น้ำหนักโมเดลภายในเครื่อง ดึงจาก Hugging Face หรือ ModelScope V4-Flash สามารถทำงานบน H100 2 ถึง 4 ตัว; V4-Pro ต้องการคลัสเตอร์ขนาดใหญ่ โค้ดอนุมานอยู่ในโฟลเดอร์
/inferenceของ repo โมเดล
สำหรับคู่มือฉบับเต็ม รวมถึงการวนซ้ำพรอมต์ที่ใช้ Apidog โปรดดู วิธีการใช้ DeepSeek V4 หากต้องการให้ค่าใช้จ่ายเป็นศูนย์ โปรดดู วิธีการใช้ DeepSeek V4 ฟรี ดาวน์โหลด Apidog และสร้างคอลเลกชันของคุณล่วงหน้า; รูปแบบที่เข้ากันได้กับ OpenAI หมายความว่าคำขอเดียวสามารถใช้งานได้กับ DeepSeek, OpenAI และ API แนวหน้าอื่นๆ ทุกตัว
คำถามที่พบบ่อย
DeepSeek V4 เป็นโอเพ่นซอร์สจริงหรือ?ใช่ เช็คพอยต์ทั้งสี่อยู่ภายใต้ใบอนุญาต MIT ซึ่งอนุญาตให้ใช้งานเชิงพาณิชย์, แก้ไข และแจกจ่ายซ้ำได้โดยไม่ต้องมีข้อตกลงการใช้งานแยกต่างหาก
ฉันจำเป็นต้องมี GPU cluster เพื่อรัน V4-Flash หรือไม่?คุณต้องใช้ H100 หรือ H200 สองถึงสี่ตัวสำหรับ V4-Flash ที่ความแม่นยำเต็มที่ ซึ่งน้อยลงหากคุณทำการ quantize V4-Pro ต้องการคลัสเตอร์ที่แท้จริง หากคุณต้องการลองใช้ V4 โดยไม่มีฮาร์ดแวร์ ให้ใช้ API หรือ chat.deepseek.com
V4 จะเข้าสู่ DeepSeek API เมื่อใด?ใช้งานได้แล้วตั้งแต่วันที่ 23 เมษายน 2026 ID โมเดลคือ deepseek-v4-pro และ deepseek-v4-flash ID deepseek-chat และ deepseek-reasoner รุ่นเก่าจะเลิกใช้งานในวันที่ 24 กรกฎาคม 2026
V4 เปรียบเทียบกับ Kimi และ Qwen อย่างไร?V4-Pro มีคะแนน LiveCodeBench และ Codeforces สูงกว่า Kimi K2 และ Qwen 3 Max ในตารางที่ DeepSeek รายงาน ทั้งสามเป็นระบบ MoE แบบน้ำหนักเปิดที่มีโปรไฟล์การใช้งานที่คล้ายกัน เลือกตามผลการทดสอบที่ใกล้เคียงกับภาระงานของคุณมากที่สุด
ฉันสามารถ fine-tune V4 ด้วยข้อมูลของตัวเองได้หรือไม่?ได้ เช็คพอยต์ Base มีไว้สำหรับเรื่องนั้น; จับคู่กับข้อมูลโดเมนของคุณและไปป์ไลน์ SFT มาตรฐาน ใบอนุญาต MIT ครอบคลุมการแจกจ่ายโมเดลที่ได้ไปใช้ในเชิงพาณิชย์
V4 จะทำงานร่วมกับเครื่องมือที่เข้ากันได้กับ OpenAI ที่มีอยู่ของฉันได้หรือไม่?ได้ API รองรับทั้งรูปแบบข้อความของ OpenAI และ Anthropic ที่ https://api.deepseek.com และ https://api.deepseek.com/anthropic ตามลำดับ ไคลเอนต์ OpenAI ที่มีอยู่ส่วนใหญ่สามารถทำงานได้ด้วยการเปลี่ยน URL พื้นฐานเพียงครั้งเดียว ดู คู่มือการใช้งาน API ของ GPT-5.5 ที่เกี่ยวข้องสำหรับรูปแบบที่คล้ายกัน
