DeepSeek ได้เปลี่ยนส่วนลดชั่วคราวที่ดุเดือดที่สุดในราคา LLM ปี 2026 ให้กลายเป็นเรื่องปกติใหม่ เมื่อวันที่ 22 พฤษภาคม ทีมงานได้ประกาศว่าข้อเสนอ DeepSeek-V4-Pro ลด 75% ซึ่งเดิมมีกำหนดจะหมดอายุในวันที่ 31 พฤษภาคม 2026 เวลา 15:59 UTC จะไม่ถูกยกเลิก อัตราโปรโมชันนี้จะกลายเป็นราคาปกติถาวร ราคาอินพุตลดลงเหลือ 0.435 ดอลลาร์ต่อล้านโทเค็น เอาต์พุตเหลือ 0.87 ดอลลาร์ และแคชฮิตเหลือ 0.003625 ดอลลาร์ ด้านล่างนี้ เราจะแจกแจงสิ่งที่เปลี่ยนแปลง สิ่งที่ยังคงเหมือนเดิม และสิ่งที่นักพัฒนา API ทุกคนควรพิจารณาใหม่ในสัปดาห์นี้
สรุป
- ราคา API ของ DeepSeek-V4-Pro เป็นราคาถาวรแล้วที่ 1/4 ของราคาปกติเดิม: อินพุต $0.435/MTok, เอาต์พุต $0.87/MTok, แคชฮิต $0.003625/MTok
- ส่วนลดโปรโมชัน 75% ที่กำหนดจะสิ้นสุดในวันที่ 31 พฤษภาคม 2026 ได้กลายเป็นอัตราปกติแล้ว ไม่มีการย้อนกลับ ไม่มีการหมดอายุแบบไม่คาดคิด
- V4-Pro ตอนนี้ถูกกว่า GPT-5.5 ประมาณ 34 เท่าสำหรับการเอาต์พุต ขณะที่ยังคงประสิทธิภาพใกล้เคียง ~95% ของ GPT-5.5 ในการทดสอบมาตรฐานด้านการเขียนโค้ดและการให้เหตุผลส่วนใหญ่
- ราคาแคชฮิตที่ $0.003625/MTok ซึ่งเป็นการลดราคา 90% นอกเหนือจากการลดราคาหลัก เป็นรายละเอียดที่หลายคนมองข้าม System prompts ขนาดยาวเกือบจะฟรีแล้วในส่วนของ prefix
- หากคุณกำหนดราคาฟีเจอร์ AI ของคุณโดยเทียบกับ GPT-5.5 หรือ Claude Opus 4.7 เมื่อไตรมาสที่แล้ว การคำนวณต้นทุนได้เปลี่ยนไปในสัปดาห์นี้
ทำไมเรื่องนี้ถึงสำคัญในตอนนี้
ราคา LLM มักจะเคลื่อนไหวไปในทิศทางเดียว: ลดลง ช้าๆ พร้อมกับข้อสังเกตเล็กๆ น้อยๆ แต่ DeepSeek ข้ามข้อสังเกตเหล่านั้นไป ทีมงานได้จัดโปรโมชันเชิงรุกตลอดเดือนพฤษภาคม เฝ้าดูปริมาณการใช้งานของนักพัฒนาเพิ่มขึ้น และตัดสินใจตรึงราคาไว้แทนที่จะปล่อยให้ราคากลับมาเป็นปกติ นี่คือสัญญาณเชิงโครงสร้างว่าเศรษฐกิจของโมเดลแนวหน้าของจีนกำลังมุ่งหน้าไปในทิศทางใด ไม่ใช่แค่การแสดงออกครั้งเดียว
หากคุณกำลังส่งมอบผลิตภัณฑ์ใดๆ ที่เรียกใช้ LLM ในเส้นทางที่ใช้งานบ่อย (เติมข้อความอัตโนมัติ, แชทที่เสริมด้วยการดึงข้อมูล, การตรวจสอบโค้ด, agent loops) ความแตกต่างระหว่าง 3.48 ดอลลาร์กับ 0.87 ดอลลาร์ต่อล้านโทเค็นเอาต์พุตจะปรากฏในใบแจ้งหนี้ของคุณในเดือนนี้ หากคุณส่งออกโทเค็น 50 ล้านโทเค็นต่อวัน ซึ่งเป็นภาระงานที่เป็นไปได้สำหรับ agent ที่มีผู้ใช้จำนวนมาก ราคาใหม่นี้จะช่วยลดค่าใช้จ่าย LLM รายเดือนของคุณจากประมาณ 5,200 ดอลลาร์เหลือ 1,300 ดอลลาร์ นั่นเทียบเท่ากับการจ้างพนักงานฝ่ายขาย หรือเครดิต GPU หนึ่งปี
กำลังสร้างอยู่บน DeepSeek ใช่ไหม Apidog ช่วยให้คุณสร้าง ทดสอบ และตรวจสอบการเรียก API ของ V4-Pro ในพื้นที่ทำงานเดียว รวมถึงการสตรีม การเรียกใช้เครื่องมือ และการตรวจสอบ JSON schema ดาวน์โหลด Apidog แล้วคุณจะสามารถคัดลอกคำขอในบทความนี้ได้ภายในเวลาไม่ถึงนาที
ในส่วนที่เหลือของโพสต์นี้ คุณจะเห็นตารางราคาใหม่ทั้งหมด การเปรียบเทียบแบบตัวต่อตัวกับ GPT-5.5 และ Claude Opus 4.7 การคำนวณแคชฮิตที่บทความส่วนใหญ่มองข้าม สถานการณ์ใบเรียกเก็บเงินจริงสามแบบ และกรอบการตัดสินใจห้าขั้นตอนว่าจะย้ายระบบในวันนี้หรือไม่
สิ่งที่เปลี่ยนแปลง: การถอดรหัสประกาศ
ประกาศราคาอย่างเป็นทางการของ DeepSeek สั้น แต่แต่ละบรรทัดมีความสำคัญ สามข้อเท็จจริงที่ควรทราบ:
- ส่วนลด 75% เป็นราคาถาวร โปรโมชันที่ดำเนินไปจนถึงวันที่ 31 พฤษภาคม 2026 เวลา 15:59 UTC เดิมมีกำหนดจะกลับไปเป็นราคาเปิดตัวในวันที่ 1 มิถุนายน แต่จะไม่เป็นเช่นนั้น อัตราโปรโมชันคืออัตราปกติใหม่ ซึ่งมีผลย้อนหลังตั้งแต่เปิดตัวและจะใช้ต่อไปอย่างไม่มีกำหนด
- การลดราคานี้ใช้กับ V4-Pro เท่านั้น DeepSeek-V4-Flash ที่ราคา $0.14 / $0.28 ต่อล้านโทเค็น ก็ถูกอยู่แล้ว V4-Pro ซึ่งเป็นโมเดลระดับแนวหน้าคือรุ่นที่ลดราคา ดู DeepSeek V4 คืออะไร สำหรับความแตกต่างระหว่าง Flash และ Pro
- ราคาแคชฮิตถูกลดลงเหลือ 1/10 ของราคาเปิดตัว มีผลตั้งแต่วันที่ 26 เมษายน 2026 เวลา 12:15 UTC นี่เป็นการเปลี่ยนแปลงที่แยกต่างหากจากการลดราคาหลัก 75% และทั้งสองมีการทับซ้อนกัน ผลลัพธ์: แคชฮิตที่ $0.003625/MTok ซึ่งเป็นราคาแคชโมเดลแนวหน้าของผู้ให้บริการรายแรกที่ต่ำที่สุดในตลาดปี 2026
เมื่ออ่านรวมกันแล้ว ประกาศนี้หมายความว่า: DeepSeek เต็มใจที่จะรับภาระกำไรขั้นต้นจากโมเดลหลักเพื่อรักษาฐานนักพัฒนา การเปลี่ยนแปลงเกี่ยวกับแคชฮิตหมายความว่า: พวกเขาต้องการให้คุณสร้าง agent และเครื่องมือที่มีบริบทแบบยาวบน V4-Pro โดยเฉพาะ การเคลื่อนไหวทั้งสองนี้ชี้ไปที่กลยุทธ์เดียวกัน ชนะการประมวลผลการอนุมานในตอนนี้ สร้างรายได้จากแพลตฟอร์มในภายหลัง
ตารางราคาถาวรใหม่
ราคาต่อ 1 ล้านโทเค็น, ดอลลาร์สหรัฐ, มีผลทันทีและถาวร:
| ประเภทโทเค็น | ราคาเดิม | ราคาถาวรใหม่ | ส่วนลด |
|---|---|---|---|
| อินพุต (แคชไม่ฮิต) | $1.74 | $0.435 | 75% |
| อินพุต (แคชฮิต) | $0.0145 | $0.003625 | 75% |
| เอาต์พุต | $3.48 | $0.87 | 75% |
ประเด็นสำคัญบางประการที่ตารางนี้ซ่อนอยู่:
- การลดราคาเอาต์พุตคือส่วนที่ส่งผลกระทบต่อใบแจ้งหนี้ของคุณมากที่สุด เพราะโทเค็นเอาต์พุตมีบทบาทสำคัญใน agent loop ที่โมเดลใช้ในการให้เหตุผลหรือเขียนโค้ด
- แถวแคชฮิตดูเล็กน้อยเพราะตัวเลขสัมบูรณ์เล็กมาก อัตราส่วนคือจุดที่ประหยัดได้ อินพุตที่ไม่ฮิตแคชต่ออินพุตที่ฮิตแคชอยู่ที่ประมาณ 120:1 ระบบพรอมต์ที่ออกแบบมาดีซึ่งฮิตแคช 90% ของเวลา จะจ่ายเกือบจะไม่มีอะไรเลยสำหรับอินพุต ซึ่งเป็นกุญแจสำคัญสำหรับ agent ใดๆ ที่มีโครงสร้างพื้นฐานที่มั่นคง
- อัตราเหล่านี้ใช้กับ API เท่านั้น แชทบนเว็บของ DeepSeek ยังคงใช้งานได้ฟรีสำหรับบุคคลทั่วไป
สำหรับบริบททางประวัติศาสตร์ที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับระดับราคา V4 และข้อดีข้อเสียระหว่าง Flash กับ Pro โปรดดูข้อมูลอ้างอิง ราคา DeepSeek V4 API ของเรา
V4-Pro เปรียบเทียบกับ GPT-5.5, Claude Opus 4.7 และ Gemini 3.5 Flash อย่างไรในปัจจุบัน
การเปรียบเทียบที่น่าสนใจไม่ใช่การเปรียบเทียบกับ V4-Pro ในอดีต แต่เป็นการเปรียบเทียบกับโมเดลแนวหน้าอื่นๆ ในตลาด
| โมเดล | อินพุต ($/MTok) | เอาต์พุต ($/MTok) | SWE-bench Pro |
|---|---|---|---|
| DeepSeek-V4-Pro (ใหม่) | $0.435 | $0.87 | 55.4% |
| GPT-5.5 | $5.00 | $30.00 | 58.6% |
| Claude Opus 4.7 | $3.00 | $15.00 | ~62% |
| Gemini 3.5 Flash | ~$1.50 | ~$9.00 | ~48% |
| DeepSeek-V4-Flash | $0.14 | $0.28 | ~42% |
สองตัวเลขที่ควรจดจำ สำหรับโทเค็นเอาต์พุตซึ่งเป็นรายการที่ทำให้บิลของคุณสูงขึ้น DeepSeek-V4-Pro ถูกกว่า GPT-5.5 ถึง 34 เท่า และถูกกว่า Claude Opus 4.7 ถึง 17 เท่า ในด้านเกณฑ์มาตรฐาน V4-Pro มีประสิทธิภาพใกล้เคียงกับ GPT-5.5 โดยห่างกันเพียง 3 ถึง 7 เปอร์เซ็นต์พอยต์ในการประเมินการเขียนโค้ดและการให้เหตุผลสาธารณะส่วนใหญ่ อ้างอิงจากการ เปรียบเทียบของ DataCamp
หากปริมาณงานของคุณทนต่อความล่าช้าได้และคุณภาพเป็นที่ยอมรับในช่วงแคบๆ นั้น การย้ายระบบเป็นปัญหาทางคณิตศาสตร์ที่มีคำตอบเดียว สำหรับปริมาณงานที่คะแนนเกณฑ์มาตรฐาน 5 คะแนนสุดท้ายมีความสำคัญ (ความน่าเชื่อถือของเครื่องมือ agent, การวางแผนระยะยาว, คณิตศาสตร์ที่ซับซ้อน) V4-Pro ยังคงถูกกว่าที่จะใช้เป็นโมเดลร่างที่อยู่เบื้องหลังรูปแบบ speculative-decoding หรือ critic
สำหรับการรีวิวเชิงลึกแบบตัวต่อตัว โปรดดูที่ DeepSeek V4 vs Claude Opus 4.5 สำหรับการเขียนโค้ด และ GLM-5 vs DeepSeek V3 vs GPT-5: ความเร็ว ต้นทุน และการเปรียบเทียบเชิงปฏิบัติสำหรับนักพัฒนา
มุมมองแคชฮิตที่บทความส่วนใหญ่มองข้าม
ทุกคนต่างอ้างถึงตัวเลขเอาต์พุตที่ $0.87 มีน้อยคนนักที่จะอธิบายว่าราคาอินพุตแคชฮิตที่ $0.003625 ส่งผลต่อการออกแบบระบบอย่างไร
พรอมต์แคชของ DeepSeek จะฮิตเมื่อส่วนนำ (prefix) ของคำขอของคุณเหมือนกับคำขอก่อนหน้าในช่วงเวลาประมาณ 30 นาที สำหรับแชทบอทและระบบดึงข้อมูล ส่วนนำมักจะเป็น system prompt ของคุณ บวกกับการกำหนดเครื่องมือ บวกกับโครงสร้างคำสั่ง ซึ่งโดยปกติแล้วจะเป็น 4,000 ถึง 10,000 โทเค็นที่ไม่เปลี่ยนแปลงระหว่างการสนทนาแต่ละครั้ง
ตัวอย่างที่เป็นรูปธรรม สมมติว่าผู้ช่วยของคุณใช้ system prompt ขนาด 6,000 โทเค็น และจัดการการสนทนา 100,000 ครั้งต่อวัน โดยมีข้อความผู้ใช้โดยเฉลี่ย 200 โทเค็นอินพุต และการตอบกลับโดยเฉลี่ย 800 โทเค็นเอาต์พุต
- ไม่มีแคชฮิต: 100,000 รอบ × 6,200 โทเค็นอินพุต × $0.435 / 1,000,000 = $269.70 ต่อวันสำหรับอินพุตเท่านั้น
- เมื่อ 90% ของโทเค็น system prompt เหล่านั้นฮิตแคช: 100,000 รอบเท่ากันจะจ่าย 200 × $0.435 บวก 6,000 × (0.9 × $0.003625 + 0.1 × $0.435) ต่อล้านโทเค็น ซึ่งจะอยู่ที่ ประมาณ $32 ต่อวัน ลดต้นทุนอินพุตได้ 88%
นี่ไม่ใช่ความคลาดเคลื่อนในการปัดเศษ มันคือความแตกต่างระหว่างการเป็นรายการที่ยั่งยืนและรายการฟุ่มเฟือย สำหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีการทำงานของ prefix caching ในผู้ให้บริการต่างๆ การเจาะลึกเรื่อง prompt caching ของเราจะอธิบายกลไกการทำงาน
สามรูปแบบเพื่อให้ได้แคชฮิตใน agent จริง:
- ตรึง prefix เก็บ system prompt, tool schemas และตัวอย่าง few-shot ไว้ในบล็อกเดียวที่จุดเริ่มต้นของทุกคำขอ อย่าแทรกข้อความเฉพาะเซสชันลงใน prefix
- จัดเรียงหรือแฮชบริบทไดนามิก หากคุณผนวกส่วนที่ดึงมา ให้จัดเรียงอย่างมั่นคง หรือแฮชคำขอและส่งแฮชที่เหมือนกันไปยังโหนดเดียวกัน การเปลี่ยนแปลงเล็กน้อยของลายนิ้วมือจะทำให้แคชไม่ฮิต
- เรียกใช้งาน warm-up เมื่อ agent เริ่มทำงาน ให้ส่งคำขอหนึ่งครั้งพร้อม prefix เต็มรูปแบบเพื่อให้มันเข้าไปอยู่ในแคชของผู้ให้บริการก่อนที่ผู้ใช้จะเริ่มใช้งาน
สิ่งที่คุณควรทำในสัปดาห์นี้
การตัดสินใจย้ายระบบไม่ใช่เรื่องตายตัว มันขึ้นอยู่กับประเภทของปริมาณงาน LLM ที่คุณกำลังใช้งานอยู่ กรอบการทำงานห้าขั้นตอน:
- 1. วัดอัตราส่วน output:input ปัจจุบันของคุณ หากคุณใช้จ่าย 80% ของงบประมาณโทเค็นไปกับเอาต์พุต (agent, ตัวสร้างโค้ด หรือเครื่องมือสร้างเนื้อหาใดๆ) การประหยัดจาก V4-Pro จะมีมาก หากคุณใช้จ่าย 80% ไปกับอินพุต (RAG เหนือเอกสารยาวๆ) การประหยัดจะน้อยลงแต่ก็ยังคงเป็นจริงเมื่อแคชฮิต
- 2. ทำการประเมิน 100 ตัวอย่างกับปริมาณงานจริงของคุณ อย่าเชื่อเกณฑ์มาตรฐานสาธารณะ ดึง 100 trace จากปริมาณการใช้งานจริงของคุณ รันเทียบกับ V4-Pro และโมเดลปัจจุบันของคุณด้วยพรอมต์ที่เหมือนกัน และให้คะแนนโดยผู้ตัดสินของคุณเอง ทีมส่วนใหญ่พบว่า V4-Pro “ดีพอ” สำหรับ 70% ถึง 85% ของปริมาณการใช้งานของพวกเขา
- 3. จับคู่รูปแบบตามเส้นทาง กำหนดเส้นทาง 70% ถึง 85% ไปยัง V4-Pro และเก็บโมเดลพรีเมียมของคุณไว้สำหรับส่วนที่ยาก การเปลี่ยนแปลงเพียงครั้งเดียวนี้ช่วยประหยัดค่าใช้จ่ายได้มากกว่า 70% โดยแทบไม่มีการถดถอยของคุณภาพ
- 4. ตรึง cache prefixes ตรวจสอบ system prompts ของคุณ สิ่งใดก็ตามที่แตกต่างกันไปในแต่ละคำขอ (timestamps, user IDs, session IDs) ควรอยู่ในข้อความผู้ใช้ ไม่ใช่ system prompt ย้ายมันออกไป
- 5. ตั้งค่าการทดสอบการถดถอยก่อนการเปิดตัว นี่คือจุดที่ Apidog มีประโยชน์ บันทึกการตอบสนองที่ดีที่สุดจากโมเดลปัจจุบันของคุณ จากนั้นเล่นซ้ำคำขอเดิมกับ V4-Pro และเปรียบเทียบความแตกต่างของเอาต์พุต การตรวจสอบ JSON schema ของ Apidog จะตรวจจับการเปลี่ยนแปลงในรูปแบบการเรียกใช้เครื่องมือได้ก่อนที่จะถึงขั้นตอนการผลิต ดาวน์โหลด Apidog นำเข้าคอลเลกชันที่เข้ากันได้กับ OpenAI ของคุณ เปลี่ยน URL หลักเป็น
https://api.deepseek.comแล้วคุณสามารถทำการทดสอบ smoke test แบบเคียงข้างกันได้ภายในเวลาไม่ถึงสิบนาที
สำหรับการสาธิตเชิงปฏิบัติเกี่ยวกับรูปแบบ endpoint ของ V4-Pro โปรดดูที่ วิธีใช้ DeepSeek V4 API
V4-Pro แตกต่างจากการลดราคาอื่นๆ ในปี 2026 อย่างไร
DeepSeek ไม่ใช่ห้องปฏิบัติการเดียวที่ลดราคา ตลาด LLM ในปี 2026 อยู่ในภาวะที่กำไรถูกบีบอัดอย่างชัดเจน:
- OpenAI O3 ลดราคาลง 80% เมื่อต้นปีนี้ ดู รายละเอียดราคา O3 ของเราสำหรับการคำนวณ
- Kimi K2 ปรับราคาอย่างหนักเพื่อแข่งขันกับ DeepSeek’s V3 tier ราคา Kimi K2 API ครอบคลุมรายละเอียด
- Anthropic Claude ยังคงรักษาราคา Opus ไว้ แต่ได้เปิดตัว Haiku และ Sonnet ที่ถูกกว่า รายละเอียดค่าใช้จ่าย Claude API ฉบับเต็ม จะอธิบายว่าแต่ละ tier เหมาะสมกับอะไร
การลดราคาของ V4-Pro เป็นการลดราคาที่รุนแรงที่สุดในปีนี้ เพราะมันมุ่งเป้าไปที่กลุ่มความสามารถระดับแนวหน้า ไม่ใช่ระดับงบประมาณ นั่นคือเหตุผลที่ประกาศนี้ทำให้ตลาดเปลี่ยนแปลงไป ในขณะที่ประกาศอื่นๆ ไม่ได้ทำเช่นนั้น
การคำนวณต้นทุนการสร้างได้เปลี่ยนไป
DeepSeek ไม่ได้แค่ลดราคา พวกเขาได้วาดเส้นโค้งใหม่ ความสามารถระดับแนวหน้าที่ราคาเอาต์พุตต่ำกว่าหนึ่งดอลลาร์กลายเป็นมาตรฐานแล้ว ไม่ใช่ข้อยกเว้น และตลาดที่เหลือก็จะตอบสนอง หากคุณชะลอฟีเจอร์ LLM ใดๆ ด้วยเหตุผลด้านต้นทุน งบประมาณปี 2026 ที่คุณประเมินไว้เมื่อไตรมาสที่แล้วอาจสูงเกินความต้องการของคุณถึง 4 เท่า
สามขั้นตอนถัดไป:
- ตรวจสอบปริมาณงาน LLM สามอันดับแรกของคุณเทียบกับกรอบการทำงานข้างต้น และเลือกหนึ่งงานเพื่อย้ายระบบในสัปดาห์นี้
- ตรึง cache prefixes ของคุณ นั่นคือชัยชนะที่ง่ายดายไม่ว่าคุณจะใช้โมเดลใด
- ตั้งค่าชุดการทดสอบ regression ของ Apidog เพื่อให้การลดราคาครั้งต่อไป (ซึ่งจะมีอย่างแน่นอน) ใช้เวลาประเมินเพียงไม่กี่ชั่วโมงแทนที่จะเป็นหลายสัปดาห์
ธงโปรโมชันถูกปลดออก แต่ส่วนลดไม่ถูกยกเลิก
