Baidu เปิดตัว ERNIE 5.1 เมื่อวันที่ 9 พฤษภาคม 2026 และตัวเลขพาดหัวข่าวก็น่าจับตามอง: โมเดล Mixture-of-Experts ที่มีพารามิเตอร์รวมประมาณหนึ่งในสามของ ERNIE 5.0 ซึ่งติดอันดับ 4 ของโลกในตารางคะแนน Arena Search leaderboard และเป็นอันดับ 1 ในบรรดาโมเดลจีนด้วยคะแนน 1,223
นี่เป็น ERNIE ตระกูลแรกที่ Baidu เปิดเผยการแข่งขันด้านการใช้เครื่องมืออัตโนมัติ การเขียนเชิงสร้างสรรค์แบบยาว และการให้เหตุผลกับ Gemini 3.1 Pro และ DeepSeek-V4-Pro ซึ่งไม่จำกัดแค่เฉพาะงานภาษาจีนอีกต่อไป หากคุณพัฒนาด้วย Apidog และกำลังรอโมเดลแนวหน้าของจีนที่คุณสามารถนำไปใช้ในระบบเอเจนต์ได้โดยไม่ต้องใช้พารามิเตอร์ขนาด 70B การเปิดตัวครั้งนี้ก็คุ้มค่าแก่การพิจารณาอย่างถี่ถ้วน
คู่มือนี้จะอธิบายว่า ERNIE 5.1 คืออะไร มีอะไรเปลี่ยนแปลงภายใต้ระบบภายในอย่างไร ผลการเปรียบเทียบกับ DeepSeek-V4-Pro และ Gemini 3.1 Pro เป็นอย่างไร และโมเดลนี้เหมาะสมกับที่ไหนหากคุณใช้งาน DeepSeek V4 หรือ Kimi K2.6 อยู่แล้วในการผลิต
สรุปสั้นๆ: ERNIE 5.1 ในหนึ่งย่อหน้า
ERNIE 5.1 เป็นโมเดล MoE ที่รองรับเฉพาะข้อความ ซึ่งได้รับการฝึกฝนด้วยต้นทุนการฝึกอบรมเบื้องต้นประมาณ 6% ของโมเดลแนวหน้าที่เทียบเคียงได้ พารามิเตอร์รวมประมาณหนึ่งในสามของ ERNIE 5.0 และพารามิเตอร์ที่ใช้งานต่อการส่งผ่านหนึ่งครั้งประมาณครึ่งหนึ่ง ได้คะแนน 1,223 ในตารางคะแนน Arena Search leaderboard (อันดับ 4 ของโลก, อันดับ 1 ในจีน) ชนะ DeepSeek-V4-Pro ในเกณฑ์มาตรฐานการใช้เครื่องมืออัตโนมัติ τ³-bench และ SpreadsheetBench-Verified และได้คะแนน 99.6 ใน AIME26 พร้อมการใช้เครื่องมือ สามารถเข้าถึงได้ผ่าน ERNIE chat UI, ERNIE 5.1 Playground ของ Baidu AI Studio และ Qianfan API

ทำไมการเปิดตัวครั้งนี้จึงมีความสำคัญ
มีสามสิ่งที่โดดเด่น และไม่มีสิ่งใดเป็นเพียงแค่ "Baidu เปิดตัวโมเดลอีกแล้ว"
1. อัตราส่วนต้นทุนต่อคุณภาพ การฝึกอบรมเบื้องต้นด้วยต้นทุนประมาณ 6% ของโมเดลที่เทียบเคียงได้ เป็นตัวเลขที่กำหนดความคาดหวังด้านราคาใหม่ทั่วทั้งอุตสาหกรรม หาก Baidu สามารถให้บริการนี้ผ่าน Qianfan ด้วยค่าใช้จ่ายเพียงเศษเสี้ยวของราคาที่โมเดลแบบปิดแนวหน้าเรียกเก็บ ราคา API ก็จะปรับตามลงมา
2. การออกแบบ MoE ที่ยืดหยุ่นได้สามแกน โมเดล MoE ส่วนใหญ่จะกำหนดเส้นทางตามความกว้าง (ผู้เชี่ยวชาญที่ทำงาน) และบางครั้งก็ความลึก (การข้ามเลเยอร์) Baidu อ้างว่า ERNIE 5.1 กำหนดเส้นทางตาม ความลึก ความกว้าง และความเบาบาง (sparsity) พร้อมกัน ซึ่งเป็นวิธีที่พวกเขาย่อขนาดโมเดลโดยไม่สูญเสียคะแนนการใช้เครื่องมืออัตโนมัติ ซึ่งใกล้เคียงกับปรัชญาการออกแบบใน DeepSeek-V3.x มากกว่า MoE สไตล์ GShard ทั่วไป
3. ความสามารถด้านเอเจนต์คือหัวใจสำคัญ ไม่ใช่ส่วนเสริม ERNIE 5.0 ถูกวางตำแหน่งให้เป็นโมเดลความรู้และการเขียนเชิงสร้างสรรค์ แต่ ERNIE 5.1 วางตลาดอย่างชัดเจนว่ามี "ความสามารถด้านเอเจนต์เทียบเท่ากับโมเดลชั้นนำของโลก" และมาพร้อมกับ Baidu AI Studio playground ที่ปรับแต่งมาสำหรับการสาธิตการเรียกใช้เครื่องมือ นี่คือการเปลี่ยนแปลงเชิงกลยุทธ์

ผลการเปรียบเทียบมาตรฐาน
นี่คือสิ่งที่ Baidu เผยแพร่ โดยเปรียบเทียบกับจุดเปรียบเทียบสาธารณะที่ใกล้เคียงที่สุด
| เกณฑ์มาตรฐาน | ERNIE 5.1 | สิ่งที่ทดสอบ | คู่แข่งที่ใกล้เคียงที่สุด |
|---|---|---|---|
| ตารางคะแนน Arena Search leaderboard | 1,223 (อันดับ 4 ของโลก, อันดับ 1 ในจีน) | การตอบคำถามที่รับรู้การค้นหาและได้รับการประเมินโดยมนุษย์ | Gemini 3.1 Pro, GPT-5.x |
| τ³-bench | ชนะ DeepSeek-V4-Pro | การใช้เครื่องมือแบบเอเจนต์, หลายรอบ | DeepSeek-V4-Pro |
| SpreadsheetBench-Verified | ชนะ DeepSeek-V4-Pro | งานสเปรดชีตในโลกจริง | DeepSeek-V4-Pro |
| AIME26 (พร้อมเครื่องมือ) | 99.6 | คณิตศาสตร์เชิงแข่งขันพร้อมล่ามโค้ด | GPT-5.x, Gemini 3.1 Pro |
| GPQA | "ใกล้เคียงกับโมเดลแบบปิดชั้นนำ" | การตอบคำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา | Claude Sonnet 4.6 |
| MMLU-Pro | "ใกล้เคียงกับโมเดลแบบปิดชั้นนำ" | ความรู้ทั่วไป | โมเดลแนวหน้าทั้งหมด |
ข้อควรระวังบางประการ คะแนน Arena ขึ้นอยู่กับการผสมผสานของพร้อมต์และกลุ่มผู้ลงคะแนน และพร้อมต์ที่เน้นภาษาจีนน่าจะช่วยได้ที่นี่ คะแนน AIME26-with-tools ก็ได้รับการเสริมด้วยเครื่องมือเช่นกัน ไม่มีการเปิดเผยตัวเลข AIME สำหรับการให้เหตุผลล้วนๆ การเขียนเชิงสร้างสรรค์อธิบายว่า "ใกล้เคียงกับ Gemini 3.1 Pro" มากกว่าที่จะเทียบเท่า
อย่างไรก็ตาม ผลลัพธ์ของ τ³-bench และ SpreadsheetBench เป็นสิ่งที่ควรให้ความสนใจ ทั้งสองเป็นแบบเอเจนต์ ทั้งสองได้รับการดูแลจากภายนอก และทั้งสองเป็นสิ่งที่ยากต่อการจัดการในอดีต
สิ่งที่เรารู้เกี่ยวกับสถาปัตยกรรม
Baidu เปิดเผยข้อมูลน้อยกว่าที่ DeepSeek ทำสำหรับเอกสารซีรีส์ V3 แต่สิ่งต่อไปนี้คือสิ่งที่โพสต์ประกาศและโพสต์ที่เกี่ยวข้องยืนยัน:
- พารามิเตอร์ทั้งหมด: ประมาณหนึ่งในสามของ ERNIE 5.0
- พารามิเตอร์ที่ใช้งานต่อโทเค็น: ประมาณครึ่งหนึ่งของ ERNIE 5.0
- การกำหนดเส้นทาง: ยืดหยุ่นได้ทั้งความลึก ความกว้าง และความเบาบาง (MoE แบบสามแกน)
- ต้นทุนการฝึกอบรมเบื้องต้น: ประมาณ 6% ของ "โมเดลที่เทียบเคียงได้"
- รูปแบบ: เฉพาะข้อความเมื่อเปิดตัว (ไม่มีวิสัยทัศน์, ไม่มีเสียง)
- ภาษา: มีเวอร์ชันภาษาจีนและภาษาอังกฤษ
ไม่มีการเปิดเผยความยาวบริบท จำนวนพารามิเตอร์ที่แน่นอน และงบประมาณโทเค็นการฝึกอบรม หากคุณเคยสร้างด้วยโมเดล MoE ของจีน เช่น GLM 5.1 มาก่อน ก็คาดหวังได้ว่าจะมีพื้นที่สำหรับนักพัฒนาที่คล้ายกัน

สิ่งที่คุณยังไม่สามารถทำได้กับ ERNIE 5.1 (ในตอนนี้)
ควรกล่าวถึงไว้ เพื่อที่คุณจะได้ไม่ต้องออกแบบโดยคำนึงถึงสิ่งเหล่านี้แล้วมาเสียใจภายหลัง
- ไม่มีการป้อนภาพ ERNIE 5.1 รองรับเฉพาะข้อความ สำหรับเวิร์กโฟลว์แบบหลายโมดัลของ Baidu คุณยังคงต้องใช้ ERNIE-VL หรือโมเดลภาพภายนอก
- ไม่มีการป้อนหรือส่งออกเสียง ไม่มีการรู้จำเสียงหรือเสียงพูดแบบเรียลไทม์
- ไม่มีการเปิดเผยขนาดหน้าต่างบริบท จนกว่า Baidu จะยืนยันตัวเลขนี้ โปรดใช้กรณีการใช้งานเอกสารขนาดยาวอย่างระมัดระวัง
- ไม่มีน้ำหนักโมเดลใน HuggingFace นี่เป็นโมเดลที่โฮสต์เท่านั้น หากการติดตั้งในองค์กรมีความสำคัญ คุณจะต้องพิจารณา DeepSeek V4 ที่ติดตั้งในองค์กร หรือ LLM ที่ติดตั้งในองค์กร แทน
ERNIE 5.1 เปรียบเทียบกับโมเดลแนวหน้าของจีนอย่างไร
หากคุณกำลังเลือกระหว่าง DeepSeek, Kimi, GLM และ Qwen นี่คือแนวคิดง่ายๆ
เลือก ERNIE 5.1 เมื่อ คุณต้องการการใช้เครื่องมือแบบเอเจนต์ที่แข็งแกร่ง พร้อมการตอบคำถามที่เสริมด้วยการค้นหาในภาษาจีนหรืออังกฤษ และคุณต้องการราคาที่ถูกที่สุดบนคลาวด์ของจีน
เลือก DeepSeek V4 เมื่อคุณต้องการน้ำหนักโมเดลแบบเปิด การติดตั้งในองค์กร หรือคะแนนการให้เหตุผลล้วนๆ ที่แข็งแกร่งที่สุดในคณิตศาสตร์ที่ซับซ้อนโดยไม่มีเครื่องมือ
เลือก Kimi K2.6 เมื่อคุณต้องการหน้าต่างบริบทที่ยาวสำหรับการทำงานที่เน้นเอกสาร
เลือก GLM 5.1 เมื่อคุณต้องการโมเดลทั่วไปที่สมดุล และคุณมี Z.ai หรือ Zhipu อยู่แล้วในระบบของคุณ
นี่ไม่ใช่การจัดอันดับที่เข้มงวด แต่เป็นเรื่องของการแลกเปลี่ยนใดที่ตรงกับปริมาณงานของคุณ ลองประเมินเองด้วยพร้อมต์ 50 ชุดก่อนที่จะตัดสินใจใช้
จะลองใช้ ERNIE 5.1 ได้ที่ไหนวันนี้
สามช่องทาง เรียงตามลำดับความยุ่งยาก:
- ernie.baidu.com: UI แชทสำหรับผู้บริโภค ฟรี ไม่มีคีย์ API ในภูมิภาคจีน เหมาะที่สุดสำหรับการทดลองเขียนเชิงสร้างสรรค์และการให้เหตุผล
- Baidu AI Studio ERNIE 5.1 Playground: สนามเด็กเล่นที่โฮสต์ไว้พร้อมการสาธิตการเรียกใช้เครื่องมือที่ตั้งค่าไว้ล่วงหน้า เหมาะสำหรับการทดลองเชิงเอเจนต์ก่อนที่คุณจะเริ่มทำงานกับ API
- Qianfan API: จุดเชื่อมต่อสำหรับนักพัฒนา รูปแบบคำขอที่เข้ากันได้กับ OpenAI การรับรองความถูกต้องด้วย Bearer-token คู่มือการใช้งานแบบละเอียดอยู่ในโพสต์เสริมของเรา วิธีใช้ ERNIE 5.1 API
หากคุณกำลังประเมินผู้ให้บริการโมเดลจีนหลายรายพร้อมกัน Apidog เป็นวิธีที่สะอาดที่สุดในการจัดการคีย์ บันทึกเนื้อหาคำขอสำหรับผู้ให้บริการแต่ละราย และเปรียบเทียบการตอบกลับแบบเคียงข้างกันโดยไม่ต้องเขียนสคริปต์แบบใช้แล้วทิ้ง
ราคาและการเปิดตัว
Baidu ประกาศว่า ERNIE 5.1 จะถูกนำไปใช้ใน แพลตฟอร์มการผลิตเชิงสร้างสรรค์กว่า 10 แห่ง ในอีกไม่กี่สัปดาห์หลังจากการเปิดตัว ราคาต่อโทเค็นสาธารณะบน Qianfan ไม่ได้ระบุไว้ในโพสต์ประกาศ จากการอ้างอิงต้นทุนการฝึกอบรมเบื้องต้นประมาณ 6% และตารางราคา Qianfan ในอดีตของ Baidu คาดว่าราคาอินพุตจะอยู่ในช่วงเดียวกับ ERNIE 4.5 Turbo หรือต่ำกว่า ตรวจสอบคอนโซล Qianfan สดเสมอ ก่อนที่จะอ้างอิงตัวเลขภายในองค์กร
นักพัฒนาควรคิดเกี่ยวกับ ERNIE 5.1 อย่างไร
ข้อแนะนำที่เป็นรูปธรรมสามประการ หากคุณกำลังตัดสินใจว่าจะนำไปใช้ในระบบของคุณหรือไม่
1. ทดสอบกับเกณฑ์การประเมินเอเจนต์ของคุณเอง ไม่ใช่เกณฑ์มาตรฐานสาธารณะ τ³-bench เป็นสัญญาณที่ดีแต่ไม่ใช่ปริมาณงานของคุณ สร้างเกณฑ์การประเมิน 20-50 กรณีที่สะท้อนรูปแบบการใช้เครื่องมือจริงของคุณ จากนั้นเปรียบเทียบ ERNIE 5.1 กับโมเดลปัจจุบันของคุณ ทดสอบ LLM ในฐานะ API จะอธิบายวิธีหนึ่งในการทำเช่นนี้ด้วย Apidog
2. พิจารณาโมเดลนี้เป็นการเดิมพันกับคลาวด์ของจีน Qianfan โฮสต์อยู่ในจีน หากกฎระเบียบการจัดเก็บข้อมูลของคุณระบุว่า "ห้ามใช้โครงสร้างพื้นฐานของ PRC" สิ่งนี้ก็ไม่สามารถเริ่มต้นได้ไม่ว่าเกณฑ์มาตรฐานจะเป็นอย่างไร
3. จับตาดูการประกาศราคา การอ้างสิทธิ์ต้นทุนการฝึกอบรมเบื้องต้นประมาณ 6% เป็นตัวเลขที่น่าสนใจที่สุดในการเปิดตัว หาก Baidu ส่งผ่านสิ่งนี้ไปยัง API ราคาพื้นฐานของโมเดลจีนทั้งหมดจะลดลง ซึ่งจะบังคับให้ DeepSeek, Zhipu และ Moonshot ต้องตอบสนอง
คำถามที่พบบ่อย
ERNIE 5.1 เป็นโอเพนซอร์สหรือไม่? ไม่ใช่ ERNIE 5.1 เป็นโมเดลที่โฮสต์เท่านั้น ซึ่งสามารถเข้าถึงได้ผ่าน UI แชทของ Baidu, Baidu AI Studio และ Qianfan API ไม่มีน้ำหนักโมเดลสาธารณะบน HuggingFace ในขณะที่เขียนนี้
ERNIE 5.1 รองรับการป้อนภาพหรือวิสัยทัศน์หรือไม่? ไม่ใช่ ERNIE 5.1 รองรับเฉพาะข้อความเมื่อเปิดตัว ตระกูล ERNIE-VL ของ Baidu จัดการงานด้านวิสัยทัศน์ หากคุณต้องการโมเดลจีนแบบหลายโมดัลเดียว ให้พิจารณา Qwen 3.5 Omni แทน
ความยาวบริบทคือเท่าใด? Baidu ไม่ได้เปิดเผยตัวเลขหน้าต่างบริบทที่เฉพาะเจาะจงในโพสต์ประกาศ จนกว่าจะมีการยืนยัน ให้พิจารณาออกแบบเวิร์กโฟลว์เอกสารขนาดยาวอย่างรอบคอบและแบ่งส่วนอินพุต
ฉันสามารถใช้ ERNIE 5.1 จากนอกประเทศจีนได้หรือไม่? UI แชทและ Qianfan API สามารถเข้าถึงได้จากส่วนใหญ่ของภูมิภาคต่างๆ แต่ความล่าช้าและการยืนยันบัญชีจะแตกต่างกันไป คุณสมบัติบางอย่างสำหรับองค์กรยังคงต้องใช้หมายเลขโทรศัพท์หรือใบอนุญาตประกอบธุรกิจในจีนแผ่นดินใหญ่ คู่มือเสริม วิธีใช้ ERNIE 5.1 API จะอธิบายขั้นตอนการเข้าถึงโดยละเอียด
ERNIE 5.1 ดีกว่า DeepSeek-V4-Pro หรือไม่? ใน τ³-bench และ SpreadsheetBench-Verified ทาง Baidu ระบุว่าใช่ ในแง่ของการเข้าถึงน้ำหนักโมเดลแบบเปิด ไม่ใช่ ในเกณฑ์มาตรฐานคณิตศาสตร์ที่ใช้การให้เหตุผลล้วนๆ โดยไม่มีเครื่องมือ ตัวเลขสาธารณะยังไม่ให้คำตอบที่ชัดเจน ตำแหน่งที่ตรงไปตรงมาคือ: พวกมันมุ่งเป้าไปที่โมเดลการปรับใช้ที่แตกต่างกันเล็กน้อย
พร้อมที่จะเริ่มสร้างแล้วหรือยัง? ดาวน์โหลด Apidog และนำเข้า Qianfan OpenAPI spec เพื่อทดสอบ ERNIE 5.1 ควบคู่ไปกับโมเดลปัจจุบันของคุณในพื้นที่ทำงานเดียว
