ERNIE 5.1 คืออะไร โมเดล MoE ใหม่ล่าสุดจาก Baidu

Ashley Innocent

Ashley Innocent

14 May 2026

ERNIE 5.1 คืออะไร โมเดล MoE ใหม่ล่าสุดจาก Baidu

Apidog สำหรับองค์กร

ติดตั้งภายในองค์กร

SSO & RBAC

รองรับ SOC 2

สำรวจ Apidog Enterprise

Baidu เปิดตัว ERNIE 5.1 เมื่อวันที่ 9 พฤษภาคม 2026 และตัวเลขพาดหัวข่าวก็น่าจับตามอง: โมเดล Mixture-of-Experts ที่มีพารามิเตอร์รวมประมาณหนึ่งในสามของ ERNIE 5.0 ซึ่งติดอันดับ 4 ของโลกในตารางคะแนน Arena Search leaderboard และเป็นอันดับ 1 ในบรรดาโมเดลจีนด้วยคะแนน 1,223

นี่เป็น ERNIE ตระกูลแรกที่ Baidu เปิดเผยการแข่งขันด้านการใช้เครื่องมืออัตโนมัติ การเขียนเชิงสร้างสรรค์แบบยาว และการให้เหตุผลกับ Gemini 3.1 Pro และ DeepSeek-V4-Pro ซึ่งไม่จำกัดแค่เฉพาะงานภาษาจีนอีกต่อไป หากคุณพัฒนาด้วย Apidog และกำลังรอโมเดลแนวหน้าของจีนที่คุณสามารถนำไปใช้ในระบบเอเจนต์ได้โดยไม่ต้องใช้พารามิเตอร์ขนาด 70B การเปิดตัวครั้งนี้ก็คุ้มค่าแก่การพิจารณาอย่างถี่ถ้วน

ปุ่ม

คู่มือนี้จะอธิบายว่า ERNIE 5.1 คืออะไร มีอะไรเปลี่ยนแปลงภายใต้ระบบภายในอย่างไร ผลการเปรียบเทียบกับ DeepSeek-V4-Pro และ Gemini 3.1 Pro เป็นอย่างไร และโมเดลนี้เหมาะสมกับที่ไหนหากคุณใช้งาน DeepSeek V4 หรือ Kimi K2.6 อยู่แล้วในการผลิต

สรุปสั้นๆ: ERNIE 5.1 ในหนึ่งย่อหน้า

ERNIE 5.1 เป็นโมเดล MoE ที่รองรับเฉพาะข้อความ ซึ่งได้รับการฝึกฝนด้วยต้นทุนการฝึกอบรมเบื้องต้นประมาณ 6% ของโมเดลแนวหน้าที่เทียบเคียงได้ พารามิเตอร์รวมประมาณหนึ่งในสามของ ERNIE 5.0 และพารามิเตอร์ที่ใช้งานต่อการส่งผ่านหนึ่งครั้งประมาณครึ่งหนึ่ง ได้คะแนน 1,223 ในตารางคะแนน Arena Search leaderboard (อันดับ 4 ของโลก, อันดับ 1 ในจีน) ชนะ DeepSeek-V4-Pro ในเกณฑ์มาตรฐานการใช้เครื่องมืออัตโนมัติ τ³-bench และ SpreadsheetBench-Verified และได้คะแนน 99.6 ใน AIME26 พร้อมการใช้เครื่องมือ สามารถเข้าถึงได้ผ่าน ERNIE chat UI, ERNIE 5.1 Playground ของ Baidu AI Studio และ Qianfan API

ทำไมการเปิดตัวครั้งนี้จึงมีความสำคัญ

มีสามสิ่งที่โดดเด่น และไม่มีสิ่งใดเป็นเพียงแค่ "Baidu เปิดตัวโมเดลอีกแล้ว"

1. อัตราส่วนต้นทุนต่อคุณภาพ การฝึกอบรมเบื้องต้นด้วยต้นทุนประมาณ 6% ของโมเดลที่เทียบเคียงได้ เป็นตัวเลขที่กำหนดความคาดหวังด้านราคาใหม่ทั่วทั้งอุตสาหกรรม หาก Baidu สามารถให้บริการนี้ผ่าน Qianfan ด้วยค่าใช้จ่ายเพียงเศษเสี้ยวของราคาที่โมเดลแบบปิดแนวหน้าเรียกเก็บ ราคา API ก็จะปรับตามลงมา

2. การออกแบบ MoE ที่ยืดหยุ่นได้สามแกน โมเดล MoE ส่วนใหญ่จะกำหนดเส้นทางตามความกว้าง (ผู้เชี่ยวชาญที่ทำงาน) และบางครั้งก็ความลึก (การข้ามเลเยอร์) Baidu อ้างว่า ERNIE 5.1 กำหนดเส้นทางตาม ความลึก ความกว้าง และความเบาบาง (sparsity) พร้อมกัน ซึ่งเป็นวิธีที่พวกเขาย่อขนาดโมเดลโดยไม่สูญเสียคะแนนการใช้เครื่องมืออัตโนมัติ ซึ่งใกล้เคียงกับปรัชญาการออกแบบใน DeepSeek-V3.x มากกว่า MoE สไตล์ GShard ทั่วไป

3. ความสามารถด้านเอเจนต์คือหัวใจสำคัญ ไม่ใช่ส่วนเสริม ERNIE 5.0 ถูกวางตำแหน่งให้เป็นโมเดลความรู้และการเขียนเชิงสร้างสรรค์ แต่ ERNIE 5.1 วางตลาดอย่างชัดเจนว่ามี "ความสามารถด้านเอเจนต์เทียบเท่ากับโมเดลชั้นนำของโลก" และมาพร้อมกับ Baidu AI Studio playground ที่ปรับแต่งมาสำหรับการสาธิตการเรียกใช้เครื่องมือ นี่คือการเปลี่ยนแปลงเชิงกลยุทธ์

ผลการเปรียบเทียบมาตรฐาน

นี่คือสิ่งที่ Baidu เผยแพร่ โดยเปรียบเทียบกับจุดเปรียบเทียบสาธารณะที่ใกล้เคียงที่สุด

เกณฑ์มาตรฐาน ERNIE 5.1 สิ่งที่ทดสอบ คู่แข่งที่ใกล้เคียงที่สุด
ตารางคะแนน Arena Search leaderboard 1,223 (อันดับ 4 ของโลก, อันดับ 1 ในจีน) การตอบคำถามที่รับรู้การค้นหาและได้รับการประเมินโดยมนุษย์ Gemini 3.1 Pro, GPT-5.x
τ³-bench ชนะ DeepSeek-V4-Pro การใช้เครื่องมือแบบเอเจนต์, หลายรอบ DeepSeek-V4-Pro
SpreadsheetBench-Verified ชนะ DeepSeek-V4-Pro งานสเปรดชีตในโลกจริง DeepSeek-V4-Pro
AIME26 (พร้อมเครื่องมือ) 99.6 คณิตศาสตร์เชิงแข่งขันพร้อมล่ามโค้ด GPT-5.x, Gemini 3.1 Pro
GPQA "ใกล้เคียงกับโมเดลแบบปิดชั้นนำ" การตอบคำถามวิทยาศาสตร์ระดับบัณฑิตศึกษา Claude Sonnet 4.6
MMLU-Pro "ใกล้เคียงกับโมเดลแบบปิดชั้นนำ" ความรู้ทั่วไป โมเดลแนวหน้าทั้งหมด

ข้อควรระวังบางประการ คะแนน Arena ขึ้นอยู่กับการผสมผสานของพร้อมต์และกลุ่มผู้ลงคะแนน และพร้อมต์ที่เน้นภาษาจีนน่าจะช่วยได้ที่นี่ คะแนน AIME26-with-tools ก็ได้รับการเสริมด้วยเครื่องมือเช่นกัน ไม่มีการเปิดเผยตัวเลข AIME สำหรับการให้เหตุผลล้วนๆ การเขียนเชิงสร้างสรรค์อธิบายว่า "ใกล้เคียงกับ Gemini 3.1 Pro" มากกว่าที่จะเทียบเท่า

อย่างไรก็ตาม ผลลัพธ์ของ τ³-bench และ SpreadsheetBench เป็นสิ่งที่ควรให้ความสนใจ ทั้งสองเป็นแบบเอเจนต์ ทั้งสองได้รับการดูแลจากภายนอก และทั้งสองเป็นสิ่งที่ยากต่อการจัดการในอดีต

สิ่งที่เรารู้เกี่ยวกับสถาปัตยกรรม

Baidu เปิดเผยข้อมูลน้อยกว่าที่ DeepSeek ทำสำหรับเอกสารซีรีส์ V3 แต่สิ่งต่อไปนี้คือสิ่งที่โพสต์ประกาศและโพสต์ที่เกี่ยวข้องยืนยัน:

ไม่มีการเปิดเผยความยาวบริบท จำนวนพารามิเตอร์ที่แน่นอน และงบประมาณโทเค็นการฝึกอบรม หากคุณเคยสร้างด้วยโมเดล MoE ของจีน เช่น GLM 5.1 มาก่อน ก็คาดหวังได้ว่าจะมีพื้นที่สำหรับนักพัฒนาที่คล้ายกัน

สิ่งที่คุณยังไม่สามารถทำได้กับ ERNIE 5.1 (ในตอนนี้)

ควรกล่าวถึงไว้ เพื่อที่คุณจะได้ไม่ต้องออกแบบโดยคำนึงถึงสิ่งเหล่านี้แล้วมาเสียใจภายหลัง

ERNIE 5.1 เปรียบเทียบกับโมเดลแนวหน้าของจีนอย่างไร

หากคุณกำลังเลือกระหว่าง DeepSeek, Kimi, GLM และ Qwen นี่คือแนวคิดง่ายๆ

เลือก ERNIE 5.1 เมื่อ คุณต้องการการใช้เครื่องมือแบบเอเจนต์ที่แข็งแกร่ง พร้อมการตอบคำถามที่เสริมด้วยการค้นหาในภาษาจีนหรืออังกฤษ และคุณต้องการราคาที่ถูกที่สุดบนคลาวด์ของจีน

เลือก DeepSeek V4 เมื่อคุณต้องการน้ำหนักโมเดลแบบเปิด การติดตั้งในองค์กร หรือคะแนนการให้เหตุผลล้วนๆ ที่แข็งแกร่งที่สุดในคณิตศาสตร์ที่ซับซ้อนโดยไม่มีเครื่องมือ

เลือก Kimi K2.6 เมื่อคุณต้องการหน้าต่างบริบทที่ยาวสำหรับการทำงานที่เน้นเอกสาร

เลือก GLM 5.1 เมื่อคุณต้องการโมเดลทั่วไปที่สมดุล และคุณมี Z.ai หรือ Zhipu อยู่แล้วในระบบของคุณ

นี่ไม่ใช่การจัดอันดับที่เข้มงวด แต่เป็นเรื่องของการแลกเปลี่ยนใดที่ตรงกับปริมาณงานของคุณ ลองประเมินเองด้วยพร้อมต์ 50 ชุดก่อนที่จะตัดสินใจใช้

จะลองใช้ ERNIE 5.1 ได้ที่ไหนวันนี้

สามช่องทาง เรียงตามลำดับความยุ่งยาก:

  1. ernie.baidu.com: UI แชทสำหรับผู้บริโภค ฟรี ไม่มีคีย์ API ในภูมิภาคจีน เหมาะที่สุดสำหรับการทดลองเขียนเชิงสร้างสรรค์และการให้เหตุผล
  2. Baidu AI Studio ERNIE 5.1 Playground: สนามเด็กเล่นที่โฮสต์ไว้พร้อมการสาธิตการเรียกใช้เครื่องมือที่ตั้งค่าไว้ล่วงหน้า เหมาะสำหรับการทดลองเชิงเอเจนต์ก่อนที่คุณจะเริ่มทำงานกับ API
  3. Qianfan API: จุดเชื่อมต่อสำหรับนักพัฒนา รูปแบบคำขอที่เข้ากันได้กับ OpenAI การรับรองความถูกต้องด้วย Bearer-token คู่มือการใช้งานแบบละเอียดอยู่ในโพสต์เสริมของเรา วิธีใช้ ERNIE 5.1 API

หากคุณกำลังประเมินผู้ให้บริการโมเดลจีนหลายรายพร้อมกัน Apidog เป็นวิธีที่สะอาดที่สุดในการจัดการคีย์ บันทึกเนื้อหาคำขอสำหรับผู้ให้บริการแต่ละราย และเปรียบเทียบการตอบกลับแบบเคียงข้างกันโดยไม่ต้องเขียนสคริปต์แบบใช้แล้วทิ้ง

ราคาและการเปิดตัว

Baidu ประกาศว่า ERNIE 5.1 จะถูกนำไปใช้ใน แพลตฟอร์มการผลิตเชิงสร้างสรรค์กว่า 10 แห่ง ในอีกไม่กี่สัปดาห์หลังจากการเปิดตัว ราคาต่อโทเค็นสาธารณะบน Qianfan ไม่ได้ระบุไว้ในโพสต์ประกาศ จากการอ้างอิงต้นทุนการฝึกอบรมเบื้องต้นประมาณ 6% และตารางราคา Qianfan ในอดีตของ Baidu คาดว่าราคาอินพุตจะอยู่ในช่วงเดียวกับ ERNIE 4.5 Turbo หรือต่ำกว่า ตรวจสอบคอนโซล Qianfan สดเสมอ ก่อนที่จะอ้างอิงตัวเลขภายในองค์กร

นักพัฒนาควรคิดเกี่ยวกับ ERNIE 5.1 อย่างไร

ข้อแนะนำที่เป็นรูปธรรมสามประการ หากคุณกำลังตัดสินใจว่าจะนำไปใช้ในระบบของคุณหรือไม่

1. ทดสอบกับเกณฑ์การประเมินเอเจนต์ของคุณเอง ไม่ใช่เกณฑ์มาตรฐานสาธารณะ τ³-bench เป็นสัญญาณที่ดีแต่ไม่ใช่ปริมาณงานของคุณ สร้างเกณฑ์การประเมิน 20-50 กรณีที่สะท้อนรูปแบบการใช้เครื่องมือจริงของคุณ จากนั้นเปรียบเทียบ ERNIE 5.1 กับโมเดลปัจจุบันของคุณ ทดสอบ LLM ในฐานะ API จะอธิบายวิธีหนึ่งในการทำเช่นนี้ด้วย Apidog

2. พิจารณาโมเดลนี้เป็นการเดิมพันกับคลาวด์ของจีน Qianfan โฮสต์อยู่ในจีน หากกฎระเบียบการจัดเก็บข้อมูลของคุณระบุว่า "ห้ามใช้โครงสร้างพื้นฐานของ PRC" สิ่งนี้ก็ไม่สามารถเริ่มต้นได้ไม่ว่าเกณฑ์มาตรฐานจะเป็นอย่างไร

3. จับตาดูการประกาศราคา การอ้างสิทธิ์ต้นทุนการฝึกอบรมเบื้องต้นประมาณ 6% เป็นตัวเลขที่น่าสนใจที่สุดในการเปิดตัว หาก Baidu ส่งผ่านสิ่งนี้ไปยัง API ราคาพื้นฐานของโมเดลจีนทั้งหมดจะลดลง ซึ่งจะบังคับให้ DeepSeek, Zhipu และ Moonshot ต้องตอบสนอง

คำถามที่พบบ่อย

ERNIE 5.1 เป็นโอเพนซอร์สหรือไม่? ไม่ใช่ ERNIE 5.1 เป็นโมเดลที่โฮสต์เท่านั้น ซึ่งสามารถเข้าถึงได้ผ่าน UI แชทของ Baidu, Baidu AI Studio และ Qianfan API ไม่มีน้ำหนักโมเดลสาธารณะบน HuggingFace ในขณะที่เขียนนี้

ERNIE 5.1 รองรับการป้อนภาพหรือวิสัยทัศน์หรือไม่? ไม่ใช่ ERNIE 5.1 รองรับเฉพาะข้อความเมื่อเปิดตัว ตระกูล ERNIE-VL ของ Baidu จัดการงานด้านวิสัยทัศน์ หากคุณต้องการโมเดลจีนแบบหลายโมดัลเดียว ให้พิจารณา Qwen 3.5 Omni แทน

ความยาวบริบทคือเท่าใด? Baidu ไม่ได้เปิดเผยตัวเลขหน้าต่างบริบทที่เฉพาะเจาะจงในโพสต์ประกาศ จนกว่าจะมีการยืนยัน ให้พิจารณาออกแบบเวิร์กโฟลว์เอกสารขนาดยาวอย่างรอบคอบและแบ่งส่วนอินพุต

ฉันสามารถใช้ ERNIE 5.1 จากนอกประเทศจีนได้หรือไม่? UI แชทและ Qianfan API สามารถเข้าถึงได้จากส่วนใหญ่ของภูมิภาคต่างๆ แต่ความล่าช้าและการยืนยันบัญชีจะแตกต่างกันไป คุณสมบัติบางอย่างสำหรับองค์กรยังคงต้องใช้หมายเลขโทรศัพท์หรือใบอนุญาตประกอบธุรกิจในจีนแผ่นดินใหญ่ คู่มือเสริม วิธีใช้ ERNIE 5.1 API จะอธิบายขั้นตอนการเข้าถึงโดยละเอียด

ERNIE 5.1 ดีกว่า DeepSeek-V4-Pro หรือไม่? ใน τ³-bench และ SpreadsheetBench-Verified ทาง Baidu ระบุว่าใช่ ในแง่ของการเข้าถึงน้ำหนักโมเดลแบบเปิด ไม่ใช่ ในเกณฑ์มาตรฐานคณิตศาสตร์ที่ใช้การให้เหตุผลล้วนๆ โดยไม่มีเครื่องมือ ตัวเลขสาธารณะยังไม่ให้คำตอบที่ชัดเจน ตำแหน่งที่ตรงไปตรงมาคือ: พวกมันมุ่งเป้าไปที่โมเดลการปรับใช้ที่แตกต่างกันเล็กน้อย

พร้อมที่จะเริ่มสร้างแล้วหรือยัง? ดาวน์โหลด Apidog และนำเข้า Qianfan OpenAPI spec เพื่อทดสอบ ERNIE 5.1 ควบคู่ไปกับโมเดลปัจจุบันของคุณในพื้นที่ทำงานเดียว

ปุ่ม

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API