Alibaba ได้เปิดตัวเรือธงสองรุ่นใน Qwen 3.7 series ภายในสองสัปดาห์: Qwen3.7-Max ซึ่งเป็นโมเดลการให้เหตุผลเฉพาะข้อความ และ Qwen3.7-Plus ซึ่งเป็นเวอร์ชันหลายโมดอลที่เพิ่มวิสัยทัศน์และมีราคาถูกกว่ามาก ทั้งสองรุ่นมีบริบทขนาด 1M โทเค็นเท่ากัน และเพดานการทำงานอิสระ 35 ชั่วโมงเท่ากัน ดังนั้นการเลือกจึงไม่ใช่เรื่องง่ายจากตารางข้อมูลจำเพาะเพียงอย่างเดียว
คู่มือนี้จะนำทั้งสองรุ่นมาเปรียบเทียบกันในด้านเกณฑ์มาตรฐาน ราคา ความเร็ว และการตัดสินใจเลือกใช้งานในชีวิตประจำวัน หากคุณต้องการข้อมูลเบื้องหลังของแต่ละโมเดลก่อน โปรดดู ภาพรวมของ Qwen 3.7 Plus และคู่มือ Qwen 3.7 คืออะไร ในวงกว้าง ไม่ว่าคุณจะเลือกรุ่นใด คุณจะต้องเรียกใช้งานผ่าน API และต้องทดสอบการตอบกลับ ซึ่งเป็นส่วนที่ Apidog เข้ามาช่วยได้ ซึ่งจะกล่าวถึงในตอนท้าย
คำตอบสั้นๆ
เลือก Plus เป็นค่าเริ่มต้น มันเทียบเท่า Max ในการใช้เครื่องมือ เหนือกว่าเล็กน้อยในงานที่ต้องทำในเทอร์มินัล เพิ่มอินพุตภาพและวิดีโอ และมีราคาถูกกว่าประมาณหกเท่า สำหรับงานส่วนใหญ่ การตัดสินใจนั้นทำขึ้นจากราคาเพียงอย่างเดียว

เลือก Max ก็ต่อเมื่อคุณต้องการประสิทธิภาพสูงสุดสำหรับข้อความเท่านั้น มันยังคงนำเล็กน้อยในตารางจัดอันดับเฉพาะข้อความ และทำงานได้เร็วกว่าเล็กน้อยในการเริ่มต้นแบบเย็น (cold starts) เฉพาะข้อความ หากงานของคุณไม่เคยต้องใช้ภาพหน้าจอหรือภาพเอกสาร ข้อได้เปรียบนั้นอาจสำคัญ สำหรับงานอื่นๆ ทั้งหมด Plus ชนะ
ความแตกต่างหลัก
Max คือเรือธงเฉพาะข้อความ มันให้เหตุผล เขียนโค้ด และรันเชนตัวแทนยาวๆ ได้ทั้งหมดจากอินพุตข้อความ Plus ใช้โครงสร้างพื้นฐานเดียวกันและเพิ่มดวงตาเข้าไป: มันรับภาพและวิดีโอ และมันสามารถกำหนดพิกัด GUI ได้ดีพอที่จะคืนค่าพิกัดการคลิกที่แม่นยำจากภาพหน้าจอ จากนั้นก็ลดราคาลงเมื่อเทียบกับ Max

ดังนั้นการแลกเปลี่ยนจึงแคบมาก คุณยอมทิ้งข้อได้เปรียบเล็กน้อยในด้านคุณภาพข้อความและความหน่วง และคุณได้รับวิสัยทัศน์บวกกับค่าใช้จ่ายที่ถูกลงมาก
เกณฑ์มาตรฐาน
ตัวเลขบอกเล่าเรื่องราวที่สอดคล้องกัน Plus ตามหลัง Max เล็กน้อยในข้อความล้วน เสมอกันในการใช้เครื่องมือ และนำหน้าทันทีที่วิสัยทัศน์เข้ามาเกี่ยวข้อง
| เกณฑ์มาตรฐาน | Qwen 3.7 Plus | Qwen 3.7 Max |
|---|---|---|
| LM Arena (ข้อความ) | อันดับที่ 15 | อันดับที่ 13 |
| LM Arena (การเขียนโค้ด) | อันดับที่ 12 | อันดับที่ 10 |
| Vision Arena | อันดับที่ 16 | ใช้ไม่ได้ |
| SWE-Bench Pro | ~60% | 60.6% |
| Terminal-Bench (2.0 Terminus) | 70.3 | 69.7 |
| ScreenSpot Pro (GUI grounding) | 79.0 | ไม่มี |
| MCP-Atlas (การใช้เครื่องมือ) | 76.4 | 76.4 |
มีสามสิ่งที่โดดเด่น
SWE-Bench Pro แทบจะเสมอกัน Plus ทำได้ประมาณ 60% เทียบกับ Max ที่ 60.6% สำหรับงานซอฟต์แวร์จริง พารามิเตอร์วิสัยทัศน์ไม่ได้ทำให้ Plus สูญเสียความสามารถในการเขียนโค้ดอย่างมีนัยสำคัญ การเปรียบเทียบ Qwen 3.7 vs GPT-5.5 vs Opus 4.7 ของเราแสดงให้เห็นตำแหน่งเมื่อเทียบกับเรือธงของตะวันตก
Plus ชนะ Terminal-Bench จริงๆ ที่ 70.3 ต่อ 69.7 สำหรับงานตัวแทนที่เน้น Shell โมเดลที่ถูกกว่าก็เป็นโมเดลที่แข็งแกร่งกว่าเล็กน้อย
GUI grounding คือตัวแยกที่แท้จริง ScreenSpot Pro 79.0 อยู่ในระดับแนวหน้า และ Max ไม่สามารถรันได้เลย หากตัวแทนของคุณต้องมองหน้าจอ มีเพียงโมเดลเดียวเท่านั้นที่มีคุณสมบัติเหมาะสม เช่นเคย โปรดถือว่าตัวเลขเกณฑ์มาตรฐานของผู้ขายเป็นแนวทาง ไม่ใช่พระคัมภีร์ เว็บไซต์ SWE-bench อธิบายว่าแต่ละชุดวัดอะไร
ราคา
นี่คือจุดที่ความแตกต่างกว้างไกล
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| อินพุต / 1M โทเค็น | $0.40 | $2.50 |
| เอาต์พุต / 1M โทเค็น | $1.60 | $7.50 |
| อินพุตที่แคช / 1M | $0.08 | $0.25 |
Plus มีราคาถูกกว่าประมาณหกเท่าสำหรับอินพุต และถูกกว่าเกือบห้าเท่าสำหรับเอาต์พุต สำหรับเอเจนต์ที่มีปริมาณมากหรือทำงานเป็นเวลานาน อัตราส่วนนั้นจะตัดสินงบประมาณ โมเดลที่ถูกกว่ายังสามารถอ่านภาพได้ ซึ่งทำให้ Max เป็นการขายที่ยาก เว้นแต่คุณจะต้องการความได้เปรียบด้านข้อความโดยเฉพาะ
ข้อควรระวังสำหรับ Plus: รูปภาพและวิดีโอจะถูกแปลงเป็นโทเค็นและใช้บริบท 1M โทเค็นร่วมกัน ดังนั้นปริมาณงานที่เน้นภาพหน้าจอหรือวิดีโอจะใช้จ่ายต่อการเรียกมากกว่าอัตราต่อโทเค็นที่แนะนำ ควรปรับขนาดภาพลงและสุ่มตัวอย่างวิดีโออย่างประหยัด บันทึกของเราเกี่ยวกับ การลดต้นทุนโทเค็นของเอเจนต์ และ สงครามราคา LLM ของจีนในปี 2026 ครอบคลุมภาพรวมต้นทุนที่กว้างขึ้น อัตราอย่างเป็นทางการอยู่ที่ หน้าการกำหนดราคา Model Studio
ข้อมูลจำเพาะและความเร็ว
| Qwen 3.7 Plus | Qwen 3.7 Max | |
|---|---|---|
| รูปแบบอินพุต | ข้อความ, รูปภาพ, วิดีโอ | ข้อความเท่านั้น |
| หน้าต่างบริบท | 1M (ใช้ร่วมกับวิสัยทัศน์) | 1M |
| เพดานการทำงานอัตโนมัติ | 35 ชั่วโมง | 35 ชั่วโมง |
| ความหน่วงเฉพาะข้อความ | ค่าพื้นฐาน | เร็วขึ้น ~7–15% สำหรับเส้นทางแบบเย็น |
| น้ำหนักโมเดล | กรรมสิทธิ์, API เท่านั้น | กรรมสิทธิ์, API เท่านั้น |
ความหน่วงคือข้อได้เปรียบที่เงียบงันของ Max ในการเริ่มต้นแบบเย็นเฉพาะข้อความ มันตอบสนองได้เร็วกว่าอย่างเห็นได้ชัด ซึ่งสะสมเพิ่มขึ้นในผลิตภัณฑ์สไตล์แชทที่ผู้ใช้มองเห็นเวลาในการส่งโทเค็นแรกได้ การวิเคราะห์อิสระ ติดตามการแลกเปลี่ยนความเร็วและความฉลาดอย่างละเอียด โมเดลทั้งสองมีน้ำหนักปิดและทำงานผ่าน Alibaba Cloud Model Studio เท่านั้น ดังนั้นจึงไม่มีตัวเลือกใดที่เหมาะหากคุณต้องการโฮสต์ด้วยตนเอง
คุณควรเลือกรุ่นไหน
เลือกรุ่น Qwen 3.7 Plus หาก:
- งานของคุณเกี่ยวข้องกับรูปภาพ ภาพหน้าจอ PDF หรือวิดีโอ
- คุณกำลังสร้างเอเจนต์สำหรับใช้คอมพิวเตอร์หรือ GUI ที่อ่านหน้าจอ
- เรื่องค่าใช้จ่ายมีความสำคัญ ซึ่งจากตัวเลขเหล่านี้หมายถึงเกือบตลอดเวลา
เลือกรุ่น Qwen 3.7 Max หาก:
- คุณกำลังปรับแต่งเพื่อคะแนน SWE-Bench Pro เฉพาะข้อความเท่านั้น
- คุณต้องการการตอบสนองข้อความที่เร็วที่สุดในผลิตภัณฑ์ที่ไวต่อความหน่วง
- คุณไม่เคยส่งอินพุตภาพและต้องการคุณภาพข้อความทุกจุด
สำหรับทีมส่วนใหญ่ Plus เป็นค่าเริ่มต้นที่สมเหตุสมผล และ Max เป็นรุ่นพิเศษ ช่องว่างของราคาใหญ่พอที่คุณจะต้องการเหตุผลที่เป็นรูปธรรมเพื่อจ่ายแพงกว่าหกเท่าสำหรับโมเดลเฉพาะข้อความ
เพื่อให้เป็นรูปธรรมมากขึ้น นี่คือวิธีที่ปริมาณงานทั่วไปจะถูกแมป:
| ปริมาณงาน | เลือก | เหตุผล |
|---|---|---|
| QA ภาพหน้าจอหรือเอเจนต์การถดถอยภาพ | Plus | ต้องใช้ GUI grounding; มีเพียง Plus เท่านั้นที่มองเห็นหน้าจอได้ |
| การสกัดข้อมูลจากใบแจ้งหนี้, ใบเสร็จรับเงิน หรือ PDF ที่สแกน | Plus | ภาพเอกสารต้องใช้อินพุตภาพ |
| การจำแนกข้อความปริมาณมาก | Plus | คุณภาพข้อความเท่ากัน แต่ราคาถูกกว่ามาก |
| แชทบอทสนับสนุนลูกค้าที่มีความหน่วงต่ำ | Max | การเริ่มต้นแบบเย็นเฉพาะข้อความที่เร็วกว่ามีความสำคัญต่อผู้ใช้ |
| การรันโค้ดอัตโนมัติเป็นเวลานาน | ทั้งสอง | เสมอกันใน SWE-Bench Pro ดังนั้นให้ราคาเป็นตัวตัดสิน |
รูปแบบซ้ำๆ: เว้นแต่ปริมาณงานจะเป็นแบบข้อความเท่านั้นและมีความอ่อนไหวต่อความหน่วง โมเดลหลายโมดอลที่ถูกกว่าคือค่าเริ่มต้นที่ปลอดภัยกว่า
การทดสอบทั้งสองด้วย Apidog
โมเดลทั้งสองใช้ปลายทาง Model Studio ที่เข้ากันได้กับ OpenAI เดียวกัน ดังนั้นการสลับระหว่างกันจึงเป็นการเปลี่ยนรหัสโมเดลเพียงบรรทัดเดียว ทำให้เปรียบเทียบกันได้ง่ายโดยตรง: ส่งข้อความแจ้งเดียวกันไปยัง qwen3.7-plus และ qwen3.7-max จัดเรียงการตอบกลับ และดูว่าช่องว่างราคาคุ้มค่าสำหรับงานของคุณหรือไม่

Apidog ถูกสร้างขึ้นมาเพื่อลูปนั้น ยิงคำขอไปยังทั้งสองโมเดล ตรวจสอบ JSON ดิบเคียงข้างกัน จัดเก็บคีย์ Model Studio ของคุณต่อสภาพแวดล้อม และจำลองปลายทางเพื่อให้แอปของคุณยังคงสร้างต่อไป สำหรับคำขอ Plus แบบหลายโมดอล คู่มือ API ของ Qwen 3.7 Plus ของเราแสดงรูปแบบเพย์โหลดของรูปภาพและวิดีโอ และ คู่มือ API พื้นฐานของ Qwen 3.7 ครอบคลุมเส้นทางข้อความ เมื่อโมเดลใดโมเดลหนึ่งกำลังเชื่อมโยงการเรียกเครื่องมือในการทำงานของเอเจนต์ ตัวดีบักเอเจนต์ AI ของ Apidog จะแสดงลำดับทั้งหมด
ดาวน์โหลด Apidog เพื่อทดสอบและเปรียบเทียบโมเดล Qwen 3.7 ทั้งสองก่อนที่คุณจะนำไปใช้งานจริง
คำถามที่พบบ่อย
Qwen 3.7 Plus ดีกว่า Max หรือไม่? สำหรับปริมาณงานส่วนใหญ่ ใช่ เพราะมันเพิ่มวิสัยทัศน์และมีราคาถูกกว่ามาก ในขณะที่เทียบเท่า Max ในการเขียนโค้ดและการใช้เครื่องมือ Max ยังคงนำเล็กน้อยในตารางจัดอันดับเฉพาะข้อความและความหน่วงเฉพาะข้อความ
Plus ราคาถูกกว่าแค่ไหน? ถูกกว่าประมาณหกเท่าสำหรับอินพุต (0.40 ดอลลาร์เทียบกับ 2.50 ดอลลาร์ต่อล้านโทเค็น) และถูกกว่าเกือบห้าเท่าสำหรับเอาต์พุต (1.60 ดอลลาร์เทียบกับ 7.50 ดอลลาร์)
ทั้งสองใช้หน้าต่างบริบทเดียวกันหรือไม่? ใช่ ทั้งสองมีหน้าต่าง 1M โทเค็น สำหรับ Plus รูปภาพและวิดีโอจะใช้โทเค็นจากงบประมาณเดียวกันนั้น
Max สามารถประมวลผลรูปภาพได้หรือไม่? ไม่ได้ Max เป็นแบบข้อความเท่านั้น หากคุณต้องการอินพุตภาพหรือวิดีโอ คุณต้องใช้ Plus
ทั้งสองเป็นโอเพนซอร์สหรือไม่? ไม่ได้ ทั้งสองเป็นกรรมสิทธิ์และทำงานผ่าน Alibaba Cloud Model Studio เท่านั้น คุณไม่สามารถดาวน์โหลดหรือโฮสต์น้ำหนักของโมเดลได้ด้วยตนเอง
รุ่นไหนเร็วกว่ากัน? Max เร็วกว่าประมาณ 7 ถึง 15% ในเส้นทางเย็นเฉพาะข้อความ สำหรับงานผสมหรือวิสัยทัศน์ Plus เป็นทางเลือกเดียวอยู่แล้ว
สรุป
Qwen 3.7 Max และ Plus ไม่ได้แข่งขันกันในงานเดียวกัน Max เป็นผู้ที่เน้นข้อความบริสุทธิ์พร้อมข้อได้เปรียบเล็กน้อยในด้านความเร็วและคุณภาพ ส่วน Plus เป็นรุ่นทั่วไปที่มีหลายโมดอลที่ถูกกว่า และชนะแทบทุกที่ที่ราคาหรือวิสัยทัศน์มีความสำคัญ เริ่มต้นด้วย Plus และใช้ Max ก็ต่อเมื่อปริมาณงานเฉพาะข้อความสมควรได้รับค่าพรีเมียม ไม่ว่าจะเลือกแบบใด ให้ทดสอบ API ใน Apidog เพื่อให้สิ่งที่คุณนำไปใช้งานมีพฤติกรรมตามที่เกณฑ์มาตรฐานสัญญาไว้
