Qwen 3.7 Plus hay Max: Nên chọn mô hình Qwen 3.7 nào?

Alibaba đã ra mắt hai mẫu flagship trong dòng Qwen 3.7 trong vòng hai tuần: Qwen3.7-Max, mô hình lý luận chỉ dựa trên văn bản, và Qwen3.7-Plus, phiên bản đa phương thức bổ sung khả năng nhìn và có giá chỉ bằng một phần nhỏ. Cả hai đều có cùng ngữ cảnh 1M token và cùng giới hạn tự động 35 giờ, do đó việc lựa chọn không dễ dàng chỉ dựa vào bảng thông số kỹ thuật.

Hướng dẫn này sẽ so sánh chúng dựa trên các tiêu chí về điểm chuẩn, giá cả, tốc độ và quyết định sử dụng hàng ngày. Nếu bạn muốn tìm hiểu tổng quan về từng mô hình trước, hãy xem tổng quan về Qwen 3.7 Plus của chúng tôi và hướng dẫn rộng hơn Qwen 3.7 là gì. Dù bạn chọn mẫu nào, bạn sẽ gọi nó qua API và cần kiểm tra các phản hồi; đó là lúc Apidog phát huy tác dụng, được đề cập ở cuối.

Trả lời ngắn gọn

Mặc định chọn Plus. Nó sánh ngang với Max về khả năng sử dụng công cụ, vượt trội hơn về các tác vụ đầu cuối, bổ sung khả năng nhập liệu hình ảnh và video, và có giá rẻ hơn khoảng sáu lần. Đối với hầu hết các khối lượng công việc, quyết định này đã được đưa ra chỉ dựa vào giá cả.

Chỉ chọn Max khi bạn tối ưu hóa hoàn toàn cho văn bản. Nó giữ một lợi thế nhỏ trên các bảng xếp hạng chỉ văn bản và chạy nhanh hơn một chút khi khởi động nguội chỉ văn bản. Nếu công việc của bạn không bao giờ liên quan đến ảnh chụp màn hình hoặc hình ảnh tài liệu, lợi thế đó có thể quan trọng. Đối với mọi thứ khác, Plus chiến thắng.

Sự khác biệt cốt lõi

Max là flagship thuần văn bản. Nó lý luận, viết mã và chạy các chuỗi tác nhân dài, tất cả đều từ đầu vào văn bản. Plus sử dụng cùng một nền tảng và bổ sung khả năng nhìn: nó chấp nhận hình ảnh và video, và nó định vị tốt các GUI đủ để trả về tọa độ nhấp chuột chính xác từ ảnh chụp màn hình. Sau đó, nó lại có giá thấp hơn Max.

Vì vậy, sự đánh đổi là rất nhỏ. Bạn từ bỏ một chút lợi thế về chất lượng văn bản và độ trễ, và bạn có được khả năng nhìn cùng với hóa đơn rẻ hơn nhiều.

Điểm chuẩn

Các con số kể một câu chuyện nhất quán. Plus hơi kém Max về văn bản thuần túy, ngang bằng về sử dụng công cụ và vượt lên ngay khi có khả năng nhìn.

Điểm chuẩn	Qwen 3.7 Plus	Qwen 3.7 Max
LM Arena (văn bản)	#15	#13
LM Arena (mã hóa)	#12	#10
Vision Arena	#16	Không áp dụng
SWE-Bench Pro	~60%	60.6%
Terminal-Bench (2.0 Terminus)	70.3	69.7
ScreenSpot Pro (định vị GUI)	79.0	Không có
MCP-Atlas (sử dụng công cụ)	76.4	76.4

Ba điều nổi bật.

SWE-Bench Pro thực tế là hòa. Plus đạt khoảng 60% so với 60.6% của Max. Trong các tác vụ phần mềm thực tế, các thông số về thị giác không làm Plus mất đi bất kỳ khả năng mã hóa đáng kể nào. So sánh Qwen 3.7 với GPT-5.5 và Opus 4.7 của chúng tôi cho thấy vị trí của nó so với các flagship phương Tây.

Plus thực sự thắng Terminal-Bench, 70.3 so với 69.7. Đối với các tác vụ tác nhân nặng về shell, mô hình rẻ hơn cũng là mô hình mạnh hơn một chút.

Định vị GUI là yếu tố phân biệt thực sự. ScreenSpot Pro 79.0 là cấp độ tiên phong, và Max hoàn toàn không thể chạy nó. Nếu tác nhân của bạn phải nhìn vào màn hình, chỉ một trong số các mô hình này đủ điều kiện. Như mọi khi, hãy xem các con số điểm chuẩn của nhà cung cấp như một hướng dẫn, không phải là chân lý; trang web SWE-bench giải thích mỗi bộ đo lường gì.

Giá cả

Đây là nơi khoảng cách rất lớn.

	Qwen 3.7 Plus	Qwen 3.7 Max
Đầu vào / 1M token	$0.40	$2.50
Đầu ra / 1M token	$1.60	$7.50
Đầu vào được lưu vào bộ nhớ đệm / 1M	$0.08	$0.25

Plus rẻ hơn khoảng sáu lần về đầu vào và gần năm lần về đầu ra. Đối với các tác nhân có khối lượng lớn hoặc chạy dài, tỷ lệ đó quyết định ngân sách. Mô hình rẻ hơn cũng đọc được hình ảnh, điều này khiến Max khó bán trừ khi bạn đặc biệt cần lợi thế văn bản của nó.

Một lưu ý cho Plus: hình ảnh và video được token hóa và chia sẻ ngân sách ngữ cảnh 1M, vì vậy một khối lượng công việc nặng về ảnh chụp màn hình hoặc video sẽ tốn nhiều hơn cho mỗi lần gọi so với mức giá mỗi token gợi ý. Hãy giảm kích thước hình ảnh và lấy mẫu video một cách tiết kiệm. Các ghi chú của chúng tôi về giảm chi phí token tác nhân và cuộc chiến giá LLM Trung Quốc 2026 bao gồm bức tranh chi phí rộng hơn. Mức giá chính thức có trên trang giá của Model Studio.

Thông số kỹ thuật và tốc độ

	Qwen 3.7 Plus	Qwen 3.7 Max
Chế độ đầu vào	Văn bản, hình ảnh, video	Chỉ văn bản
Cửa sổ ngữ cảnh	1M (chia sẻ với khả năng nhìn)	1M
Giới hạn chạy tự động	35 giờ	35 giờ
Độ trễ chỉ văn bản	Cơ bản	Nhanh hơn ~7–15% khi khởi động nguội
Trọng số	Độc quyền, chỉ API	Độc quyền, chỉ API

Độ trễ là lợi thế thầm lặng của Max. Khi khởi động nguội chỉ văn bản, nó phản hồi nhanh hơn đáng kể, điều này rất quan trọng trong các sản phẩm kiểu trò chuyện nơi thời gian tạo token đầu tiên hiển thị với người dùng; phân tích độc lập theo dõi chi tiết sự đánh đổi giữa tốc độ và trí thông minh. Cả hai mô hình đều có trọng số đóng và chỉ chạy thông qua Alibaba Cloud Model Studio, vì vậy không mô hình nào là một lựa chọn nếu bạn cần tự host.

Bạn nên chọn loại nào

Chọn Qwen 3.7 Plus nếu:

Công việc của bạn liên quan đến hình ảnh, ảnh chụp màn hình, PDF hoặc video.
Bạn đang xây dựng các tác nhân sử dụng máy tính hoặc GUI đọc màn hình.
Chi phí là vấn đề, mà với các con số này thì gần như luôn luôn đúng.

Chọn Qwen 3.7 Max nếu:

Bạn đang tối ưu hóa thuần túy cho điểm SWE-Bench Pro chỉ văn bản.
Bạn cần phản hồi văn bản nhanh nhất trong một sản phẩm nhạy cảm với độ trễ.
Bạn không bao giờ gửi đầu vào trực quan và muốn chất lượng văn bản tốt nhất.

Đối với hầu hết các nhóm, Plus là lựa chọn mặc định hợp lý và Max là chuyên gia. Khoảng cách chi phí đủ lớn để bạn cần một lý do cụ thể để trả gấp sáu lần cho một mô hình chỉ văn bản.

Để làm rõ điều đó, đây là cách các khối lượng công việc phổ biến được ánh xạ:

Khối lượng công việc	Lựa chọn	Lý do
QA ảnh chụp màn hình hoặc tác nhân hồi quy trực quan	Plus	Cần định vị GUI; chỉ Plus mới nhìn thấy màn hình
Trích xuất hóa đơn, biên lai hoặc PDF được quét	Plus	Hình ảnh tài liệu yêu cầu đầu vào thị giác
Phân loại văn bản khối lượng lớn	Plus	Chất lượng văn bản tương tự, một phần nhỏ chi phí
Chatbot hỗ trợ khách hàng độ trễ thấp	Max	Khởi động nguội chỉ văn bản nhanh hơn quan trọng đối với người dùng
Chạy mã tự động dài	Một trong hai	Chúng hòa nhau trên SWE-Bench Pro, vậy hãy để chi phí quyết định

Quy tắc lặp lại: trừ khi khối lượng công việc chỉ bao gồm văn bản và nhạy cảm với độ trễ, mô hình đa phương thức rẻ hơn là lựa chọn mặc định an toàn hơn.

Kiểm tra cả hai bằng Apidog

Cả hai mô hình đều chia sẻ cùng một điểm cuối Model Studio tương thích với OpenAI, vì vậy việc chuyển đổi giữa chúng chỉ là thay đổi ID mô hình một dòng. Điều đó giúp dễ dàng so sánh trực tiếp: gửi cùng một lời nhắc tới qwen3.7-plus và qwen3.7-max, sắp xếp các phản hồi và xem liệu khoảng cách giá có xứng đáng với tác vụ của bạn hay không.

Apidog được xây dựng cho vòng lặp đó. Gửi yêu cầu tới cả hai mô hình, kiểm tra JSON thô song song, lưu khóa Model Studio của bạn cho từng môi trường và giả lập các điểm cuối để ứng dụng của bạn tiếp tục xây dựng. Đối với các yêu cầu Plus đa phương thức, hướng dẫn API Qwen 3.7 Plus của chúng tôi hiển thị định dạng tải trọng hình ảnh và video, và hướng dẫn API Qwen 3.7 cơ bản bao gồm đường dẫn văn bản. Khi một trong hai mô hình đang chuỗi các lệnh gọi công cụ trong quá trình chạy tác nhân, trình gỡ lỗi tác nhân AI của Apidog hiển thị toàn bộ chuỗi.

Tải xuống Apidog để kiểm tra và so sánh cả hai mô hình Qwen 3.7 trước khi bạn đưa một trong số chúng vào sản xuất.

Câu hỏi thường gặp

Qwen 3.7 Plus có tốt hơn Max không? Đối với hầu hết các khối lượng công việc, có, bởi vì nó bổ sung khả năng nhìn và có chi phí thấp hơn nhiều trong khi vẫn sánh ngang với Max về mã hóa và sử dụng công cụ. Max giữ một lợi thế nhỏ trên các bảng xếp hạng chỉ văn bản thuần túy và độ trễ chỉ văn bản.

Plus rẻ hơn bao nhiêu? Rẻ hơn khoảng sáu lần về đầu vào (0.40 đô la so với 2.50 đô la cho mỗi triệu token) và gần năm lần về đầu ra (1.60 đô la so với 7.50 đô la).

Chúng có chia sẻ cùng một cửa sổ ngữ cảnh không? Có, cả hai đều có cửa sổ 1M token. Trên Plus, hình ảnh và video tiêu thụ token từ cùng một ngân sách đó.

Max có thể xử lý hình ảnh không? Không. Max chỉ xử lý văn bản. Nếu bạn cần đầu vào hình ảnh hoặc video, bạn cần Plus.

Cả hai có phải là mã nguồn mở không? Không. Cả hai đều độc quyền và chỉ chạy thông qua Alibaba Cloud Model Studio. Bạn không thể tải xuống hoặc tự host trọng số.

Cái nào nhanh hơn? Max nhanh hơn khoảng 7 đến 15% khi khởi động nguội chỉ văn bản. Đối với công việc kết hợp hoặc liên quan đến thị giác, Plus là lựa chọn duy nhất.

Tổng kết

Qwen 3.7 Max và Plus thực sự không cạnh tranh cho cùng một công việc. Max là mẫu thuần văn bản với một lợi thế nhỏ về tốc độ và chất lượng; Plus là mẫu đa phương thức tổng quát hơn, rẻ hơn và chiến thắng hầu hết mọi nơi mà giá cả hoặc khả năng nhìn là quan trọng. Hãy bắt đầu với Plus, và chỉ dùng Max khi khối lượng công việc chỉ văn bản thực sự biện minh cho chi phí cao hơn. Dù sao đi nữa, hãy kiểm tra API trong Apidog để đảm bảo sản phẩm bạn triển khai hoạt động đúng như các điểm chuẩn đã hứa hẹn.

nút