Qwen 3.7 Là Gì? Mô Hình AI Hàng Đầu Mới Của Alibaba

Ashley Innocent

Ashley Innocent

21 tháng 5 2026

Qwen 3.7 Là Gì? Mô Hình AI Hàng Đầu Mới Của Alibaba

Apidog cho doanh nghiệp

Triển khai tại chỗ

SSO & RBAC

Tuân thủ SOC 2

Khám phá Apidog Enterprise

Đội ngũ Qwen của Alibaba vừa ra mắt sản phẩm chủ lực mới nhất của mình, và cộng đồng AI đang rất chú ý. Qwen3.7-Max đã xuất hiện trên bảng xếp hạng công khai trước khi bất kỳ ai bên ngoài Alibaba biết tên của nó, sau đó được tiết lộ chính thức tại Hội nghị thượng đỉnh Alibaba Cloud 2026 vài ngày sau đó. Đây là một mô hình suy luận được xây dựng cho kỷ nguyên tác tử: thực hiện tác vụ dài hạn, cửa sổ ngữ cảnh một triệu token và vị trí dẫn đầu trong ít nhất một bảng xếp hạng trí tuệ lớn.

Nếu bạn xây dựng phần mềm, một mô hình tiên phong mới không phải là tin tức trừu tượng. Bạn sẽ kết nối nó phía sau API của riêng mình, xác thực phản hồi của nó và mô phỏng đầu ra của nó trong khi ứng dụng của bạn được hoàn thiện. Phần công việc đó chính là mục đích của Apidog; bài viết này tập trung vào chính mô hình, để bạn biết liệu Qwen 3.7 có thuộc về hệ thống của bạn hay không. Mọi thông tin dưới đây đều được lấy từ thông báo của Alibaba và các nguồn tin độc lập, và nếu một con số vẫn chưa được xác nhận, chúng tôi sẽ nói rõ ràng.

TL;DR

Qwen 3.7 là dòng mô hình AI chủ lực mới nhất của Alibaba, dẫn đầu bởi Qwen3.7-Max-Preview, một mô hình suy luận độc quyền với cửa sổ ngữ cảnh 1 triệu token và chế độ tư duy mở rộng. Nó đạt 57 điểm trên Chỉ số Trí tuệ Phân tích Nhân tạo (Artificial Analysis Intelligence Index), được báo cáo là kết quả #1 trên bảng xếp hạng công khai đó, và khoảng 1.475 Elo trên bảng xếp hạng văn bản LM Arena. Tính đến giữa tháng 5 năm 2026, biến thể Max chỉ ở dạng xem trước với quyền truy cập API đang được triển khai trên Alibaba Cloud; chưa có mô hình Qwen 3.7 mã nguồn mở nào được phát hành.

Qwen 3.7 là gì?

Qwen 3.7 là thế hệ mô hình ngôn ngữ lớn mới nhất từ Qwen, bộ phận AI của công ty công nghệ Trung Quốc Alibaba. Phiên bản được chú ý nhất là Qwen3.7-Max-Preview, được Alibaba mô tả là mô hình tác tử tiên tiến và toàn diện nhất của họ cho đến nay.

Tên "Max" biểu thị cấp độ cao nhất. Qua các thế hệ Qwen gần đây, Alibaba đã phát hành một mô hình Max chủ lực cùng với các biến thể nhỏ hơn, dễ tiếp cận hơn. Qwen3.7-Max-Preview là một mô hình suy luận, nghĩa là nó giải quyết một vấn đề từng bước trước khi đưa ra câu trả lời, thay vì tạo ra phản hồi trong một lần duy nhất. Cách tiếp cận tư duy mở rộng đó hiện là tiêu chuẩn ở lĩnh vực tiên phong; nó đánh đổi một chút tốc độ và chi phí token để có kết quả mạnh mẽ hơn trong các bài toán khó, lập trình và logic nhiều bước.

Hai ngày quan trọng ở đây. Mô hình này lần đầu tiên xuất hiện trên bảng xếp hạng văn bản LM Arena vào khoảng ngày 14 tháng 5 năm 2026, được liệt kê dưới một tên xem trước trước khi Alibaba công khai bất cứ điều gì. Thông báo chính thức được đưa ra tại Hội nghị thượng đỉnh Alibaba Cloud 2026 vào ngày 20 tháng 5, với mô hình này xuất hiện trên nền tảng API của Alibaba vào ngày 19 tháng 5. Vì vậy, phiên bản mà hầu hết mọi người có thể tiếp cận ngày nay mang hậu tố "-Preview"; đây là bản dựng sớm, và các chi tiết có thể thay đổi trước khi phát hành ổn định.

Cách trình bày xuyên suốt thông điệp của Alibaba là mang tính tác tử. Qwen3.7-Max được giới thiệu không chỉ là một chatbot mà còn là một công cụ cho công việc tự chủ: viết và gỡ lỗi mã, tự động hóa quy trình làm việc văn phòng và chạy các chuỗi tác vụ dài với sự giám sát tối thiểu. Chúng ta sẽ tìm hiểu xem điều đó trông như thế nào trong thực tế ở phần dưới.

Dòng sản phẩm biến thể Qwen 3.7

Đây là lúc sự trung thực trở nên quan trọng, bởi vì Qwen 3.7 mới chỉ ra mắt vài ngày và rất nhiều thông tin trên internet chỉ là phỏng đoán.

Những gì đã được xác nhận:

Những gì chưa được xác nhận:

Mô hình từ các bản phát hành trước đó mang tính hướng dẫn nhưng không phải là một lời hứa. Alibaba đã có xu hướng giữ lại mô hình tốt nhất của mình dưới dạng độc quyền trong khi mở nguồn cấp thấp hơn; điều đó mang lại cho các nhà phát triển quyền truy cập miễn phí, có thể tự lưu trữ vào một mô hình mạnh mẽ và dành phiên bản chủ lực cho doanh thu API trả phí. Nếu Qwen 3.7 theo mẫu đó, hãy mong đợi các trọng số trung cấp mở cuối cùng, nhưng hãy coi bất kỳ kích thước hoặc ngày cụ thể nào bạn thấy trực tuyến là suy đoán cho đến khi Alibaba xác nhận.

Kết luận an toàn: khi ai đó nói "Qwen 3.7" hôm nay, họ gần như chắc chắn có nghĩa là Qwen3.7-Max-Preview, và mô hình đó là độc quyền.

Cửa sổ ngữ cảnh 1 triệu token

Qwen3.7-Max-Preview có cửa sổ ngữ cảnh 1 triệu token, theo Artificial Analysis. Đó là lượng văn bản mà mô hình có thể giữ trong bộ nhớ làm việc cùng một lúc: lời nhắc của bạn, bất kỳ tài liệu nào bạn dán vào, cuộc trò chuyện cho đến nay và phản hồi mà nó đang tạo ra.

Một triệu token tương đương khoảng 700.000 đến 750.000 từ tiếng Anh. Nói một cách cụ thể, điều đó đủ để chứa toàn bộ kho mã có kích thước trung bình, một chồng tệp PDF dài hoặc hàng tháng lịch sử trò chuyện vào một yêu cầu duy nhất. Mô hình có thể suy luận trên tất cả mà không cần bạn phải chia nhỏ đầu vào theo cách thủ công hoặc xây dựng một lớp truy xuất.

Hai lưu ý giữ cho thông tin này trung thực. Thứ nhất, cửa sổ ngữ cảnh lớn là giới hạn, không phải là sự đảm bảo; các mô hình thường truy xuất và suy luận kém tin cậy hơn khi cửa sổ đầy, và việc thử nghiệm ngữ cảnh dài độc lập cho Qwen 3.7 vẫn còn ít. Thứ hai, ngữ cảnh lớn tốn tiền. Mỗi token bạn gửi đều được tính phí, vì vậy một lời nhắc một triệu token là một lời nhắc đắt tiền. Chỉ sử dụng cửa sổ đầy đủ khi tác vụ thực sự cần đến nó, và cắt giảm mạnh mẽ khi không cần thiết.

Cửa sổ ngữ cảnh 1M không còn hiếm ở lĩnh vực tiên phong. Các sản phẩm chủ lực hiện tại từ OpenAI, Google và Anthropic đều quảng cáo cửa sổ ngữ cảnh khoảng hoặc hơn mức một triệu token, vì vậy Qwen 3.7 ngang hàng với các đối thủ ở đây chứ không dẫn đầu.

Chế độ suy luận và tư duy mở rộng

Qwen3.7-Max-Preview là một mô hình suy luận, và điều đó định hình cách bạn sử dụng nó.

Khi bạn đưa cho nó một vấn đề khó, mô hình sẽ tạo ra một chuỗi suy nghĩ trước: một chuỗi các bước nội bộ nơi nó lập kế hoạch, kiểm tra công việc của mình và điều chỉnh hướng đi trước khi đưa ra câu trả lời cuối cùng. Trên các giao diện như Qwen Chat, điều này hiển thị dưới dạng chế độ "Thinking" mà bạn có thể bật để xem dấu vết suy luận của mô hình.

Chi phí của điều này có thể nhìn thấy trong dữ liệu. Khi Artificial Analysis thực hiện đánh giá Chỉ số Trí tuệ của mình, Qwen3.7-Max đã tạo ra khoảng 97 triệu token, cao hơn nhiều so với mức trung bình khoảng 24 triệu token của các mô hình trên điểm chuẩn đó. Các mô hình suy luận thường dài dòng theo thiết kế; chúng tư duy thành tiếng, và mỗi token tư duy là một token bạn phải trả tiền và chờ đợi.

Sự đánh đổi đó có hình dạng thực tế. Đối với một cuộc gọi phân loại nhanh hoặc một bản viết lại ngắn, tất cả sự cân nhắc đó là phí tổn lãng phí. Đối với một sự tái cấu trúc phức tạp, một bằng chứng nhiều bước hoặc một tác vụ tác tử phải lập kế hoạch trước nhiều bước, việc suy luận thêm là điều khiến mô hình đáng để sử dụng. Phù hợp chế độ với công việc.

Điều này cũng quan trọng khi bạn kiểm tra mô hình. Đầu ra suy luận dài hơn và biến đổi hơn so với một bản hoàn thành đơn giản, vì vậy các khẳng định của bạn cần nhắm vào câu trả lời cuối cùng chứ không phải cách diễn đạt chính xác của dấu vết tư duy. Một thiết lập thực tế cho điều đó, bao gồm cách kiểm tra từng lệnh gọi mô hình, được đề cập trong hướng dẫn cách sử dụng API Qwen 3.7.

Các điểm chuẩn của Qwen 3.7: vị trí của nó

Các con số điểm chuẩn cho một mô hình mới như vậy cần được đọc cẩn thận. Một số đến từ các bên thứ ba độc lập, một số từ thử nghiệm của chính Alibaba, và một bản dựng xem trước có thể thay đổi trước khi phát hành. Dưới đây là những gì đã được báo cáo tính đến giữa tháng 5 năm 2026, kèm theo nguồn.

Chỉ số Trí tuệ Phân tích Nhân tạo (Artificial Analysis Intelligence Index)

Chỉ số Trí tuệ Phân tích Nhân tạo là một điểm tổng hợp kết hợp đánh giá suy luận, kiến thức, toán học và lập trình thành một con số. Qwen3.7-Max đạt 57 điểm trên chỉ số này, theo Artificial Analysis. Con số này được báo cáo là một bước nhảy vọt năm điểm so với 52 điểm của Qwen 3.6 Max Preview trước đó, và Artificial Analysis liệt kê nó là kết quả #1 trong số 218 mô hình được xếp hạng trên bảng xếp hạng công khai của họ.

Đó là một màn trình diễn mạnh mẽ. Lưu ý là điều đã nói ở trên: chỉ số này thưởng cho các mô hình suy nghĩ dài dòng, Qwen 3.7 rất dài dòng, và một con số tổng hợp duy nhất nén rất nhiều chi tiết.

Elo văn bản LM Arena

LM Arena xếp hạng các mô hình dựa trên sở thích của con người. Mọi người so sánh hai phản hồi mô hình ẩn danh và bình chọn cho phản hồi tốt hơn; những phiếu bầu đó tạo ra xếp hạng Elo, hệ thống tương tự được sử dụng trong cờ vua. Qwen3.7-Max-Preview gia nhập bảng xếp hạng văn bản LM Arena với Elo khoảng 1.475, xếp nó khoảng #13 tổng thể trong lĩnh vực văn bản, theo các báo cáo về bảng xếp hạng. Nó xếp hạng cao hơn trong các danh mục cụ thể, bao gồm top 10 cho toán học và lập trình.

Elo và Chỉ số Trí tuệ đo lường những điều khác nhau. Chỉ số Trí tuệ là độ chính xác được chấm điểm theo nhiệm vụ; Elo là câu trả lời mà con người thích hơn. Một mô hình có thể đứng đầu một chỉ số và ở giữa bảng trên chỉ số khác, đó chính xác là bức tranh cho Qwen 3.7: một điểm tổng hợp dẫn đầu bảng xếp hạng, một thứ hạng ưu tiên của con người đáng nể nhưng không thống trị.

Tuyên bố về suy luận và tác tử

Thông báo của Alibaba đã nhấn mạnh các kết quả về tác tử: Qwen3.7-Max duy trì việc thực thi tác vụ tự động lên đến 35 giờ và xử lý hơn 1.000 lệnh gọi công cụ trong một lần chạy mà không làm giảm hiệu suất. Báo cáo độc lập về thế hệ trước cũng đặt khả năng suy luận của Qwen gần top đầu trong lĩnh vực câu hỏi khoa học cấp độ sau đại học. Hãy coi các con số về tác tử của bên thứ nhất là tuyên bố của nhà cung cấp cho đến khi các bên thứ ba tái tạo chúng; chúng mô tả sức mạnh dự kiến của mô hình, đó là công việc dài, nặng về công cụ.

So sánh Qwen 3.7 với GPT-5.5, Claude Opus 4.7 và Gemini 3.5

Dưới đây là bảng so sánh các mô hình tiên phong hiện tại. Các số liệu đã được xác minh sẽ được trích dẫn; các giá trị chưa được xác nhận hoặc chưa được công bố sẽ được đánh dấu để bạn không bị hiểu lầm.

Đặc điểm Qwen3.7-Max-Preview GPT-5.5 Claude Opus 4.7 Gemini 3.5
Nhà cung cấp Alibaba (Qwen) OpenAI Anthropic Google DeepMind
Loại Mô hình suy luận Mô hình suy luận Mô hình suy luận Mô hình suy luận
Cửa sổ ngữ cảnh 1M token ~1M token ~1M token (phạm vi báo cáo) ~1M+ token
Trọng số Độc quyền Độc quyền Độc quyền Độc quyền
Chỉ số trí tuệ AA 57 (báo cáo #1) Không được nêu ở đây Không được nêu ở đây Không được nêu ở đây
Giai đoạn phát hành Xem trước Ổn định Ổn định Ổn định
Chế độ suy luận / tư duy
Điểm mạnh nổi bật Tác vụ tác tử dài hạn Tác tử tự động, sử dụng công cụ Mã chất lượng sản xuất Ngữ cảnh dài, hiệu quả chi phí

Một vài đánh giá trung thực về bảng này.

Về trí tuệ tổng hợp thô, Qwen3.7-Max đạt 57 điểm trên Chỉ số Trí tuệ Phân tích Nhân tạo (Artificial Analysis Intelligence Index) tại thời điểm ra mắt, đưa nó lên vị trí dẫn đầu của bảng xếp hạng cụ thể đó. Đó là một kết quả thực tế, nhưng nó chỉ là một điểm chuẩn, và các sản phẩm chủ lực phương Tây mỗi cái đều dẫn đầu các đánh giá khác nhau mà không phải tất cả đều được bao gồm trong một chỉ số duy nhất.

Sự khác biệt rõ ràng hơn là về sự phù hợp. Các so sánh độc lập về thế hệ hiện tại thường mô tả Claude Opus 4.7 là lựa chọn mạnh mẽ nhất để phát hành mã sản xuất, GPT-5.5 là người dẫn đầu cho các tác vụ tác tử tự động và sử dụng máy tính, và Gemini 3.5 là lựa chọn có chi phí và ngữ cảnh dài. Qwen 3.7 có vẻ phù hợp nhất với vai trò tác tử, với các góc độ bổ sung về giá API cạnh tranh và lịch sử đáng tin cậy của Alibaba trong việc mã nguồn mở một cấp dưới phiên bản chủ lực.

Yếu tố quyết định đối với hầu hết các nhóm là khả năng truy cập, chứ không phải một bảng xếp hạng. Các sản phẩm chủ lực phương Tây ổn định và có sẵn trên toàn cầu ngày nay; Qwen3.7-Max chỉ ở dạng xem trước với quyền truy cập API vẫn đang được triển khai. Để có một so sánh đầy đủ hơn, đặt số liệu lên hàng đầu khi mọi thứ ổn định, hãy xem Qwen 3.7 vs GPT-5.5 vs Opus 4.7. Nếu danh sách rút gọn của bạn bao gồm dòng sản phẩm của Google, phần giải thích về Gemini 3.5 là gì và so sánh trong Gemini 3.5 vs GPT-5.5 vs Opus 4.7 sẽ bao quát khía cạnh đó. Và nếu bạn đang theo dõi lĩnh vực mô hình Trung Quốc rộng lớn hơn, bản tóm tắt về ERNIE 5.1 là gì sẽ cung cấp cho bạn sản phẩm chủ lực cạnh tranh của Baidu.

Cách truy cập Qwen 3.7 hôm nay

Tính đến giữa tháng 5 năm 2026, có hai con đường thực tế, cộng thêm một con đường cần theo dõi.

Qwen Chat. Cách nhanh nhất để thử mô hình là giao diện trò chuyện chính thức tại chat.qwen.ai. Một tài khoản miễn phí sẽ cho phép bạn truy cập với các giới hạn sử dụng, và bạn có thể bật chế độ Thinking để xem mô hình suy luận. Đây là điểm khởi đầu phù hợp để thử nghiệm trước khi bạn cam kết bất kỳ mã nào.

API Alibaba Cloud. Qwen3.7-Max đã xuất hiện trên nền tảng API của Alibaba vào ngày 19 tháng 5 năm 2026, với Alibaba mô tả việc mở rộng quyền truy cập API đang được triển khai. Trong các bản phát hành Qwen gần đây, phiên bản chủ lực đã được cung cấp thông qua nền tảng mô hình của Alibaba Cloud; hãy kiểm tra tài liệu mô hình hiện tại của Alibaba Cloud để biết tên điểm cuối và giá cả chính xác, vì tính khả dụng và tỷ lệ của một mô hình xem trước có thể thay đổi hàng tuần. Để biết hướng dẫn từng bước về cách kết nối các lệnh gọi và xử lý đầu ra suy luận, hướng dẫn chuyên dụng về cách sử dụng API Qwen 3.7 sẽ hướng dẫn chi tiết.

Trọng số mở. Nếu bạn đang hy vọng tự lưu trữ, câu trả lời thành thật là: chưa. Chưa có mô hình Qwen 3.7 mã nguồn mở nào được phát hành tính đến giữa tháng 5 năm 2026. Nếu Alibaba tuân theo mô hình gần đây của họ về việc mở nguồn cấp dưới phiên bản chủ lực, các trọng số kích thước trung bình có thể tải xuống có thể sẽ xuất hiện sau này; cho đến lúc đó, mọi con đường đến Qwen 3.7 đều thông qua dịch vụ được lưu trữ của Alibaba. Các tùy chọn miễn phí và ngân sách khi chúng xuất hiện được theo dõi trong hướng dẫn về cách sử dụng Qwen 3.7 miễn phí.

Dù bạn chọn con đường nào, mô hình đều nằm sau một API, và ứng dụng của bạn giao tiếp với API đó. Thiết kế các yêu cầu đó, mô phỏng phản hồi trong khi bạn xây dựng và kiểm tra tích hợp trước khi phát hành là nơi một nền tảng như Apidog phù hợp. Tải xuống Apidog và thiết lập một bộ sưu tập yêu cầu Qwen 3.7 trong vài phút.

Kết luận

Qwen 3.7 là một bước tiến nghiêm túc tại biên giới AI, và nó đã xuất hiện nhanh chóng. Phiên bản tóm tắt:

Nếu Qwen 3.7 nằm trong danh sách rút gọn của bạn, bước tiếp theo là tích hợp nó vào một ứng dụng thực tế và chứng minh sự tích hợp đó hoạt động. Apidog cho phép bạn thiết kế yêu cầu API, mô phỏng phản hồi của mô hình trong khi bạn xây dựng, chạy các thử nghiệm tự động chống lại điểm cuối trực tiếp và kiểm tra mọi lệnh gọi. Tải xuống Apidog và biến một tiêu đề điểm chuẩn thành thứ mà bạn thực sự đã triển khai.

button

Thực hành thiết kế API trong Apidog

Khám phá cách dễ dàng hơn để xây dựng và sử dụng API

Qwen 3.7 Là Gì? Mô Hình AI Hàng Đầu Mới Của Alibaba