Apa Itu Qwen 3.7? Model AI Unggulan Terbaru dari Alibaba

Ashley Innocent

Ashley Innocent

21 May 2026

Apa Itu Qwen 3.7? Model AI Unggulan Terbaru dari Alibaba

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

Tim Qwen Alibaba baru saja meluncurkan produk unggulan terbarunya, dan komunitas AI menaruh perhatian. Qwen3.7-Max mendarat di papan peringkat publik sebelum ada orang di luar Alibaba yang memberinya nama, kemudian mendapatkan pengungkapan resmi di Alibaba Cloud Summit 2026 beberapa hari kemudian. Ini adalah model penalaran yang dibangun untuk era agen: eksekusi tugas berjangka panjang, jendela konteks satu juta token, dan posisi teratas di setidaknya satu peringkat intelijen utama.

Jika Anda membangun perangkat lunak, model batas baru bukanlah berita abstrak. Anda akan berakhir dengan menghubungkannya di belakang API Anda sendiri, memvalidasi responsnya, dan mensimulasikan keluarannya saat aplikasi Anda selesai. Bagian pekerjaan itulah yang menjadi tujuan Apidog; artikel ini berfokus pada model itu sendiri, sehingga Anda tahu apakah Qwen 3.7 cocok dalam tumpukan teknologi Anda. Semua yang ada di bawah ini bersumber dari pengumuman Alibaba dan liputan independen, dan di mana angka masih belum dikonfirmasi, kami menyatakannya dengan jelas.

TL;DR

Qwen 3.7 adalah keluarga model AI unggulan terbaru Alibaba, dipimpin oleh Qwen3.7-Max-Preview, model penalaran kepemilikan dengan jendela konteks 1 juta token dan mode pemikiran yang diperluas. Model ini mencetak 57 pada Artificial Analysis Intelligence Index, dilaporkan sebagai hasil #1 di papan peringkat publik tersebut, dan sekitar 1.475 Elo di papan peringkat teks LM Arena. Per pertengahan Mei 2026, varian Max hanya dalam pratinjau dengan akses API yang diluncurkan di Alibaba Cloud; belum ada model open-weight Qwen 3.7 yang dikirimkan.

Apa itu Qwen 3.7?

Qwen 3.7 adalah generasi terbaru model bahasa besar dari Qwen, divisi AI perusahaan teknologi Tiongkok Alibaba. Rilis utamanya adalah Qwen3.7-Max-Preview, yang digambarkan oleh Alibaba sebagai model agennya yang paling canggih dan komprehensif hingga saat ini.

Nama "Max" menandakan tingkat teratas. Di seluruh generasi Qwen terbaru, Alibaba telah meluncurkan model Max unggulan di samping varian yang lebih kecil dan lebih mudah diakses. Qwen3.7-Max-Preview adalah model penalaran, yang berarti ia bekerja melalui masalah langkah demi langkah sebelum menjawab, daripada menghasilkan respons dalam satu kali jalan. Pendekatan pemikiran yang diperluas itu kini menjadi standar di garis depan; ini mengorbankan sedikit kecepatan dan biaya token untuk hasil yang lebih kuat pada matematika yang sulit, pengkodean, dan logika multi-langkah.

Dua tanggal penting di sini. Model ini pertama kali muncul di papan peringkat teks LM Arena sekitar 14 Mei 2026, terdaftar dengan nama pratinjau sebelum Alibaba mengumumkan apa pun secara publik. Pengumuman resmi datang di Alibaba Cloud Summit 2026 pada 20 Mei, dengan model tersebut mendarat di platform API Alibaba pada 19 Mei. Jadi, versi yang dapat dijangkau sebagian besar orang saat ini membawa sufiks "-Preview"; ini adalah versi awal, dan detailnya dapat berubah sebelum rilis stabil.

Pembingkaian dalam pesan Alibaba bersifat agen. Qwen3.7-Max dipasarkan bukan sebagai chatbot, melainkan sebagai mesin untuk pekerjaan otonom: menulis dan men-debug kode, mengotomatisasi alur kerja kantor, dan menjalankan rantai tugas panjang dengan pengawasan minimal. Kita akan membahas lebih lanjut seperti apa praktiknya di bawah ini.

Susunan varian Qwen 3.7

Di sinilah kejujuran menjadi penting, karena Qwen 3.7 baru berusia beberapa hari dan banyak informasi di internet yang bersifat dugaan.

Apa yang dikonfirmasi:

Apa yang belum dikonfirmasi:

Pola dari rilis sebelumnya bersifat instruktif tanpa menjadi janji. Alibaba telah bergerak ke arah menjaga model terbaiknya tetap kepemilikan sementara membuat sumber terbuka untuk tingkatan di bawahnya; ini memberi pengembang akses gratis dan dapat di-host sendiri ke model yang kuat dan menyimpan model unggulan untuk pendapatan API berbayar. Jika Qwen 3.7 mengikuti pola tersebut, harapkan bobot open-source tingkat menengah pada akhirnya, tetapi perlakukan ukuran atau tanggal spesifik apa pun yang Anda lihat secara daring sebagai spekulasi sampai Alibaba mengonfirmasinya.

Kesimpulan yang aman: ketika seseorang mengatakan "Qwen 3.7" hari ini, mereka hampir pasti berarti Qwen3.7-Max-Preview, dan model tersebut adalah closed-weight.

Jendela konteks 1 juta token

Qwen3.7-Max-Preview memiliki jendela konteks 1 juta token, menurut Artificial Analysis. Itu adalah jumlah teks yang dapat ditampung model dalam memori kerja sekaligus: prompt Anda, dokumen apa pun yang Anda tempel, percakapan sejauh ini, dan respons yang dihasilkannya.

Satu juta token kira-kira setara dengan 700.000 hingga 750.000 kata dalam bahasa Inggris. Secara konkret, itu cukup untuk memuat seluruh repositori kode berukuran sedang, tumpukan PDF panjang, atau riwayat obrolan berbulan-bulan ke dalam satu permintaan. Model ini dapat melakukan penalaran atas semua itu tanpa Anda perlu memecah input secara manual atau membangun lapisan pengambilan.

Dua peringatan menjaga kejujuran ini. Pertama, jendela konteks yang besar adalah batas atas, bukan jaminan; model sering kali mengambil dan bernalar kurang andal saat jendela terisi, dan pengujian konteks panjang independen untuk Qwen 3.7 masih sedikit. Kedua, konteks besar membutuhkan biaya. Setiap token yang Anda kirim akan ditagih, jadi prompt satu juta token adalah prompt yang mahal. Gunakan jendela penuh ketika tugas benar-benar membutuhkannya, dan potong secara agresif ketika tidak.

Konteks 1 juta tidak lagi langka di batas teknologi. Produk unggulan saat ini dari OpenAI, Google, dan Anthropic semuanya mengiklankan jendela konteks sekitar atau di atas angka satu juta token, jadi Qwen 3.7 menyamai bidang ini daripada memimpinnya.

Mode penalaran dan pemikiran yang diperluas

Qwen3.7-Max-Preview adalah model penalaran, dan itu membentuk cara Anda menggunakannya.

Ketika Anda memberinya masalah yang sulit, model tersebut terlebih dahulu menghasilkan rantai pemikiran: urutan langkah internal di mana ia merencanakan, memeriksa pekerjaannya, dan mengoreksi jalannya sebelum berkomitmen pada jawaban akhir. Pada antarmuka seperti Qwen Chat, ini muncul sebagai mode "Berpikir" yang dapat Anda aktifkan untuk melihat jejak penalaran model.

Biaya ini terlihat dalam data. Ketika Artificial Analysis menjalankan evaluasi Intelligence Index-nya, Qwen3.7-Max menghasilkan sekitar 97 juta token, jauh di atas rata-rata sekitar 24 juta token untuk model pada benchmark tersebut. Model penalaran memang dirancang untuk banyak bicara; mereka berpikir keras, dan setiap token pemikiran adalah token yang Anda bayar dan tunggu.

Pertukaran itu memiliki bentuk praktis. Untuk panggilan klasifikasi cepat atau penulisan ulang singkat, semua pertimbangan itu adalah biaya overhead yang sia-sia. Untuk refactor yang sulit, bukti multi-langkah, atau tugas agen yang harus merencanakan beberapa langkah ke depan, penalaran ekstra itulah yang membuat model ini layak digunakan. Sesuaikan mode dengan pekerjaannya.

Ini juga penting saat Anda menguji model. Output penalaran lebih panjang dan lebih bervariasi daripada penyelesaian biasa, jadi asumsi Anda perlu menargetkan jawaban akhir daripada kata-kata persis dari jejak pemikiran. Pengaturan praktis untuk itu, termasuk cara memeriksa setiap panggilan model, dibahas dalam panduan cara menggunakan API Qwen 3.7.

Benchmark Qwen 3.7: posisinya

Angka benchmark untuk model baru ini harus dibaca dengan hati-hati. Beberapa berasal dari pihak ketiga independen, beberapa dari pengujian Alibaba sendiri, dan versi pratinjau dapat berubah sebelum rilis. Berikut adalah apa yang dilaporkan pada pertengahan Mei 2026, dengan sumber terlampir.

Indeks Intelijen Artificial Analysis

Artificial Analysis Intelligence Index adalah skor gabungan yang memadukan evaluasi penalaran, pengetahuan, matematika, dan pengkodean menjadi satu angka. Qwen3.7-Max mencetak 57 pada indeks ini, menurut Artificial Analysis. Itu dilaporkan sebagai lompatan lima poin dari 52 milik Qwen 3.6 Max Preview sebelumnya, dan Artificial Analysis mencantumkannya sebagai hasil #1 di antara 218 model yang diperingkat di papan peringkat publiknya.

Itu adalah penampilan yang kuat. Peringatannya adalah yang di atas: indeks tersebut memberi penghargaan kepada model yang berpikir panjang lebar, Qwen 3.7 sangat bertele-tele, dan satu angka gabungan mengompres banyak detail.Elo teks LM Arena

LM Arena memberi peringkat model berdasarkan preferensi manusia. Orang membandingkan dua respons model anonim dan memilih yang lebih baik; suara-suara tersebut menghasilkan peringkat Elo, sistem yang sama yang digunakan dalam catur. Qwen3.7-Max-Preview memasuki papan peringkat teks LM Arena dengan Elo sekitar 1.475, menempatkannya sekitar #13 secara keseluruhan di arena teks, berdasarkan liputan papan peringkat. Model ini menempati peringkat lebih tinggi dalam kategori tertentu, termasuk sepuluh besar untuk matematika dan pengkodean.

Elo dan Intelligence Index mengukur hal yang berbeda. Intelligence Index adalah ketepatan yang dinilai tugas; Elo adalah jawaban mana yang lebih disukai manusia. Sebuah model dapat menduduki puncak salah satu dan berada di tengah-tengah pada yang lain, yang kira-kira adalah gambaran untuk Qwen 3.7: skor gabungan yang memuncaki papan peringkat, peringkat preferensi manusia yang terhormat tetapi tidak dominan.

Klaim penalaran dan agen

Pengumuman Alibaba sendiri menyoroti hasil agensi: Qwen3.7-Max mempertahankan eksekusi tugas otonom hingga 35 jam dan menangani lebih dari 1.000 panggilan alat dalam satu kali jalan tanpa penurunan kinerja. Laporan independen tentang generasi sebelumnya juga menempatkan penalaran Qwen mendekati puncak di bidang pertanyaan sains tingkat pascasarjana. Perlakukan angka agen pihak pertama sebagai klaim vendor sampai pihak ketiga mereproduksinya; mereka menggambarkan kekuatan yang dimaksudkan dari model, yaitu pekerjaan yang panjang dan banyak menggunakan alat.

Perbandingan Qwen 3.7 dengan GPT-5.5, Claude Opus 4.7, dan Gemini 3.5

Berikut adalah perbandingan model-model batas terdepan saat ini. Angka yang diverifikasi dikutip; nilai yang belum dikonfirmasi atau tidak diungkapkan ditandai agar Anda tidak salah informasi.

Spesifikasi Qwen3.7-Max-Preview GPT-5.5 Claude Opus 4.7 Gemini 3.5
Vendor Alibaba (Qwen) OpenAI Anthropic Google DeepMind
Tipe Model penalaran Model penalaran Model penalaran Model penalaran
Jendela konteks 1 juta token ~1 juta token ~1 juta token (kisaran yang dilaporkan) ~1 juta+ token
Bobot Kepemilikan Kepemilikan Kepemilikan Kepemilikan
Indeks Intelijen AA 57 (dilaporkan #1) Tidak disebutkan di sini Tidak disebutkan di sini Tidak disebutkan di sini
Tahap rilis Pratinjau Stabil Stabil Stabil
Mode penalaran / berpikir Ya Ya Ya Ya
Kekuatan utama Tugas agen jangka panjang Agen otonom, penggunaan alat Kode kualitas produksi Konteks panjang, efisiensi biaya

Beberapa interpretasi jujur dari tabel tersebut.

Dalam hal intelijen gabungan mentah, skor 57 Qwen3.7-Max yang dilaporkan pada Artificial Analysis Intelligence Index menempatkannya di puncak papan peringkat spesifik tersebut saat peluncuran. Itu adalah hasil nyata, tetapi itu adalah satu benchmark, dan produk unggulan Barat masing-masing memimpin evaluasi berbeda yang tidak semuanya ditangkap oleh satu indeks.

Perbedaan yang lebih jelas adalah tentang kesesuaian. Perbandingan independen dari generasi saat ini umumnya menggambarkan Claude Opus 4.7 sebagai pilihan terkuat untuk pengiriman kode produksi, GPT-5.5 sebagai pemimpin untuk pekerjaan agen otonom dan penggunaan komputer, dan Gemini 3.5 sebagai opsi biaya-dan-konteks-panjang. Penawaran Qwen 3.7 paling dekat dengan jalur agen, dengan sudut tambahan harga API yang kompetitif dan rekam jejak Alibaba yang masuk akal dalam melakukan open-source tingkatan di bawah produk unggulan.

Faktor penentu bagi sebagian besar tim adalah akses, bukan papan peringkat. Produk unggulan Barat stabil dan tersedia secara global hari ini; Qwen3.7-Max hanya pratinjau dengan akses API yang masih diluncurkan. Untuk perbandingan yang lebih lengkap, berdasarkan angka setelah semua jelas, lihat Qwen 3.7 vs GPT-5.5 vs Opus 4.7. Jika daftar pilihan Anda melalui jajaran Google, penjelasan tentang apa itu Gemini 3.5 dan perbandingan di Gemini 3.5 vs GPT-5.5 vs Opus 4.7 mencakup sisi itu. Dan jika Anda mengamati bidang model Tiongkok yang lebih luas, ringkasan tentang apa itu ERNIE 5.1 memberi Anda produk unggulan pesaing Baidu.

Cara mengakses Qwen 3.7 hari ini

Per pertengahan Mei 2026, ada dua jalur praktis, ditambah satu yang perlu diperhatikan.

Qwen Chat. Cara tercepat untuk mencoba model ini adalah melalui antarmuka obrolan resmi di chat.qwen.ai. Akun gratis memberi Anda akses dengan batasan penggunaan, dan Anda dapat mengaktifkan mode Berpikir untuk melihat cara model bernalar. Ini adalah titik awal yang tepat untuk mencoba sebelum Anda menulis kode apa pun.

API Alibaba Cloud. Qwen3.7-Max mendarat di platform API Alibaba pada 19 Mei 2026, dengan Alibaba menggambarkan akses API yang lebih luas sedang diluncurkan. Di seluruh rilis Qwen terbaru, produk unggulan telah disajikan melalui platform model Alibaba Cloud; periksa dokumentasi model Alibaba Cloud saat ini untuk nama titik akhir dan harga yang tepat, karena ketersediaan dan tarif model pratinjau dapat berubah dari minggu ke minggu. Untuk panduan langkah demi langkah tentang cara menghubungkan panggilan dan menangani output penalaran, panduan khusus tentang cara menggunakan API Qwen 3.7 akan menjelaskannya.

Open weights (Bobot terbuka). Jika Anda berharap untuk melakukan self-hosting, jawaban jujurnya adalah: belum. Belum ada model Qwen 3.7 open-weight yang dikirimkan pada pertengahan Mei 2026. Jika Alibaba mengikuti pola terbarunya dalam membuat open-source tingkatan di bawah produk unggulan, bobot berukuran menengah yang dapat diunduh mungkin akan tiba nanti; sampai saat itu, setiap jalur menuju Qwen 3.7 melalui layanan yang di-host oleh Alibaba. Opsi tingkat gratis dan anggaran saat muncul dilacak dalam panduan tentang cara menggunakan Qwen 3.7 secara gratis.

Jalur mana pun yang Anda pilih, model ini berada di balik API, dan aplikasi Anda berkomunikasi dengan API tersebut. Merancang permintaan tersebut, mensimulasikan respons saat Anda membangun, dan menguji integrasi sebelum rilis adalah di mana platform seperti Apidog cocok dalam lingkaran. Unduh Apidog dan siapkan koleksi permintaan Qwen 3.7 dalam beberapa menit.

Kesimpulan

Qwen 3.7 adalah pendatang serius di batas AI, dan tiba dengan cepat. Versi singkatnya:

Jika Qwen 3.7 masuk dalam daftar pilihan Anda, langkah selanjutnya adalah menghubungkannya ke aplikasi nyata dan membuktikan integrasinya berfungsi. Apidog memungkinkan Anda merancang permintaan API, mensimulasikan respons model saat Anda membangun, menjalankan pengujian otomatis terhadap endpoint langsung, dan memeriksa setiap panggilan. Unduh Apidog dan ubah berita utama benchmark menjadi sesuatu yang benar-benar telah Anda luncurkan.

tombol

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.