Cara Menggunakan Qwen 3.5 API

Ashley Innocent

Ashley Innocent

16 February 2026

Cara Menggunakan Qwen 3.5 API

Alibaba Cloud merilis Qwen 3.5 pada 15 Februari 2026, dan komunitas pengembang segera memperhatikannya. Model ini menghadirkan pemahaman multimodal asli, jendela konteks 1 juta token, dan kemampuan keagenan yang secara konsisten mengungguli GPT-4.5, Claude 4, dan Gemini 2.5 di seluruh tolok ukur penalaran, pengkodean, dan penggunaan alat.

API Qwen 3.5 menempatkan semua kekuatan ini di balik endpoint yang bersih dan kompatibel dengan OpenAI. Anda melakukan otentikasi sekali, mengirim permintaan penyelesaian obrolan standar, dan membuka fitur yang sebelumnya memerlukan lapisan orkestrasi yang kompleks.

Panduan ini memandu Anda melalui setiap detail teknis—mulai dari menghasilkan token pertama Anda hingga membangun agen multimodal tingkat produksi. Anda akan mempelajari muatan yang tepat, parameter lanjutan, pola penanganan kesalahan, dan strategi optimasi biaya yang benar-benar berfungsi dalam beban kerja nyata.

💡
Sebelum Anda menulis satu baris kode pun, unduh Apidog secara gratis. Saat Anda mengikuti contoh dalam postingan ini—terutama bagian tentang pemanggilan alat, pelacakan penalaran streaming, dan input multimodal—Apidog menjadi cara tercepat untuk membuat prototipe, memvalidasi skema, merangkai skenario pengujian, dan menghasilkan kode klien. Platform ini mengubah apa yang dulunya berjam-jam kekacauan Postman menjadi menit-menit pengembangan yang terfokus. Banyak tim yang menggunakan Qwen 3.5 kini menganggap Apidog sebagai infrastruktur yang tak dapat dinegosiasikan.
button

Siap? Mari siapkan lingkungan Anda dan kirim permintaan siap produksi pertama Anda ke Qwen 3.5.

Apa yang Membuat Qwen 3.5 Menonjol?

Qwen 3.5 mewakili lompatan signifikan dalam seri Qwen. Alibaba merilis Qwen3.5-397B-A17B berbobot terbuka, model MoE hibrida dengan total 397 miliar parameter tetapi hanya 17 miliar yang aktif per inferensi. Arsitektur ini menggabungkan Gated Delta Networks untuk perhatian linear dengan pakar jarang, memberikan efisiensi yang luar biasa.

Tolok Ukur Qwen 3.5

Model Qwen 3.5-Plus yang dihosting di API menyediakan jendela konteks 1 juta token secara default. Ini mendukung 201 bahasa dan dialek, memproses gambar dan video secara asli, dan unggul dalam tolok ukur:

Hasil-hasil ini menempatkan Qwen 3.5 sebagai pilihan yang kuat bagi pengembang yang membangun agen, asisten kode, atau aplikasi multimodal. API membuat fitur-fitur ini segera dapat diakses tanpa mengelola perangkat keras yang masif.

Qwen3.5

Selanjutnya, Qwen 3.5 memperkenalkan alat bawaan seperti pencarian web dan interpretasi kode. Anda mengaktifkannya dengan parameter sederhana, sehingga Anda menghindari pembangunan lapisan orkestrasi kustom. Hasilnya, tim dapat mengirimkan alur kerja cerdas lebih cepat.

Prasyarat untuk Integrasi API Qwen 3.5

Anda menyiapkan lingkungan Anda sebelum mengirim permintaan pertama. API Qwen 3.5 berjalan di Model Studio Alibaba Cloud (sebelumnya DashScope), jadi Anda membuat akun di sana.

  1. Kunjungi konsol Alibaba Cloud Model Studio.
  2. Daftar atau masuk dengan kredensial Alibaba Cloud Anda.
  3. Navigasi ke bagian kunci API dan buat DASHSCOPE_API_KEY baru. Simpan ini dengan aman—perlakukan seperti rahasia produksi lainnya.

Selain itu, instal OpenAI Python SDK. Qwen 3.5 mempertahankan kompatibilitas penuh, sehingga Anda dapat menggunakan kembali pola yang sudah dikenal dari penyedia lain.

pip install openai

Anda juga akan mendapatkan manfaat dari Apidog pada tahap ini. Setelah mengunduhnya secara gratis dari situs resmi, Anda mengimpor spesifikasi OpenAPI Anda atau menambahkan endpoint Qwen 3.5 secara manual. Apidog secara otomatis menghasilkan skema permintaan dan memvalidasi respons, yang terbukti sangat berharga saat Anda menjelajahi parameter kustom nanti.

Logo Qwen 3.5

Mengautentikasi dan Mengkonfigurasi Klien

Anda menetapkan URL dasar dan kunci API untuk terhubung. Pengguna internasional biasanya memilih endpoint Singapura atau AS untuk latensi yang lebih rendah.

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1"
)

Objek klien ini menangani semua panggilan berikutnya. Anda dapat beralih wilayah dengan mengubah URL dasar—Beijing untuk beban kerja berbasis di Tiongkok atau Virginia untuk lalu lintas AS. SDK mengabstraksikan otentikasi, sehingga Anda berfokus pada desain muatan.

Namun, aplikasi produksi sering menggunakan variabel lingkungan dan manajer rahasia. Anda merotasi kunci secara teratur dan mengimplementasikan logika coba lagi dengan *exponential backoff* untuk menangani masalah jaringan sementara.

Mengirim Permintaan Penyelesaian Obrolan Pertama Anda

Anda sekarang menjalankan permintaan dasar. Qwen 3.5 menerima format pesan OpenAI standar dan mengembalikan respons terstruktur.

messages = [
    {"role": "system", "content": "You are a helpful technical assistant."},
    {"role": "user", "content": "Explain the architecture of Qwen 3.5 in simple terms."}
]

completion = client.chat.completions.create(
    model="qwen3.5-plus",
    messages=messages,
    temperature=0.7,
    max_tokens=1024
)

print(completion.choices[0].message.content)

Kode ini mengirimkan kueri dan mencetak respons. Anda menyesuaikan temperature dan top_p untuk mengontrol kreativitas, sama seperti model lainnya.

Untuk menguji ini dengan cepat, buka Apidog, buat permintaan baru, tempel endpoint https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions, tambahkan header dan body Anda, lalu tekan Kirim. Apidog menampilkan linimasa respons penuh, header, dan bahkan menghasilkan cuplikan kode cURL atau Python untuk Anda.

Membuka Fitur Lanjutan dengan Parameter Ekstra

Qwen 3.5-Plus bersinar saat Anda mengaktifkan kemampuan aslinya. Anda meneruskan ini melalui bidang extra_body.

completion = client.chat.completions.create(
    model="qwen3.5-plus",
    messages=messages,
    extra_body={
        "enable_thinking": True,      # Activates chain-of-thought reasoning
        "enable_search": True,        # Enables web search + code interpreter
    },
    stream=True
)

for chunk in completion:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)
    if hasattr(chunk.choices[0].delta, "reasoning_content") and chunk.choices[0].delta.reasoning_content:
        print("\n[Thinking]:", chunk.choices[0].delta.reasoning_content)

Oleh karena itu, model berpikir langkah demi langkah sebelum menjawab dan mengambil informasi waktu nyata saat dibutuhkan. Respons streaming tiba token demi token, yang meningkatkan latensi yang dirasakan di antarmuka obrolan.

Selain itu, Qwen 3.5 mendukung input multimodal. Anda menyertakan gambar atau video langsung dalam pesan:

messages = [
    {
        "role": "user",
        "content": [
            {"type": "text", "text": "What is happening in this image?"},
            {"type": "image_url", "image_url": {"url": "https://example.com/chart.png"}}
        ]
    }
]

API memproses data visual secara asli dan mengembalikan deskripsi atau jawaban yang beralasan. Pengembang yang membangun alat analisis dokumen atau agen visual menganggap fitur ini transformatif.

Mengimplementasikan Pemanggilan Alat dan Alur Kerja Agen

Qwen 3.5 unggul dalam pemanggilan fungsi. Anda menentukan alat dalam permintaan, dan model memutuskan kapan harus memanggilnya.

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "Get current weather for a location",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {"type": "string"}
                },
                "required": ["location"]
            }
        }
    }
]

completion = client.chat.completions.create(
    model="qwen3.5-plus",
    messages=messages,
    tools=tools,
    tool_choice="auto"
)

Ketika model mengembalikan panggilan alat, Anda menjalankan fungsi di sisi Anda dan menambahkan hasilnya kembali ke percakapan. Lingkaran ini menciptakan agen yang kuat yang berinteraksi dengan sistem eksternal.

Apidog menyederhanakan pengujian alur ini. Anda membuat skenario pengujian yang merangkai beberapa permintaan, menegaskan format panggilan alat, dan bahkan menguji API eksternal secara mock. Hasilnya, Anda memvalidasi perilaku agen yang kompleks sebelum Anda menerapkannya ke produksi.

Contoh Aplikasi Dunia Nyata

Pengembang mengintegrasikan API Qwen 3.5 di banyak domain. Berikut adalah pola praktis yang dapat Anda replikasi hari ini.

Asisten Pengkodean Cerdas

Anda membangun ekstensi VS Code yang mengirimkan cuplikan kode ke Qwen 3.5 dengan konteks dari ruang kerja. Model ini mengembalikan kode yang direfaktor, pengujian unit, dan penjelasan. Karena kinerja SWE-bench yang kuat, ia menangani tugas-tugas berskala repositori nyata secara efektif.

Agen Penelitian Multimodal

Anda membuat agen yang menerima unggahan PDF atau tangkapan layar, mengekstrak data, mencari di web untuk verifikasi, dan menghasilkan laporan. Jendela konteks 1 juta menampung seluruh makalah penelitian dalam satu percakapan.

Chatbot Dukungan Pelanggan

Anda menggabungkan Qwen 3.5 dengan basis pengetahuan dan CRM Anda. Model ini melakukan penalaran atas riwayat percakapan, menarik data pesanan waktu nyata melalui alat, dan merespons dalam bahasa pilihan pengguna dari dukungan 201 bahasanya.

Dalam setiap kasus, Anda memantau penggunaan token dan biaya melalui konsol Alibaba Cloud. Qwen 3.5-Plus menawarkan harga yang kompetitif untuk kemampuannya, terutama pada skala besar.

Praktik Terbaik untuk Penerapan Produksi

Anda mengikuti panduan ini untuk memastikan keandalan dan kinerja:

Selain itu, Anda membuat versi prompt Anda dan menguji perubahan di Apidog sebelum Anda mempromosikannya. Variabel lingkungan platform memungkinkan Anda beralih antara kunci dev, staging, dan produksi dengan mulus.

Memecahkan Masalah Umum API Qwen 3.5

Anda sesekali akan menemukan masalah ini:

Apidog juga membantu di sini. Log detailnya, validasi respons, dan server mock memungkinkan Anda mengisolasi masalah dengan cepat.

Penyebaran Lokal Model Bobot Terbuka

Meskipun API cocok untuk sebagian besar kasus penggunaan, Anda menjalankan model Qwen3.5-397B-A17B secara lokal untuk data sensitif atau kebutuhan *offline*. Model ini tersedia di Hugging Face:

pip install transformers

Anda menyajikannya dengan vLLM atau SGLang untuk *throughput* tinggi:

python -m vllm.entrypoints.openai.api_server \
  --model Qwen/Qwen3.5-397B-A17B \
  --tensor-parallel-size 8

Server lokal mengekspos endpoint /v1/chat/completions yang sama. Anda mengarahkan ruang kerja Apidog Anda ke http://localhost:8000/v1 dan menguji secara identik dengan API *cloud*.

Perhatikan bahwa model 397B memerlukan sumber daya GPU yang substansial—biasanya 8×H100 atau yang setara. Versi terkuantisasi yang lebih kecil mungkin akan segera muncul di komunitas.

Membandingkan API Qwen 3.5 dengan Penyedia Lain

Qwen 3.5 bersaing langsung dengan GPT-4.5, Claude 4, dan Gemini 2.5. Ia unggul dalam tolok ukur pengkodean dan agen sambil menawarkan multimodality asli dengan harga lebih rendah. Antarmuka yang kompatibel dengan OpenAI berarti Anda bermigrasi dengan perubahan kode minimal.

Namun, wilayah global Alibaba Cloud memberikan keuntungan untuk beban kerja Asia-Pasifik. Anda mencapai latensi yang lebih rendah dan kepatuhan yang lebih baik untuk pasar tertentu.

Kesimpulan: Mulai Membangun dengan Qwen 3.5 Hari Ini

Anda sekarang memiliki peta jalan teknis lengkap untuk API Qwen 3.5. Dari penyelesaian obrolan dasar hingga agen multimodal yang canggih, platform ini menghadirkan kinerja terdepan dengan alat yang ramah pengembang.

Unduh Apidog secara gratis sekarang dan impor endpoint Qwen 3.5. Anda membuat prototipe, menguji, dan mendokumentasikan integrasi Anda dalam hitungan menit, bukan jam. Keputusan kecil yang Anda buat dalam alur kerja API Anda—memilih platform pengujian yang tepat, menyusun prompt Anda, menangani panggilan alat—menciptakan perbedaan besar dalam kecepatan pengembangan dan kualitas aplikasi.

Tim Qwen 3.5 terus mendorong batas. Periksa blog Qwen resmi, repositori GitHub, dan koleksi Hugging Face untuk pembaruan.

Apa yang akan Anda bangun pertama? Baik itu agen penelitian otonom, alat analitik bertenaga visi, atau platform pengalaman pelanggan multibahasa, API Qwen 3.5 memberi Anda fondasinya. Mulai koding, iterasi dengan cepat bersama Apidog, dan wujudkan ide-ide Anda.

button

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.

Cara Menggunakan Qwen 3.5 API