INTINYA
Qwen 3.6 Plus Preview diluncurkan pada 30 Maret 2026, dengan jendela konteks 1 juta token, penalaran rantai pemikiran yang wajib, dan dukungan penggunaan alat. Ini sepenuhnya gratis di OpenRouter saat ini. Gunakan ID model qwen/qwen3.6-plus-preview:free dengan klien yang kompatibel dengan OpenAI untuk mulai mengirim permintaan hari ini.
Model yang Muncul Diam-diam
Alibaba Cloud meluncurkan Qwen 3.6 Plus Preview pada 30 Maret 2026. Tidak ada pengumuman besar-besaran. Tidak ada daftar tunggu. Hanya model baru yang tersedia di OpenRouter dengan harga $0 per juta token.

Dalam dua hari pertamanya, model ini memproses lebih dari 400 juta token penyelesaian dari sekitar 400.000 permintaan. Para pengembang menganggapnya cepat.
Artikel ini akan memandu Anda melalui semua yang Anda butuhkan untuk memulai: pengaturan akun, kunci API, contoh kode yang berfungsi dalam cURL, Python, dan Node.js, serta saran spesifik tentang di mana model ini berkinerja terbaik.
Pada akhir panduan ini, Anda akan tahu persis cara memanggil Qwen 3.6 secara gratis, kemampuannya, dan kekurangannya.
Apa yang Ditambahkan Qwen 3.6 Dibandingkan Seri 3.5
Lompatan dari 3.5 ke 3.6 bukanlah penambahan bertahap. Tiga hal berubah secara signifikan.
1. Jendela Konteks Bertumbuh menjadi 1 Juta Token
Qwen 3.5 memiliki jendela konteks 32K hingga 128K tergantung variannya. Qwen 3.6 mendukung masukan 1 juta token.
Secara praktis: 1 juta token kira-kira setara dengan 750.000 kata. Itu cukup untuk memberi makan model seluruh basis kode, log Slack setahun, perpustakaan dokumen hukum lengkap, atau korpus penelitian besar dalam satu permintaan.
Sebagian besar model gratis mencapai batas 8K hingga 32K. Mendapatkan 1 juta token secara gratis adalah hal yang tidak biasa.
2. Penalaran Sudah Terpasang, Bukan Pilihan
Qwen 3.6 menggunakan token penalaran wajib. Sebelum model menghasilkan jawaban akhirnya, ia menghasilkan rantai pemikiran internal. Anda tidak perlu memintanya dengan "berpikir langkah demi langkah" atau instruksi khusus apa pun.
Ini adalah pola yang sama yang dipopulerkan oleh DeepSeek R1. Perbedaannya adalah Qwen 3.6 menerapkannya di seluruh tugas pengkodean, front-end, dan pemecahan masalah umum, bukan hanya matematika.
3. Perilaku Agen Lebih Andal
Pemanggilan alat dalam seri 3.5 tidak konsisten. Fungsi akan dipanggil dengan jenis argumen yang salah, atau model akan berhalusinasi panggilan fungsi yang tidak ada.
Qwen 3.6 mengatasi ini secara langsung. Menurut deskripsi Alibaba Cloud sendiri, model ini "memberikan penalaran yang lebih kuat dan perilaku agen yang lebih andal dibandingkan dengan seri 3.5." Dalam praktiknya, ini berarti lebih sedikit panggilan alat yang rusak dalam alur kerja multi-langkah.
Model ini secara khusus disetel untuk tiga tugas:
- Pengodean agen (pembuatan kode multi-langkah dengan penggunaan alat)
- Pengembangan front-end (pembuatan komponen HTML, CSS, JavaScript)
- Pemecahan masalah kompleks (penelitian, analisis, ringkasan konteks panjang)
Cara Mengakses Qwen 3.6 Secara Gratis
Anda membutuhkan dua hal: akun OpenRouter dan kunci API. Tidak diperlukan kartu kredit untuk model gratis.
Langkah 1: Buat Akun OpenRouter Anda
Buka openrouter.ai dan daftar dengan email atau akun Google. Seluruh proses memakan waktu kurang dari dua menit.
Model gratis tidak mengharuskan Anda menambahkan metode pembayaran. Anda mendapatkan akses segera setelah verifikasi email.
Langkah 2: Hasilkan Kunci API
- Klik avatar profil Anda di sudut kanan atas
- Pilih Kunci API dari menu tarik-turun
- Klik Buat Kunci
- Berikan nama (mis.,
qwen-test) dan klik Buat - Salin kuncinya. Ini dimulai dengan
sk-or-v1-...

Simpan ini di tempat yang aman. OpenRouter tidak akan menampilkannya lagi kepada Anda.
Langkah 3: Kirim Permintaan Pertama Anda
ID model adalah qwen/qwen3.6-plus-preview:free.
OpenRouter menggunakan format permintaan yang sama dengan OpenAI API, jadi klien yang kompatibel dengan OpenAI apa pun berfungsi tanpa modifikasi.
cURL:
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer sk-or-v1-YOUR_KEY_HERE" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen/qwen3.6-plus-preview:free",
"messages": [
{
"role": "user",
"content": "Write a Python function that parses a JWT token and returns the payload as a dictionary."
}
]
}'
Python (pustaka requests):
import requests
def call_qwen(prompt: str, api_key: str) -> str:
response = requests.post(
"https://openrouter.ai/api/v1/chat/completions",
headers={
"Authorization": f"Bearer {api_key}",
"Content-Type": "application/json",
},
json={
"model": "qwen/qwen3.6-plus-preview:free",
"messages": [{"role": "user", "content": prompt}],
},
timeout=60,
)
response.raise_for_status()
return response.json()["choices"][0]["message"]["content"]
result = call_qwen(
"Write a Python function that parses a JWT token and returns the payload.",
api_key="sk-or-v1-YOUR_KEY_HERE"
)
print(result)
Node.js (fetch):
async function callQwen(prompt, apiKey) {
const response = await fetch("https://openrouter.ai/api/v1/chat/completions", {
method: "POST",
headers: {
"Authorization": `Bearer ${apiKey}`,
"Content-Type": "application/json",
},
body: JSON.stringify({
model: "qwen/qwen3.6-plus-preview:free",
messages: [{ role: "user", content: prompt }],
}),
});
if (!response.ok) {
throw new Error(`OpenRouter error: ${response.status} ${await response.text()}`);
}
const data = await response.json();
return data.choices[0].message.content;
}
callQwen(
"Write a JavaScript function that validates an email address.",
"sk-or-v1-YOUR_KEY_HERE"
).then(console.log);
Python dengan OpenAI SDK:
Jika Anda sudah menggunakan OpenAI Python SDK, Anda dapat mengarahkannya ke OpenRouter tanpa perubahan lain:
from openai import OpenAI
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="sk-or-v1-YOUR_KEY_HERE",
)
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview:free",
messages=[
{
"role": "system",
"content": "You are a senior backend engineer. Write clean, production-ready code."
},
{
"role": "user",
"content": "Write a Python function that retries a failed HTTP request up to 3 times with exponential backoff."
}
],
)
print(response.choices[0].message.content)
Penggunaan Alat dan Alur Kerja Agen
Penggunaan alat adalah di mana Qwen 3.6 menonjol di tingkat gratis. Berikut adalah contoh yang berfungsi:
from openai import OpenAI
import json
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="sk-or-v1-YOUR_KEY_HERE",
)
# Define the tools available to the model
tools = [
{
"type": "function",
"function": {
"name": "search_api_docs",
"description": "Search the API documentation for a specific endpoint or parameter",
"parameters": {
"type": "object",
"properties": {
"query": {
"type": "string",
"description": "The search query"
},
"version": {
"type": "string",
"enum": ["v1", "v2", "v3"],
"description": "API version to search"
}
},
"required": ["query"]
}
}
},
{
"type": "function",
"function": {
"name": "run_api_test",
"description": "Execute a test request against an API endpoint",
"parameters": {
"type": "object",
"properties": {
"endpoint": {"type": "string"},
"method": {"type": "string", "enum": ["GET", "POST", "PUT", "DELETE"]},
"body": {"type": "object"}
},
"required": ["endpoint", "method"]
}
}
}
]
messages = [
{
"role": "user",
"content": "Find documentation for the /users endpoint and run a test GET request against it."
}
]
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview:free",
messages=messages,
tools=tools,
tool_choice="auto",
)
message = response.choices[0].message
# Check whether the model wants to call a tool
if message.tool_calls:
for tool_call in message.tool_calls:
print(f"Tool: {tool_call.function.name}")
args = json.loads(tool_call.function.arguments)
print(f"Arguments: {json.dumps(args, indent=2)}")
else:
print(message.content)
Model akan menghasilkan panggilan fungsi terstruktur daripada berhalusinasi respons bentuk bebas. Anda kemudian mengeksekusi fungsi dalam kode Anda sendiri dan memasukkan kembali hasilnya pada giliran berikutnya.
Beginilah cara alur kerja agen multi-langkah dibangun: model memanggil alat, kode Anda menjalankannya, dan Anda mengulanginya sampai tugas selesai.
Menggunakan Jendela Konteks 1 Juta Token
Konteks 1 juta token tidak berguna untuk pertanyaan sederhana. Ini dirancang untuk tugas-tugas di mana Anda perlu memberikan model konteks dalam jumlah besar sekaligus.
Berikut adalah tiga pola di mana ini benar-benar penting:
Tinjauan Basis Kode Lengkap
Berikan model seluruh basis kode Anda (dalam batas token) dan minta untuk mengidentifikasi masalah keamanan, pola yang tidak konsisten, atau fungsi yang tidak terdokumentasi.
import os
from pathlib import Path
from openai import OpenAI
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="sk-or-v1-YOUR_KEY_HERE",
)
def load_codebase(directory: str, extensions: list[str]) -> str:
"""Load all source files from a directory into a single string."""
content_parts = []
for path in Path(directory).rglob("*"):
if path.suffix in extensions and path.is_file():
try:
text = path.read_text(encoding="utf-8", errors="ignore")
content_parts.append(f"--- FILE: {path} ---\n{text}\n")
except Exception:
continue
return "\n".join(content_parts)
codebase = load_codebase("./src", [".py", ".js", ".ts"])
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview:free",
messages=[
{
"role": "user",
"content": f"Review this codebase and identify:\n1. Security vulnerabilities\n2. Functions with no error handling\n3. Inconsistent naming conventions\n\nCodebase:\n{codebase}"
}
],
)
print(response.choices[0].message.content)
Analisis Dokumen Besar
Masukkan dokumen hukum yang panjang, laporan keuangan, atau makalah penelitian dan ajukan pertanyaan spesifik tentangnya.
with open("annual_report_2025.txt", "r") as f:
document = f.read()
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview:free",
messages=[
{
"role": "user",
"content": f"Extract all mentions of API rate limits and pricing changes from this document:\n\n{document}"
}
],
)
Percakapan Multi-Giliran dengan Riwayat Lengkap
Pertahankan seluruh riwayat percakapan dalam konteks tanpa pemotongan, berguna untuk sesi debugging yang panjang atau wawancara teknis.
conversation = []
def chat(user_message: str) -> str:
conversation.append({"role": "user", "content": user_message})
response = client.chat.completions.create(
model="qwen/qwen3.6-plus-preview:free",
messages=conversation,
)
assistant_message = response.choices[0].message.content
conversation.append({"role": "assistant", "content": assistant_message})
return assistant_message
# Long back-and-forth debugging session
print(chat("I'm getting a 401 error from the GitHub API. Here's my code..."))
print(chat("I added the token but now I get a 403. The token has repo scope."))
print(chat("The repo is private. What scopes do I actually need?"))
Menguji Permintaan API OpenRouter dengan Apidog
Ketika Anda membangun di atas API OpenRouter, men-debug permintaan yang gagal menjadi cepat membosankan. Anda membuat permintaan HTTP, memeriksa respons JSON, dan mengulang prompt Anda. Melakukan ini dari baris perintah atau Postman lambat.

Apidog patut dicoba di sini. Ini adalah klien API gratis yang menangani pembuatan permintaan, inspeksi respons, dan otomatisasi pengujian di satu tempat.
Untuk menguji endpoint Qwen 3.6 di Apidog:
- Buat permintaan POST baru ke
https://openrouter.ai/api/v1/chat/completions - Tambahkan header
Authorization: Bearer sk-or-v1-...Anda - Atur body ke JSON dengan field
modeldanmessagesAnda - Kirim permintaan dan periksa responsnya
Anda dapat menyimpan ini sebagai koleksi, beralih antara ID model untuk membandingkan output, dan menulis tes otomatis yang memeriksa struktur respons, memverifikasi bahwa choices[0].message.content tidak kosong, atau menegaskan bahwa panggilan alat berisi nama fungsi yang diharapkan.
Jika Anda membangun aplikasi yang memanggil OpenRouter, menulis beberapa tes permintaan di Apidog sejak awal menghemat waktu ketika model berperilaku tidak terduga.
Batas Tingkat Gratis yang Perlu Diketahui Sebelum Membangun di Atas Ini
Qwen 3.6 gratis sekarang. Ini tidak akan bertahan selamanya, dan ada kendala praktis yang perlu direncanakan.
Batas tarif dibagi. Model gratis di OpenRouter berbagi kapasitas di antara semua pengguna. Selama jam sibuk (biasanya malam hari AS), Anda akan melihat latensi yang lebih tinggi dan sesekali kesalahan batas tarif. Bangun logika percobaan ulang ke dalam kode produksi apa pun.
import time
import requests
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry
session = requests.Session()
retry_strategy = Retry(
total=3,
backoff_factor=2,
status_forcelist=[429, 500, 502, 503, 504],
)
adapter = HTTPAdapter(max_retries=retry_strategy)
session.mount("https://", adapter)
response = session.post(
"https://openrouter.ai/api/v1/chat/completions",
headers={"Authorization": "Bearer sk-or-v1-YOUR_KEY_HERE"},
json={
"model": "qwen/qwen3.6-plus-preview:free",
"messages": [{"role": "user", "content": "Hello"}],
},
timeout=30,
)
Data dicatat. Halaman model OpenRouter menyatakan bahwa "model mengumpulkan data prompt dan penyelesaian yang dapat digunakan untuk meningkatkan model." Jangan mengirim kunci API, kata sandi, atau informasi identitas pribadi melalui endpoint ini.
Status pratinjau. Ini adalah rilis pratinjau. Perilaku model dapat berubah. Jika Anda menggunakannya untuk inferensi produksi, pasang tes integrasi Anda ke ID model saat ini dan pantau regresi.
Hanya teks. Qwen 3.6 menerima input teks dan menghasilkan output teks. Tidak ada gambar, tidak ada audio, tidak ada unggahan file.
Kasus Penggunaan Dunia Nyata
Membangun agen peninjau kode. Sebuah tim yang membangun alat peninjau PR internal memasukkan seluruh diff pull request mereka (terkadang 10K+ baris) ke Qwen 3.6 dan mendapatkan umpan balik terperinci tentang kesalahan logika, tes yang hilang, dan masalah keamanan. Jendela 1 juta token memungkinkan hal ini tanpa memecah-mecah.
Pembuatan komponen front-end. Seorang pengembang tunggal yang membangun dasbor SaaS menggunakan Qwen 3.6 untuk menghasilkan komponen React dari spesifikasi desain. Model tersebut menghasilkan TypeScript yang bersih dengan prop types yang tepat dan CSS responsif tanpa memerlukan beberapa kali perbaikan.
Ringkasan dokumentasi API. Sebuah tim yang bermigrasi antara API pembayaran pihak ketiga memasukkan dokumentasi lengkap untuk kedua API (masing-masing sekitar 100K token) dalam satu permintaan dan meminta perbandingan berdampingan metode otentikasi, format webhook, dan batas tarif. Model tersebut mengembalikan tabel terstruktur dalam waktu kurang dari 30 detik.
Daftar di openrouter.ai, ambil kunci Anda, dan tukar qwen/qwen3.6-plus-preview:free dengan model apa pun yang saat ini Anda bayar.
FAQ
Apakah Qwen 3.6 Benar-benar Gratis untuk Digunakan?
Ya. Per Maret 2026, model ini terdaftar dengan harga $0 per juta token input dan $0 per juta token output di OpenRouter. Status gratis dapat berubah ketika periode pratinjau berakhir, jadi periksa halaman harga OpenRouter sebelum membangun apa pun yang bergantung pada biaya yang tetap nol.
Berapa Batas Tarif untuk Tingkat Gratis?
OpenRouter tidak mempublikasikan batas tarif yang tepat untuk model tingkat gratis. Dalam praktiknya, model gratis berbagi kapasitas dan tunduk pada pembatasan selama lalu lintas tinggi. Mulailah dengan satu permintaan pada satu waktu dan tambahkan logika percobaan ulang sebelum meningkatkan konkurensi.
Bisakah Saya Menggunakan Qwen 3.6 untuk Proyek Komersial?
Ya, OpenRouter mengizinkan penggunaan komersial. Periksa lisensi model Qwen dari Alibaba Cloud untuk setiap batasan pada model dasarnya sendiri, terutama jika Anda mendistribusikan output.
Mengapa Qwen 3.6 Membutuhkan Waktu Lebih Lama untuk Merespons Dibandingkan Model Lain?
Token penalaran wajib menambah latensi. Sebelum menghasilkan respons, model bekerja melalui rantai pemikiran internal. Untuk prompt sederhana, ini mungkin menambah beberapa detik. Untuk tugas penalaran kompleks, latensi ekstra ini sepadan. Gunakan streaming jika Anda ingin menampilkan output parsial saat model menghasilkan.
Apakah Ada Cara untuk Menonaktifkan Token Penalaran?
Per pratinjau saat ini, penalaran bersifat wajib dan tidak dapat dimatikan. Jika Anda membutuhkan respons yang lebih cepat tanpa rantai pemikiran, coba varian model yang berbeda ketika tersedia, atau gunakan model gratis yang lebih kecil seperti LLaMA 3.1 8B untuk tugas-tugas yang sensitif terhadap latensi.
Bagaimana Jendela Konteks 1 Juta Token Mempengaruhi Biaya?
Pada tingkat gratis, itu tidak berpengaruh. Anda membayar $0 terlepas dari berapa banyak token yang Anda kirim. Ingatlah bahwa permintaan yang sangat besar membutuhkan waktu lebih lama untuk diproses dan mungkin mengalami batas waktu pada tingkat gratis. Mulailah dengan batas waktu 30-60 detik dan tingkatkan untuk permintaan di atas 100K token.
