Qwen3.6-Plus API: Terminalde Claude'u Geçti

Özetle

Qwen3.6-Plus resmi olarak piyasaya sürüldü. SWE-bench Verified'da %78,8 ve Terminal-Bench 2.0'da %61,6 puan alarak Claude Opus 4.5'i geride bıraktı. 1 milyon tokenlık bir bağlam penceresine, ajan döngüleri için yeni bir preserve_thinking parametresine sahip ve OpenAI uyumlu bir API aracılığıyla doğrudan Claude Code, OpenClaw ve Qwen Code ile çalışıyor.

Önizlemeden tam sürüme

OpenRouter'daki Qwen 3.6 Plus Önizlemesi hakkındaki önceki rehberimizi okuduysanız, bu modelin neler yapabileceğini zaten biliyorsunuzdur. Önizleme 30 Mart'ta sessizce, bekleme listesi olmadan ve OpenRouter üzerinden ücretsiz erişimle yayınlandı. İlk iki gününde, yaklaşık 400.000 istekte 400 milyondan fazla tamamlama tokenı işledi.

Resmi sürüm, tam üretim versiyonunu sunuyor. Artık sadece önizleme değil. Model, Alibaba Cloud Model Studio aracılığıyla kararlı bir API, SLA destekli çalışma süresi ve çok adımlı ajan görevleri için onu önemli ölçüde daha yetenekli kılan yeni bir API parametresi ile kullanıma sunuldu.

Bu rehber, nelerin değiştiğini, API'nin nasıl doğru şekilde çağrılacağını ve dağıtımdan önce entegrasyonunuzu Apidog ile nasıl test edeceğinizi anlatmaktadır.

button

Qwen3.6-Plus Nedir?

Qwen3.6-Plus, Alibaba'nın Qwen ekibinden barındırılan bir uzman karışımı modelidir. Qwen3.5 serisi gibi, seyrek aktivasyon kullanır, yani token başına parametrelerin yalnızca bir kısmı tetiklenir. Sonuç olarak, benzer yetenekteki yoğun bir modele göre daha düşük hesaplama maliyetiyle güçlü performans elde edilir.

Piyasaya sürüldüğündeki temel özellikler:

Varsayılan olarak 1 milyon token bağlam penceresi
Zorunlu düşünce zinciri muhakemesi (önizleme ile aynı)
Ajan görevleri için yeni preserve_thinking parametresi
Yerel çok modlu destek (görü, video, belge anlama)
OpenAI uyumlu API, Anthropic uyumlu API ve OpenAI Yanıtları API'si

Günler içinde açık kaynaklı daha küçük varyantlar geliyor. Kendi kendine barındırmak için ağırlıklara ihtiyacınız varsa, yoldalar.

Kıyaslama sonuçları

Kodlama ajanları

Qwen3.6-Plus, çoğu SWE-bench görevinde Claude Opus 4.5'in az farkla gerisinde kalırken, terminal operasyonlarında karşılaştırmadaki her modeli geride bırakıyor.

Terminal-Bench 2.0, gerçek kabuk operasyonlarını test eder: dosya yönetimi, süreç kontrolü, 3 saatlik zaman aşımı, 32 CPU çekirdeği ve 48 GB RAM altında çok adımlı terminal iş akışları. Qwen3.6-Plus'ın %61,6'lık puanı, Claude Opus 4.5'in %59,3'üne kıyasla, geliştiricilerin yürüttüğü görev türlerinde anlamlı bir fark yaratıyor.

Genel ajanlar ve araç kullanımı

Kıyaslama	Claude Opus 4.5	Qwen3.6-Plus
TAU3-Bench	70.2%	70.7%
DeepPlanning	33.9%	41.5%
MCPMark	42.3%	48.2%
MCP-Atlas	71.8%	74.1%
WideSearch	76.4%	74.3%

MCPMark, GitHub MCP v0.30.3 araç çağrılarını test eder, Playwright yanıtları 32K tokenda kesilmiştir. %48,2 ile lider olmak, MCP tabanlı araçlar üzerinde geliştirme yapan herkes için önemlidir. DeepPlanning'de %41,5'e karşılık Claude için %33,9, uzun ufuklu planlama görevlerinde önemli bir fark olduğunu gösteriyor.

Muhakeme ve bilgi

Kıyaslama	Claude Opus 4.5	Qwen3.6-Plus
GPQA	87.0%	90.4%
LiveCodeBench v6	84.8%	87.1%
IFEval strict	90.9%	94.3%
MMLU-Pro	89.5%	88.5%

GPQA, yüksek lisans düzeyinde bir bilimsel muhakeme kıyaslamasıdır. IFEval strict, bir modelin hassas biçimlendirme ve kısıtlama talimatlarına ne kadar iyi uyduğunu ölçer. Qwen3.6-Plus her ikisinde de liderdir; bu, yapılandırılmış çıktı ve modelin karmaşık talimatları sapmadan takip etmesi gereken ajan görevleri için önemlidir.

Çok Modlu

Qwen3.6-Plus yerel bir çok modlu modeldir. Birçok belge, mekansal ve nesne algılama kıyaslamasında liderdir.

Kıyaslama	Qwen3.6-Plus	Notlar
OmniDocBench 1.5	91.2%	Tabloda en üstte
RefCOCO ort	93.5%	Tabloda en üstte
We-Math	89.0%	Tabloda en üstte
CountBench	97.6%	Tabloda en üstte
OSWorld-Verified	62.5%	Claude'un gerisinde (%66,3)

Masaüstü bilgisayar kullanım kıyaslaması olan OSWorld-Verified, Claude Opus 4.5'i %66,3 ile önde gösterirken, Qwen3.6-Plus %62,5'te kalmıştır. Belge anlama ve mekansal temellendirme görevlerinde ise Qwen3.6-Plus liderdir.

API nasıl çağrılır?

Qwen3.6-Plus, Alibaba Cloud Model Studio'da yer almaktadır. API anahtarınızı modelstudio.alibabacloud.com adresinden edinebilirsiniz.

Üç bölgesel temel URL:

Singapur: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
Pekin: https://dashscope.aliyuncs.com/compatible-mode/v1
ABD Virginia: https://dashscope-us.aliyuncs.com/compatible-mode/v1

Akışlı temel çağrı

from openai import OpenAI
import os

client = OpenAI(
 api_key=os.environ["DASHSCOPE_API_KEY"],
 base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
 model="qwen3.6-plus",
 messages=[{"role": "user", "content": "Review this Python function and find bugs."}],
 extra_body={"enable_thinking": True},
 stream=True
)

reasoning = ""
answer = ""
is_answering = False

for chunk in completion:
 if not chunk.choices:
 continue
 delta = chunk.choices[0].delta
 if hasattr(delta, "reasoning_content") and delta.reasoning_content:
 if not is_answering:
 reasoning += delta.reasoning_content
 if delta.content:
 if not is_answering:
 is_answering = True
 answer += delta.content
 print(delta.content, end="", flush=True)

`preserve_thinking` parametresi

Önizleme sürümü yalnızca mevcut adımdaki muhakemeyi saklıyordu. Resmi sürüm preserve_thinking parametresini ekliyor.

preserve_thinking: true olarak ayarladığınızda, model konuşmadaki tüm önceki adımlardan düşünce zincirini korur. Alibaba bunu özellikle ajan senaryoları için öneriyor. Bunun nedeni şudur: çok adımlı bir görev üzerinde çalışan bir ajan, kendi önceki düşüncelerini görerek fayda sağlar. 2. adımda neden o seçimi yaptığını görebildiğinde, 5. adımda daha iyi kararlar verir.

Token kullanımını kontrol etmek için varsayılan olarak devre dışıdır. Ajan döngüleri için etkinleştirin.

completion = client.chat.completions.create(
 model="qwen3.6-plus",
 messages=conversation_history,
 extra_body={
 "enable_thinking": True,
 "preserve_thinking": True, # keep reasoning across all turns
 },
 stream=True
)

Qwen3.6-Plus'ı Claude Code ile kullanın

Qwen API'si Anthropic protokolünü destekler. Ortam değişkenlerinin ötesinde herhangi bir Claude Code yapılandırmasını değiştirmeden Qwen3.6-Plus'a karşı Claude Code'u çalıştırabilirsiniz.

npm install -g @anthropic-ai/claude-code

export ANTHROPIC_MODEL="qwen3.6-plus"
export ANTHROPIC_SMALL_FAST_MODEL="qwen3.6-plus"
export ANTHROPIC_BASE_URL=https://dashscope-intl.aliyuncs.com/apps/anthropic
export ANTHROPIC_AUTH_TOKEN=your_dashscope_api_key

claude

Qwen3.6-Plus'ı OpenClaw ile kullanın

OpenClaw (eski adıyla Moltbot / Clawdbot), açık kaynaklı, kendi kendine barındırılan bir kodlama ajanıdır. Kurun ve Model Studio'ya yönlendirin:

# Kurulum (Node.js 22+)
curl -fsSL https://molt.bot/install.sh | bash

export DASHSCOPE_API_KEY=your_key
openclaw dashboard

~/.openclaw/openclaw.json dosyasını düzenleyin ve bu alanları birleştirin (dosyanın tamamının üzerine yazmayın):

{
 "models": {
 "providers": [{
 "name": "alibaba-coding-plan",
 "baseUrl": "https://coding-intl.dashscope.aliyuncs.com/v1",
 "apiKey": "${DASHSCOPE_API_KEY}",
 "models": [{"id": "qwen3.6-plus", "reasoning": true}]
 }]
 },
 "agents": {
 "defaults": {"models": ["qwen3.6-plus"]}
 }
}

Qwen3.6-Plus'ı Qwen Code ile kullanın

Qwen Code, Alibaba'nın Qwen serisi için özel olarak geliştirilmiş kendi açık kaynaklı terminal ajanıdır. Qwen Code OAuth ile giriş yaptığınızda günde 1.000 ücretsiz API çağrısı hakkı verir.

npm install -g @qwen-code/qwen-code@latest
qwen
# Giriş yapmak ve ücretsiz katmanı etkinleştirmek için /auth yazın

`preserve_thinking` ajanın davranışını neden değiştirir?

Çoğu LLM API'si her adımı bağımsız olarak ele alır. Model bir yanıt üretir, muhakeme atılır ve bir sonraki adım sıfırdan başlar. Basit Soru-Cevap için bu sorun değildir. Ancak 10-20 adımlı görevler yürüten ajanlar için bir sorun yaratır: model önceki kararları neden aldığını göremez, bu yüzden sapar.

preserve_thinking parametresi, bir sonraki yanıtı oluştururken tüm önceki adımlardan gelen düşünce zincirinin tamamını görünür kılar. Pratik etkisi şudur: 8. adımda karmaşık bir depo düzeyinde görev üzerinde çalışan bir ajan, 2, 4 ve 6. adımlardaki analizini görebilir. Bu, daha tutarlı kararlar almasını ve daha az çelişki üretmesini sağlar.

Alibaba'nın kıyaslamaları bunun gereksiz muhakemeyi de azalttığını gösteriyor. Modelin zaten oluşturduğu bağlamı yeniden türetmek zorunda kalmadığında, karmaşık çok adımlı iş akışları için adım başına ortalama daha az token kullanır.

Ajan döngüleri için bu deseni kullanın:

conversation = []

def agent_step(user_message, preserve=True):
    conversation.append({"role": "user", "content": user_message})

    response = client.chat.completions.create(
        model="qwen3.6-plus",
        messages=conversation,
        extra_body={
            "enable_thinking": True,
            "preserve_thinking": preserve,
        },
        stream=False
    )

    message = response.choices[0].message
    conversation.append({"role": "assistant", "content": message.content})
    return message.content

# Örnek: çok adımlı kod inceleme ajanı
result = agent_step("Analyze the auth module for security issues.")
result = agent_step("Now suggest fixes for the top 3 issues you found.")
result = agent_step("Write tests that validate each fix.")

preserve_thinking olmadan, 3. adımdaki model 1. adımda hangi 3 sorunu tespit ettiğini bilmez. Bu parametre ile muhakeme zinciri bozulmadan kalır.

En iyi olduğu alanlar

Depo düzeyinde hata düzeltme. SWE-bench Verified'da %78,8 ve SWE-bench Pro'da %56,6 ile bugün mevcut olan her şeyle rekabet edebilir. Otomatik kod onarımı veya inceleme süreçleri yürütüyorsanız, Qwen3.6-Plus'ı mevcut kurulumunuza karşı kıyaslamaya değer.

Terminal otomasyonu. Terminal-Bench 2.0'daki liderliği, onu kabuk yoğun iş akışları için mevcut en güçlü model yapmaktadır. Çok adımlı dosya işlemleri, süreç yönetimi, derleme süreçleri.

MCP araç çağrısı. MCPMark'ta %48,2 (en iyi sonuç) ile MCP tabanlı araç entegrasyonları için şu anda en iyi seçenek olmasını sağlıyor.

Uzun bağlamlı belge analizi. Güçlü LongBench v2 puanlarına sahip 1 milyon tokenlık pencere, tek bir çağrıda tüm kod tabanı incelemelerini, büyük şartname belgelerini ve çoklu dosya analizini işler.

Ön uç kod üretimi. Qwen ekibinin dahili QwenWebBench'i (Elo derecesi, 7 kategori: Web Tasarımı, Web Uygulamaları, Oyunlar, SVG, Veri Görselleştirme, Animasyon, 3D) Qwen3.6-Plus'a 1501,7 puan verirken, Claude Opus 4.5'in puanı 1517,9'dur. Ön uç üretimi kalitesinde fiilen berabere kalmıştır.

Çok dilli. WMT24++'da %84,3 (en üst), 23 dil ayarında MAXIFE'de %88,2. İngilizce dışındaki kullanım durumlarında güçlü.

Apidog ile Qwen3.6-Plus API çağrılarını test etme

Uç nokta OpenAI uyumlu olduğundan, doğrudan Apidog'a aktarabilir ve diğer API'ler gibi test edebilirsiniz.

https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions adresine bir POST isteği ayarlayın. API anahtarınızı bir ortam değişkeni olarak ekleyin: Authorization: Bearer {{DASHSCOPE_API_KEY}}.

Yapı ve içeriği doğrulamak için yanıt onaylamaları yazın:

pm.test("Yanıt seçenekler içeriyor", () => {
 const body = pm.response.json();
 pm.expect(body).to.have.property("choices");
 pm.expect(body.choices[0].message.content).to.be.a("string").and.not.empty;
});

pm.test("Düşünme etkinleştirildiğinde boş muhakeme yok", () => {
 const choice = pm.response.json().choices[0];
 if (choice.message.reasoning_content !== undefined) {
 pm.expect(choice.message.reasoning_content).to.not.be.empty;
 }
});

Geliştirme sırasında test yanıtları oluşturmak için Apidog'un Akıllı Sahte (Smart Mock) özelliğini kullanın. Bu, ajan orkestrasyon kodunuzun her çalıştırmada canlı API'yi çağırmadan test edilebileceği, böylece token tasarrufu sağlayarak test döngülerinin hızlı kalmasını mümkün kılar.

Çok adımlı bir ajan geliştiriyorsanız, Apidog'da birden fazla isteği zincirleyen bir Test Senaryosu oluşturun. Üretimde tam döngüyü çalıştırmadan önce her adımda yanıt yapısını kontrol ederek preserve_thinking'in mantığı adımlar arasında taşıdığını doğrulayın.

Bu testleri ayarlamak için Apidog'u ücretsiz indirin.

Sırada ne var?

Qwen ekibi, daha küçük açık kaynaklı varyantların günler içinde piyasaya sürüleceğini doğruladı. Bunlar Qwen3.5 modelini takip edecek: halka açık Apache 2.0 ağırlıklarına sahip seyrek MoE modelleri.

Yol haritası ayrıca şunları içeriyor:

Giderek karmaşıklaşan çoklu dosya sorun çözmeyi hedefleyen, daha uzun vadeli depo düzeyinde görevler
GUI ajanları ve görsel kodlamanın yan özellikler değil, birinci sınıf yetenekler olarak ele alındığı devam eden çok modlu ajan geliştirme

Qwen3.5 açık kaynak varyantları, piyasaya sürüldükten haftalar sonra en çok dağıtılan kendi kendine barındırılan modellerden bazıları haline geldi. Qwen3.6 aynı deseni takip ederse, daha küçük varyantlar büyük olasılıkla piyasaya çıktıktan kısa bir süre sonra kendi kendine barındırılan kodlama ajanları için varsayılan seçim olacaktır.

Sonuç

Qwen3.6-Plus, kodlama görevlerinde Claude Opus 4.5 ile aradaki farkı kapatıyor ve terminal operasyonları, MCP araç çağrısı ve uzun ufuklu planlamada belirgin bir liderlik elde ediyor. 1 milyon tokenlık bağlam, Anthropic protokol uyumluluğu ve ajan döngüleri için preserve_thinking özelliği, onu şu anda üretim ajan sistemleri için pratik bir seçim haline getiriyor.

OpenRouter'daki ücretsiz önizleme dönemi, modeli değerlendirmek için faydalı bir yoldu. Resmi API, istikrar, SLA kapsamı ve çok adımlı iş akışlarını daha güvenilir kılan yeni ajan odaklı parametreyi getiriyor.

Apidog test tarafını yönetir: OpenAI uyumlu uç noktayı içe aktarın, yanıt onaylamaları yazın, geliştirme sırasında sahte veriler kullanın ve modeli her güncellediğinizde veya API sürümünü yükselttiğinizde regresyon testleri çalıştırın.

button

Sıkça Sorulan Sorular

Qwen3.6-Plus ile önizleme arasındaki fark nedir?Önizleme (qwen/qwen3.6-plus-preview) 30 Mart 2026'da OpenRouter'da yayınlandı. Resmi sürüm preserve_thinking parametresini, SLA destekli çalışma süresini ve tam Model Studio desteğini ekliyor. Daha küçük açık kaynaklı varyantlar da geliyor.

preserve_thinking nedir ve ne zaman kullanmalıyım?Varsayılan olarak, yalnızca mevcut adımdaki muhakeme tutulur. preserve_thinking: true ayarlandığında, model tüm önceki konuşma adımlarından düşünce zincirini korur. Modelin geçmiş muhakemesinin bir sonraki eylemini bilgilendirmesi gereken çok adımlı ajan döngüleri için kullanın.

Qwen3.6-Plus, Claude Opus 4.5 ile nasıl karşılaştırılır?Claude Opus 4.5, SWE-bench Verified'da (%80,9'a karşı %78,8) ve OSWorld-Verified'da (%66,3'e karşı %62,5) önde gidiyor. Qwen3.6-Plus ise Terminal-Bench 2.0'da (%61,6'ya karşı %59,3), MCPMark'ta (%48,2'ye karşı %42,3), DeepPlanning'de (%41,5'e karşı %33,9) ve GPQA'da (%90,4'e karşı %87,0) liderdir.

Qwen3.6-Plus'ı Claude Code ile kullanabilir miyim?Evet. `ANTHROPIC_BASE_URL`'i Dashscope Anthropic uyumlu uç noktaya, `ANTHROPIC_MODEL`'i `qwen3.6-plus`'a ve `ANTHROPIC_AUTH_TOKEN`'i Dashscope API anahtarınıza ayarlayın.

Qwen3.6-Plus açık kaynak mı?Barındırılan API modeli açık ağırlıklı değildir. Halka açık ağırlıklara sahip daha küçük varyantların günler içinde piyasaya sürüleceği doğrulandı.

Ücretsiz erişimi nasıl edinebilirim?Qwen Code'u kurun (`npm install -g @qwen-code/qwen-code@latest`), `qwen`'i çalıştırın, ardından `/auth` yazın. Qwen3.6-Plus'a karşı günde 1.000 ücretsiz API çağrısı için Qwen Code OAuth ile giriş yapın.

Hangi bağlam penceresini destekler?Varsayılan olarak 1 milyon token. Resmi rapordaki bazı kıyaslamalar standartlaştırılmış karşılaştırma için 256K kullandı, ancak API varsayılanı 1M'dir.

Dağıtımdan önce API entegrasyonunu nasıl test ederim?Uç noktayı Apidog'a aktarın, API anahtarınızı bir ortam değişkeni olarak ekleyin, yanıt onaylamaları yazın ve çevrimdışı geliştirme için Akıllı Sahte (Smart Mock) özelliğini kullanın. Çok adımlı ajan davranışını uçtan uca doğrulamak için istekleri bir Test Senaryosu'nda zincirleyin.