Qwen3.5 Flash API Nasıl Kullanılır?

Alibaba Cloud'un Qwen3.5 Flash API'si, erişilebilir büyük dil modellerinde önemli bir ilerlemeyi temsil ederek geliştiricilere yapay zeka destekli uygulamalar oluşturmaları için güçlü ve uygun maliyetli bir çözüm sunar. İster sohbet robotları, ister kodlama asistanları veya çok modlu uygulamalar geliştiriyor olun, Qwen3.5 Flash, olağanüstü kullanıcı deneyimleri sunmak için gereken esnekliği ve performansı sağlar. Bu kapsamlı kılavuz, ilk kurulumdan gelişmiş uygulama tekniklerine kadar Qwen3.5 Flash API'yi kullanmaya başlamak için bilmeniz gereken her şeyi size anlatacaktır.

💡

API anahtarlarınızı yönetmek ve Qwen3.5 entegrasyonlarınızı test etmek için Apidog'u kullanın. Apidog, API entegrasyonlarınızı tasarlamak, hata ayıklamak ve belgelemek için birleşik bir arayüz sunar; bu da Qwen3.5 uygulamanızın üretime dağıtılmadan önce doğru çalıştığından emin olmak için mükemmeldir.

button

Qwen3.5 Flash API'yi Anlamak

Qwen3.5 Flash (Qwen3.5-35B-A3B), Alibaba'nın Qwen3 model serisinin bir parçasıdır ve rekabetçi fiyatlarla yüksek performanslı yapay zeka yetenekleri sunmak üzere tasarlanmıştır. "Flash" tanımı, bu modellerin hız ve maliyet verimliliği için optimize edildiğini gösterir; bu da onları hem yanıt kalitesinin hem de kaynak yönetiminin önemli olduğu üretim uygulamaları için ideal kılar.

Qwen3.5 ailesi, farklı kullanım senaryolarına göre uyarlanmış çeşitli varyantları içerir. Qwen3.5-397B-A17B modeli, karmaşık muhakeme görevleri için 403 milyar parametre ile maksimum yetenek sunar. Qwen3.5-397B-FP8, optimize edilmiş depolama ile aynı yeteneği sağlar. Qwen3.5-122B-A10B, dengeli performans için 125 milyar parametre sunarken, Qwen3.5-35B-A3B(Qwen3.5 Flash) genel amaçlı uygulamalar için uygun maliyetli bir seçenek olarak 36 milyar parametre sağlar. Tüm modeller, hem metin hem de görüntüleri işleyen çok modlu etkileşimleri mümkün kılan görüntü (Görsel-Metin-Metin) yeteneklerini destekler.

Başlarken: Önkoşullar ve Kurulum

Qwen3.5 Flash API'yi kullanmaya başlamadan önce birkaç kurulum adımını tamamlamanız gerekecektir. İlk olarak, henüz bir Alibaba Cloud hesabınız yoksa bir hesap oluşturun, ardından API anahtarınızı oluşturmak için Model Studio'ya gidin. Bu anahtar, isteklerinizi doğrular ve faturalandırma amacıyla kullanımınızı izler. Bu anahtarı güvende tutun ve asla istemci tarafı kodda veya herkese açık depolarda ifşa etmeyin.

Geliştirme ortamınız için uygun SDK'yı da yüklemeniz gerekecektir. Python geliştiricileri, OpenAI uyumlu SDK'yı pip kullanarak yükleyebilir:

pip install openai

Node.js ortamları için, openai npm paketi eşdeğer işlevsellik sağlar. API, OpenAI uyumlu olacak şekilde tasarlanmıştır; bu da daha önce OpenAI'nin API'siyle çalıştıysanız Qwen3.5 Flash'a geçişin kolay olduğunu göreceğiniz anlamına gelir. Temel farklılıklar, temel URL ve kimlik doğrulama mekanizmasını içerir.

API Yapılandırması ve Bölgesel Uç Noktalar

Qwen3.5 Flash entegrasyonunuzu yapılandırmanın kritik bir yönü, uygun bölgesel uç noktayı seçmektir. Seçiminiz gecikmeyi, fiyatlandırmayı ve mevcut özellikleri etkiler. Alibaba Cloud, dünya çapındaki kullanıcılara hizmet vermek için birden fazla bölgesel uç nokta sağlar:

Singapur uç noktası (https://dashscope-intl.aliyuncs.com/compatible-mode/v1) Asya-Pasifik bölgesine hizmet verir ve yeni kullanıcılar için 90 gün boyunca 1 milyon jetonluk cömert bir ücretsiz katman sunar. Bu, API'yi keşfeden geliştiriciler için mükemmel bir başlangıç noktasıdır. Virginia (ABD) uç noktası (https://dashscope-us.aliyuncs.com/compatible-mode/v1) Kuzey Amerikalı kullanıcılar için daha iyi performans sağlarken, Pekin uç noktası (https://dashscope.aliyuncs.com/compatible-mode/v1) Çin anakarasındaki kullanıcılara hizmet verir.

İstemcinizi yapılandırırken, optimum performans için uygulama kullanıcılarınıza coğrafi olarak en yakın uç noktayı seçtiğinizden emin olun. Kimlik doğrulama süreci, diğer bazı hizmetlerin kullandığı OAuth akışı yerine API anahtarlarını kullanır; bu da güvenliği korurken entegrasyonu basitleştirir.

İlk API Çağrınızı Yapma

API anahtarınız ve uç noktanız yapılandırıldıktan sonra ilk isteğinizi yapmaya hazırsınız. İşte basit bir sohbeti gösteren temel bir Python örneği:

"""
Environment variables (per official docs):
  DASHSCOPE_API_KEY: Your API Key from https://bailian.console.aliyun.com
  DASHSCOPE_BASE_URL: (optional) Base URL for compatible-mode API.
  DASHSCOPE_MODEL: (optional) Model name; override for different models.
  DASHSCOPE_BASE_URL:
    - Beijing: https://dashscope.aliyuncs.com/compatible-mode/v1
    - Singapore: https://dashscope-intl.aliyuncs.com/compatible-mode/v1
    - US (Virginia): https://dashscope-us.aliyuncs.com/compatible-mode/v1
"""
from openai import OpenAI
import os

api_key = os.environ.get("DASHSCOPE_API_KEY")
if not api_key:
    raise ValueError(
        "DASHSCOPE_API_KEY is required. "
        "Set it via: export DASHSCOPE_API_KEY='your-api-key'"
    )

client = OpenAI(
    api_key=api_key,
    base_url=os.environ.get(
        "DASHSCOPE_BASE_URL",
        "https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
    ),
)

messages = [{"role": "user", "content": "Introduce Qwen3.5."}]

model = os.environ.get(
    "DASHSCOPE_MODEL",
    "qwen3.5-plus",
)
completion = client.chat.completions.create(
    model=model,
    messages=messages,
    extra_body={
        "enable_thinking": True,
        "enable_search": False
    },
    stream=True
)

reasoning_content = ""  # Full reasoning trace
answer_content = ""  # Full response
is_answering = False  # Whether we have entered the answer phase
print("\n" + "=" * 20 + "Reasoning" + "=" * 20 + "\n")

for chunk in completion:
    if not chunk.choices:
        print("\nUsage:")
        print(chunk.usage)
        continue

    delta = chunk.choices[0].delta

    # Collect reasoning content only
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
        if not is_answering:
            print(delta.reasoning_content, end="", flush=True)
        reasoning_content += delta.reasoning_content

    # Received content, start answer phase
    if hasattr(delta, "content") and delta.content:
        if not is_answering:
            print("\n" + "=" * 20 + "Answer" + "=" * 20 + "\n")
            is_answering = True
        print(delta.content, end="", flush=True)
        answer_content += delta.content

Doğrudan HTTP çağrılarını tercih eden geliştiriciler için eşdeğer curl komutu aşağıdadır:

curl -X POST https://dashscope-intl.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "Qwen3.5-35B-A3B",
    "messages": [{"role": "user", "content": "Explain quantum computing in simple terms"}]
}'

Yanıt yapısı standart OpenAI formatını takip eder, bu da sohbet tamamlama yanıtları bekleyen mevcut kod tabanlarıyla entegrasyonu kolaylaştırır.

Gelişmiş Özellikler: Düşünme Modu

Qwen3.5'in en güçlü özelliklerinden biri, modelin yanıt üretmeden önce adım adım akıl yürütme yapmasını sağlayan düşünme modudur. Bu, karmaşık matematiksel problemler, mantıksal akıl yürütme ve akıl yürütme sürecinin gösterilmesinin sonuç kalitesini artırdığı çok adımlı analizler için özellikle değerlidir.

Düşünme modunu etkinleştirmek için, isteğinize enable_thinking parametresini ekleyin:

completion = client.chat.completions.create(
    model="qwen3.5-flash",
    messages=[
        {"role": "user", "content": "If a train travels 120km in 1.5 hours, what is its average speed?"}
    ],
    extra_body={
        'enable_thinking': True,
        'thinking_budget': 81920
    }
)

thinking_budget parametresi, modelin akıl yürütme için ne kadar jeton tahsisi kullanabileceğini kontrol eder. Daha yüksek bütçeler daha kapsamlı akıl yürütmeyi mümkün kılar ancak jeton tüketimini ve yanıt süresini artırır. Basit sorgular için daha düşük bir bütçe yeterliyken, karmaşık problemler cömert tahsisattan faydalanır.

Çok Modlu Görüntü Yeteneklerini Uygulama

Görüntü özellikli varyantlar—qwen3-vl-plus ve qwen3-vl-flash—API'nin yeteneklerini görüntü anlamaya genişletir. Bu modeller görüntüleri analiz edebilir, görsel içeriği tanımlayabilir, resimlerle ilgili soruları yanıtlayabilir ve fotoğraflardan veya diyagramlardan bilgi çıkarabilir. Bu, otomatik görüntü açıklaması, görsel arama, diyagramlarla belge işleme ve erişilebilirlik araçları gibi uygulamalar için olanaklar sunar.

İşte analiz için bir görüntü gönderme yöntemi:

messages = [
    {
        "role": "user",
        "content": [
            {"type": "image_url", "image_url": {"url": "https://example.com/sample-image.jpg"}},
            {"type": "text", "text": "Describe what you see in this image"}
        ]
    }
]

completion = client.chat.completions.create(
    model="Qwen3.5-35B-A3B",
    messages=messages
)

İstek içinde doğrudan görüntü URL'leri veya base64 kodlu görüntü verileri sağlayabilirsiniz. Model, görüntüyü metin isteminizle birlikte işler ve görüntüdeki görsel öğelere atıfta bulunan yanıtlar üretir. Bu yetenek, yüklenen ekran görüntülerini işleyebilen müşteri hizmetleri botları, otomatik denetleme sistemleri ve görsel içeriği açıklayan eğitim araçları oluşturmak için paha biçilmezdir.

Araç Entegrasyonu için Fonksiyon Çağırma

Fonksiyon çağırma, Qwen3.5'in kullanıcı isteklerine göre harici araçları ve API'leri akıllıca çağırmasını sağlar. Bu, konuşma yapay zekası ile gerçek dünya işlevselliği arasındaki boşluğu doldurarak uygulamanızın veritabanlarını sorgulama, üçüncü taraf API'leri çağırma veya özel iş mantığını yürütme gibi eylemler gerçekleştirmesine olanak tanır.

Fonksiyon çağırmayı uygulamak için, öncelikle isteğinizde mevcut araçları tanımlayın:

tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "Get current weather for a specified location",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "City name, e.g., San Francisco"
                    }
                },
                "required": ["location"]
            }
        }
    }
]

completion = client.chat.completions.create(
    model="qwen3.5-flash",
    messages=[
        {"role": "user", "content": "What's the weather like in Tokyo?"}
    ],
    tools=tools
)

Model, bir fonksiyon çağrısının uygun olduğuna karar verdiğinde, yanıt bir metin mesajı yerine bir araç çağrısı nesnesi içerir. Uygulamanız daha sonra fonksiyonu yürütür ve sonuçları döndürür, bu da modelin son bir bağlamsal yanıt üretmesini sağlar. Bu desen, rezervasyon sistemleri, veri alma uygulamaları ve anlamlı eylemler gerçekleştirebilen etkileşimli asistanlar gibi gelişmiş iş akışlarını mümkün kılar.

Gerçek Zamanlı Uygulamalar için Akış Yanıtları

Sohbet robotları, yazma asistanları ve etkileşimli araçlar gibi algılanan gecikmenin önemli olduğu uygulamalar için, akış yanıtları, tam yanıtları beklemek yerine metni oluşturulduğu anda görüntüleyerek daha iyi bir kullanıcı deneyimi sunar.

completion = client.chat.completions.create(
    model="qwen3.5-flash",
    messages=[
        {"role": "user", "content": "Write a short story about a robot learning to paint"}
    ],
    stream=True
)

for chunk in completion:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end="", flush=True)

Akış, kullanıcıların anlamlı çıktıyı görmeden önce bekledikleri süreyi azaltır; bu, özellikle uzun yanıtlar için faydalıdır. Akış protokolü, parçaları oluşturulduğu anda gönderir ve model işleme devam ederken aşamalı görüntülemeye olanak tanır.

Bağlam Önbellekleme ile Maliyet Optimizasyonu

Qwen3.5, tekrarlayan bağlama sahip uygulamalar için maliyetleri azaltan bir özellik olan bağlam önbellekleme sayesinde önemli maliyet tasarrufları sunar. Ortak sistem istemlerini veya temel belgeleri paylaşan mesajlar gönderdiğinizde, önbellek bu bağlamı yeniden kullanım için saklar. Aynı önbelleğe alınmış içeriğe başvuran sonraki istekler, örtülü önbellekleme için standart fiyatın %20'si ve açık önbellek yönetimi için %10 gibi önemli indirimler alır.

Bu özellik, kullanıcı soruları değişirken temel bir belgenin sabit kaldığı belge Soru-Cevap sistemleri gibi uygulamalar için özellikle değerlidir. Her sorguda tam belgeyi yeniden göndermek yerine, önbelleğe alınmış bağlama başvurarak ölçekte jeton maliyetlerini önemli ölçüde azaltırsınız.

İhtiyaçlarınıza Uygun Modeli Seçmek

Uygun Qwen3.5 varyantını seçmek, özel gereksinimlerinize bağlıdır. İşte pratik bir rehber:

Model	Tip	Parametreler	En İyi Olduğu Alan
Qwen3.5-397B-A17B	Görsel-Metin-Metin	403B	Maksimum yetenek, karmaşık muhakeme
Qwen3.5-397B-A17B-FP8	Görsel-Metin-Metin	403B	Optimize edilmiş depolama ile yüksek yetenek
Qwen3.5-122B-A10B	Görsel-Metin-Metin	125B	Dengeli performans ve verimlilik
Qwen3.5-35B-A3B	Görsel-Metin-Metin	36B	Uygun maliyetli, genel amaçlı görevler
Qwen3.5-35B-A3B-Base	Görsel-Metin-Metin	36B	İnce ayar için temel model
Qwen3.5-27B	Görsel-Metin-Metin	28B	Hafif uygulamalar

Qwen3.5-397B-A17B

403 milyar parametreli amiral gemisi modelidir; karmaşık muhakeme, büyük ölçekli veri analizi ve gelişmiş problem çözme görevlerinde maksimum yetenek için tasarlanmıştır.

Qwen3.5-397B-A17B-FP8

397B modeliyle aynı yeteneğe sahip olup, yüksek kaliteyi korurken depolamayı azaltmak ve çıkarım hızını artırmak için optimize edilmiş FP8 nicelemesi ile sunulur.

Qwen3.5-122B-A10B

Makul kaynak gereksinimleriyle genel görevlerde güçlü performans sunan dengeli 125 milyar parametreli bir modeldir.

Qwen3.5-35B-A3B (Qwen3.5 Flash)

Genel amaçlı uygulamalar, sohbet robotları ve uygun maliyetli üretim dağıtımları için ideal olan en çok yönlü 36 milyar parametreli modeldir.

Qwen3.5-35B-A3B-Base

35B varyantının temel model versiyonu olup, özel yapay zeka çözümleri oluşturmak için alana özgü veri kümelerinde ince ayar yapmak için mükemmeldir.

Qwen3.5-27B

Kaynak kısıtlı ortamlar ve hızın kritik olduğu uygulamalar için tasarlanmış hafif 28 milyar parametreli bir modeldir.

Çoğu genel uygulama için Qwen3.5 Flash (Qwen3.5-35B-A3B), yetenek ve maliyetin en iyi dengesini sunar. Karmaşık muhakeme görevleri için maksimum performansa ihtiyacınız varsa, 397B modelleri en yüksek yeteneği sağlar. 122B varyantı, performans ve kaynak gereksinimleri arasında bir orta yol sunar.

Sonuç

Qwen3.5 Flash API, geliştiricilere gelişmiş yapay zeka yeteneklerini uygulamalara entegre etmek için güçlü, esnek ve uygun maliyetli bir çözüm sunar. OpenAI uyumlu arayüzler, cömert ücretsiz katmanlar ve çeşitli özel modeller sayesinde, başlamak minimum çaba gerektirirken, gelişmiş uygulamalara giden yollar sunar. İster basit sohbet robotları ister karmaşık çok modlu uygulamalar oluşturuyor olun, Qwen3.5 Flash, etkileyici yapay zeka destekli deneyimler için temel sağlar.

Başarılı uygulamanın anahtarı, özel gereksinimlerinizi (gecikme hassasiyeti, bütçe kısıtlamaları ve işlevsel ihtiyaçlar) anlamak ve uygun model varyantını ve yapılandırmasını seçmektir. Yetenekleri keşfetmek için Singapur bölgesindeki ücretsiz katmandan başlayın, ardından gerçek dünya performansı ve maliyet gözlemlerine dayanarak uygulamanızı optimize edin.

API geliştirme iş akışınızı Apidog ile kolaylaştırın. API şemalarını tasarlamaktan uç noktaların hata ayıklamasına ve dokümantasyon oluşturmaya kadar Apidog, güvenilir entegrasyonları daha hızlı oluşturmanıza yardımcı olur. Qwen3.5 ve diğer tüm API'lerle çalışmayı kolaylaştıran hepsi bir arada platformdur.

button