Ollama ile Ücretsiz Qwen3.5 Modelleri Nasıl Kullanılır?

Ashley Innocent

Ashley Innocent

25 February 2026

Ollama ile Ücretsiz Qwen3.5 Modelleri Nasıl Kullanılır?

Kurumsal Apidog

Şirket İçi Dağıtım

SSO & RBAC

SOC 2 Uyumlu

Apidog Enterprise'ı Keşfet

Geliştiriciler, ham zekayı sıfır başlangıç maliyetiyle dengeleyen, son teknoloji yapay zeka arayışı içindedir. Qwen3.5 modelleri, Ollama aracılığıyla tam da bunu sunuyor. Alibaba tarafından piyasaya sürülen bu açık ağırlıklı çok modlu ajanlar, muhakeme, kodlama, görme ve araç kullanımı alanlarında yeni standartlar belirliyor. Onları Ollama'nın bulut etiketleri aracılığıyla anında çalıştırabilirsiniz; devasa indirmelere veya kurumsal GPU kümesine gerek yok.

💡
İlk isteminizi ateşlemeden önce Apidog'u ücretsiz indirin. Bu sezgisel API platformu, Ollama'nın REST uç noktalarını qwen3.5 modelleriyle saniyeler içinde tasarlamanıza, göndermenize ve hata ayıklamanıza olanak tanır. cURL veya ham JSON ile uğraşmadan sohbet tamamlama işlemlerini, akış yanıtlarını ve araç çağrılarını görselleştirebilirsiniz. Apidog, Ollama sunucusunu üretime hazır bir test ortamına dönüştürür ve başlamak için hiçbir maliyeti yoktur. apidog.com adresinden hemen edinin ve bu kılavuzu takip ederken açık tutun; bunun gibi küçük kurulum adımları büyük iş akışı kazançları yaratır.
button

Her ileri geçişte yalnızca 17B parametreyi etkinleştiren 397B-A17B hibrit MoE modeline anında erişim elde edersiniz. Mimari, Gated DeltaNet doğrusal dikkat mekanizmasını seyrek uzmanlar karışımı yönlendirmesiyle birleştirerek, önceki Qwen3-Max'e kıyasla 32K bağlamda 8.6 kat, 256K bağlamda ise 19 kat daha hızlı işleme kapasitesi sunar. Karşılaştırmalı testler üstünlüğü doğrular: MMLU-Pro 87.8, LiveCodeBench 83.6, MMMU 85.0 ve Tool Decathlon 38.3. Bu nedenle, ücretli yükseltmeleri düşünmeden önce Ollama'nın ücretsiz katmanında yerel görme-dil ajanları ve 201 dilde destek ile deney yapabilirsiniz.

Bu kılavuz, ihtiyacınız olan her teknik detayı kapsar. Ollama'yı kurar, doğru etiketleri çeker, CLI ve API aracılığıyla etkileşim kurar, titiz testler için Apidog'u entegre eder, gerçek uygulamalar oluşturur, performansı optimize eder ve yaygın sorunları giderirsiniz. Sonunda, bulut devleriyle rekabet eden, ancak ücretsiz kullanım limitleri dahilinde kalan qwen3.5 destekli iş akışları dağıtırsınız.

Qwen3.5'i Teknik Bir Güç Santrali Yapan Nedir

Qwen3.5, zenginleştirilmiş çok dilli, STEM ve muhakeme veri setleri üzerinde daha katı filtreleme altında ön eğitimle seriyi ileri taşıyor. Mühendisler, dar metrikler yerine zorluk ve genellenebilirliği önceliklendirerek milyonlarca ajan ortamında takviyeli öğrenmeyi ölçeklendirdi. Sonuç: 1 trilyon parametreyi aşan modellerle nesiller arası eşitlik sağlarken verimliliği korumak.

Qwen3.5 Ön Eğitim Grafiği

Amiral gemisi varyantı—Qwen3.5-397B-A17B—hibrit bir dikkat mekanizması kullanır. Gated Delta Ağları aracılığıyla doğrusal dikkat, uzun dizileri işlerken, seyrek MoE token'ları uzmanlaşmış uzmanlara yönlendirir. Kelime hazinesi 250 bin tokene genişleyerek diller arası kodlama verimliliğini %10-60 artırır. Yerel erken birleşimli çok modlu eğitim, metin ve görme token'larını baştan birleştirerek, yalnızca metin tabanlı işlem hatlarına kıyasla %100 eğitim verimliliği sağlar.

Ollama üzerinde kullanıma hazır iki etikete erişebilirsiniz:

Her ikisi de kutudan çıktığı haliyle düşünmeyi (düşünce zinciri), araçları (web araması, kod yorumlayıcı) ve ajans davranışlarını sunar. Bu nedenle, tek bir parametreyle hızlı yanıtlar ve derinlemesine muhakeme arasında geçiş yapabilirsiniz.

Qwen3.5 Karşılaştırmalı Testleri

Karşılaştırmalı testler çok şey ifade ediyor. Kodlamada, Qwen3.5 SWE-bench Verified'da 76.4 ve LiveCodeBench v6'da 83.6 puan alıyor. Matematikte AIME26'da 91.3 ve HMMT'de 94.8'e ulaşıyor. Görme görevleri OCRBench'te 93.1 ve MathVision'da 88.6'ya ulaşıyor. Ajan metrikleri BFCL-V4'te 72.9 ve TAU2-Bench'te 86.7 içeriyor. Çok dilli kapsama alanı, MMMLU'da (88.5) ve WMT24++'da (78.9) en yüksek puanlarla 201 dili kapsıyor. Bu performansa, ücretsiz katmanda basit bir ollama run komutuyla erişebilirsiniz.

Ollama Neden Qwen3.5'e Ücretsiz Erişim Sağlar

Ollama, model yönetimini tek bir ikili dosyaya soyutlar. Ağırlıklar diskinizde veya Ollama'nın bulut altyapısında olsun, aynı komutları çalıştırırsınız. Ücretsiz plan, bulut modellerinin hafif kullanımına izin verir—keşif, prototipleme ve orta düzey iş yükleri için mükemmeldir. Bu sayede, tam 397B modelinin 807 GB'lık ham boyutunu atlayarak saniyeler içinde istemler oluşturmaya başlayabilirsiniz.

Ollama'da Qwen 3.5

Yerel modeller indirildikten sonra sınırsız kalır, ancak qwen3.5 için resmi etiketler Ollama Bulut'a yönlendirilir. frob/qwen3.5 (GGUF quantları) gibi topluluk içe aktarımları, yeterli RAM'e (4-bit MXFP4 için 214 GB+) sahipseniz nicelenmiş sürümleri yerel olarak çalıştırmanıza olanak tanır. Donanımınıza ve kullanım alışkanlığınıza uygun yolu seçersiniz. Ollama yönlendirmeyi şeffaf bir şekilde yönetir.

Ek olarak, Ollama, 11434 numaralı bağlantı noktasında tam bir OpenAI uyumlu REST API'si sunar. qwen3.5'i istemci kodunu değiştirmeden herhangi bir dile veya çerçeveye entegre edebilirsiniz. Apidog, yanıtları taklit etmenize, şemaları doğrulamanıza ve test koleksiyonlarını otomatik olarak oluşturmanıza izin vererek bu entegrasyonu sağlamlaştırır.

Sistem Gereksinimleri ve Ön Koşullar

Bulut etiketleri neredeyse sıfır yerel gereksinim getirir. Yalnızca şunlara ihtiyacınız var:

Topluluk GGUF yerel çalıştırmaları için VRAM ihtiyaçlarını dikkatlice hesaplarsınız. 397B-A17B varyantının 4-bit MXFP4 nicemlemesi, yaklaşık 214 GB disk alanı kaplar ve üst düzey Mac'lerde 25+ token/sn hız için MoE boşaltmasıyla birlikte ~256 GB sistem RAM'ine ihtiyaç duyar. Önceki Qwen serisinden daha küçük yoğun varyantlar (taşınmışsa) doğrusal olarak ölçeklenir. Bu nedenle, yalnızca çevrimdışı çalışma veya daha yüksek işleme kapasitesi gerektirdiğinizde bulut etiketleriyle başlar ve yerel nicemlemelere geçersiniz.

Ayrıca Git ve bir kod düzenleyici yüklersiniz. Apidog Windows, macOS ve Linux'ta çalışır; en iyi performans için masaüstü uygulamasını indirin.

Ollama'yı Çeşitli Platformlara Kurma

Ollama'yı her büyük işletim sistemine tek bir komutla yüklersiniz.

macOS

brew install ollama

Sonra başlatın:

ollama serve

Windows
Yükleyiciyi ollama.com adresinden indirin ve çalıştırın. Ollama otomatik olarak başlar. PowerShell'i açın ve şunu yazın:

ollama serve

Linux

curl -fsSL https://ollama.com/install.sh | sh
ollama serve

Kurulumu şununla doğrulayın:

ollama --version

En son yapıyı gösteren bir çıktı beklersiniz. Hizmet başlatılamazsa, 11434 numaralı bağlantı noktasının kullanılabilirliğini ve güvenlik duvarı kurallarını kontrol edin. Artık tam bir LLM çalışma zamanını kontrol ediyorsunuz.

Qwen3.5 Modellerini Çekme ve Çalıştırma

Modeli tek bir komutla çekersiniz. Ollama, bulut etiketleri için yalnızca meta verileri indirir ve çıkarımı uzaktan yönlendirir.

ollama pull qwen3.5:cloud

Görsel yetenekler için:

ollama pull qwen3.5:397b-cloud

Etkileşimli bir oturum başlatırsınız:

ollama run qwen3.5:cloud

İstem görüntülenir. Şunu yazarsınız:

Qwen3.5'in hibrit MoE mimarisini teknik detaylarla açıklayın.

Qwen3.5, Gated DeltaNet, seyrek uzman yönlendirmesi ve çoklu token tahmini hakkında kesin açıklamalarla yanıt verir. /bye ile çıkış yaparsınız.

API kullanımı için arka planda çalıştırmak için:

ollama serve

Sonra başka bir terminalde modeli şununla sıcak tutarsınız:

ollama run qwen3.5:cloud --keep-alive 24h

Komut Satırı Etkileşimi ve Model Dosyaları

Davranışı Model Dosyaları ile özelleştirirsiniz. `Modelfile` adında bir dosya oluşturun:

FROM qwen3.5:cloud

SYSTEM """
Sen uzman bir sistem mimarısısın. Her zaman adım adım muhakeme, kod örnekleri ve performans hesaplamalarıyla yanıt ver.
"""

PARAMETER temperature 0.7
PARAMETER num_ctx 32768
PARAMETER top_p 0.95

Özel modeli oluşturursunuz:

ollama create qwen3.5-architect -f Modelfile
ollama run qwen3.5-architect

Artık teknik dokümantasyon ve mimari incelemeler için özel olarak tasarlanmış bir asistana sahipsiniz. Kodlama, görme analizi veya çok dilli çeviri ajanları için bu işlemi tekrarlarsınız.

Ollama REST API'sinden Yararlanma

Ollama güçlü uç noktalar sunar. Sohbet tamamlama işlemlerini şununla gönderirsiniz:

curl http://localhost:11434/api/chat -d '{
  "model": "qwen3.5:cloud",
  "messages": [
    { "role": "system", "content": "Sen yardımsever bir kodlama asistanısın." },
    { "role": "user", "content": "Duygu analizi için qwen3.5'i çağıran bir FastAPI uç noktası yaz." }
  ],
  "stream": false,
  "options": {
    "temperature": 0.2,
    "num_predict": 2048
  }
}'

`message.content`, `total_duration` ve token sayılarını içeren eksiksiz bir JSON yanıtı alırsınız. `"stream": true` olarak ayarlayarak akışı etkinleştirir ve Sunucu Tarafından Gönderilen Olayları gerçek zamanlı olarak işlersiniz.

Gömme işlemleri için:

curl http://localhost:11434/api/embeddings -d '{
  "model": "qwen3.5:cloud",
  "prompt": "Hibrit MoE modelleri üzerine teknik dokümantasyon"
}'

Bu nedenle, qwen3.5 etrafında RAG işlem hatları, anlamsal arama ve sınıflandırma katmanları oluşturursunuz.

Apidog ile Test ve Hata Ayıklama

Apidog'u açın ve “Ollama Qwen3.5” adında yeni bir proje oluşturun. Temel URL'yi `http://localhost:11434/api` olarak ayarlayın.

Apidog'da Ollama Qwen3.5 Projesi

`/chat` uç noktasını eklersiniz:

Mevcutsa resmi Ollama OpenAPI spesifikasyonunu içe aktarır veya koleksiyonları manuel olarak oluşturursunuz. Apidog, test senaryolarını otomatik olarak oluşturur, JSON şemalarını doğrular ve `qwen3.5:cloud` ile özel Modelfiles arasında geçiş yapmak için ortam değişkenlerini destekler.

“Vision Tasks” (Görsel Görevler) adında bir koleksiyon oluşturur ve çok modlu girişi test edersiniz:

{
  "model": "qwen3.5:397b-cloud",
  "messages": [
    {
      "role": "user",
      "content": [
        { "type": "text", "text": "Bu diyagramı ayrıntılı olarak açıklayın." },
        { "type": "image_url", "image_url": { "url": "data:image/png;base64,..." } }
      ]
    }
  ]
}

Apidog, görüntü önizlemesini gösterir, isteği gönderir ve token kullanımını, gecikmeyi ve muhakeme izlerini incelemenize olanak tanır. Yanıt süresinin < 5s olması ve teknik terimlerin varlığı için iddialar kaydedersiniz. Koleksiyonu Markdown dokümantasyonu olarak dışa aktarır veya ekibinizle paylaşırsınız.

Böylece tahmini ortadan kaldırırsınız. Her parametre, her yanıt alanı ve her hata görünür ve tekrarlanabilir hale gelir. Apidog'daki küçük iyileştirmeler —modeli ısıtmak için istek öncesi betikler eklemek gibi— üretim düzeyinde güvenilirliğe dönüşür.

Qwen3.5 ve Ollama ile Gerçek Uygulamalar Oluşturma

Resmi istemciyi kullanarak qwen3.5'i Python uygulamalarına entegre edersiniz:

import ollama
from fastapi import FastAPI

app = FastAPI()

@app.post("/analyze")
async def analyze_code(request: dict):
    response = ollama.chat(
        model='qwen3.5:cloud',
        messages=[{'role': 'user', 'content': request['code']}],
        options={'temperature': 0.1}
    )
    return {"analiz": response['message']['content']}

Bu uç noktayı açığa çıkarır, hız sınırlaması ekler ve Apidog aracılığıyla token tüketimini izlersiniz.

Node.js için ollama npm paketini kullanır ve yanıtları React ön yüzlerine akışla gönderirsiniz. İstekte fonksiyonlar tanımlayarak ve model çıktısından `tool_calls`'ı ayrıştırarak araç çağırmayı uygulayabilirsiniz. Qwen3.5, uyarlanabilir araç kullanımını doğal olarak destekler, bu sayede web aramasını, kod yürütmeyi ve dosya analizini otonom ajanlara zincirleyebilirsiniz.

Tüm yığını Docker Compose ile kapsayıcılaştırırsınız:

services:
  ollama:
    image: ollama/ollama
    ports:
      - "11434:11434"
  apidog-tests:
    image: your-test-image
    depends_on:
      - ollama

Böylece geliştirme, hazırlık ve üretim ortamları arasında tutarlı ortamlar dağıtırsınız.

Gelişmiş Özellikler: Araç Kullanımı, Görsel ve Uzun Bağlam

Uyumlu istemcilerde `enable_thinking: true` dahil ederek veya açıkça istemde bulunarak düşünme modunu etkinleştirirsiniz. Model, nihai yanıtlardan önce `` etiketlerini çıkararak muhakeme zincirine ilişkin görünürlük sağlar.

Görsel için base64 görüntüleri veya URL'ler gönderirsiniz. 397b-cloud etiketi, tabloları, kod ekran görüntülerini ve belgeleri 85.0 MMMU doğruluğuyla işler. Bu nedenle, tabloları, diyagramları ve el yazısı notları çıkaran belge anlama işlem hatları oluşturursunuz.

Ollama'da uzun bağlam işleme 256K token'a ulaşır. Tüm kod tabanlarını veya araştırma makalelerini besleyebilir ve özetler, fark analizi veya mimari yeniden düzenleme isteyebilirsiniz. Yanıtlardaki `context` alanı ile bağlam kullanımını izler ve sınırlara yaklaştığınızda kayan pencere stratejileri uygularsınız.

Performans Optimizasyonu ve Sorun Giderme

Modelleri `--keep-alive` ile sıcak tutarsınız. Basit görevler için daha düşük `num_predict` ve karmaşık muhakeme için daha yüksek ayarlayarak gecikmeyi azaltırsınız.

Yaygın sorunlar ve çözümleri:

Engelleri hızla belirlemek için her API çağrısını Apidog aracılığıyla kayda alırsınız. Bu sayede, ücretsiz planda bile yüksek çalışma süresini sürdürürsünüz.

Sonuç

Artık qwen3.5 modellerini Ollama ile ücretsiz kullanmak için eksiksiz bir teknik yol haritasına sahipsiniz. Çalışma zamanını kurdunuz, bulut etiketlerini çektiniz, CLI ve API etkileşimlerinde ustalaştınız, Apidog ile testleri hızlandırdınız, üretim uygulamaları oluşturdunuz ve gerçek iş yükleri için optimize ettiniz. Her adım, aktif komutları, kesin parametreleri ve ölçülebilir sonuçları kullanır.

Küçük eylemler—Apidog'u indirmek, bir Modelfile oluşturmak veya tek bir iddia eklemek—dönüştürücü bir verimliliğe dönüşür. Bugün kredi kartları veya altyapı biletleri olmadan son teknoloji çok modlu ajanlarla deney yapabilirsiniz. Ücretsiz Ollama katmanı her engeli kaldırır.

button

API Tasarım-Öncelikli Yaklaşımı Apidog'da Uygulayın

API'leri oluşturmanın ve kullanmanın daha kolay yolunu keşfedin