ÖZET
Qwen3.5, Alibaba'nın uzmanlar karışımı (MoE) mimarisine sahip, çığır açan 397 milyar parametreli bir görüntü-dil modelidir. NVIDIA Geliştirici Programı'na kaydolarak, NVIDIA'nın GPU hızlandırmalı uç noktaları aracılığıyla **ücretsiz** olarak erişebilirsiniz. Bu rehber, API anahtarınızı nasıl alacağınızı, ilk çağrılarınızı nasıl yapacağınızı ve Qwen3.5'in çok modlu yeteneklerini uygulamalarınıza nasıl entegre edeceğinizi adım adım anlatmaktadır.
Giriş
Alibaba'nın Qwen3.5'i, çok modlu yapay zeka alanında önemli bir ilerlemeyi temsil etmektedir. Bu 397 milyar parametreli model, Uzmanlar Karışımı (MoE) mimarisini Gated Delta Ağları ile birleştirerek, aktif parametreleri yalnızca 17 milyarda tutarken güçlü akıl yürütme yetenekleri sunar. Sonuç olarak, görüntülerden anlayan, kullanıcı arayüzlerinde gezinebilen ve karmaşık çok modlu görevleri yerine getirebilen, tamamı ücretsiz bir API aracılığıyla erişilebilir bir model ortaya çıkmıştır.
En iyi yanı ne mi? NVIDIA'nın geliştirici platformu aracılığıyla **Qwen3.5'i hemen şimdi ücretsiz kullanmaya başlayabilirsiniz**. İster yapay zeka ajanları oluşturuyor, ister görsel akıl yürütme uygulamaları geliştiriyor veya çok modlu yapay zekayı keşfediyor olun, bu rehber size her adımda yardımcı olacaktır.
Qwen3.5 VLM Nedir?
Qwen3.5, Alibaba'nın Qwen3.5 serisindeki, özerk ajanlar oluşturmak için özel olarak tasarlanmış ilk yerel görüntü-dil modelidir. Metin tabanlı modellerden uyarlanan önceki VLM'lerin aksine, Qwen3.5 çok modlu akıl yürütme ve kullanıcı arayüzü navigasyonu için sıfırdan inşa edilmiştir.

Temel Özellikler
| Özellik | Değer |
|---|---|
| Toplam Parametre Sayısı | 397 milyar |
| Aktif Parametre Sayısı | 17 milyar |
| Aktivasyon Oranı | %4.28 |
| Uzman Sayısı | 512 uzman |
| Token Başına Uzman Sayısı | 11 (10 yönlendirilmiş + 1 paylaşımlı) |
| Giriş Bağlamı | 256K (1M'ye genişletilebilir) |
| Desteklenen Diller | 200'den fazla |
| Mimari | MoE + Gated Delta Ağları |

Qwen3.5'i Özel Kılan Nedir?
Uzmanlar Karışımı (MoE) mimarisi, modelin parametrelerinin yalnızca bir alt kümesinin belirli bir girdi için aktif olduğu anlamına gelir. Bu, modelin tüm 397B parametreler boyunca karmaşık akıl yürütme kapasitesini korurken hesaplama açısından verimli olmasını sağlar.
Yerel Çok Modlu Ajan Yetenekleri Qwen3.5'i diğer VLM'lerden ayırır:
- Kullanıcı arayüzlerini anlar ve bunlarda gezinir
- Mobil ve web arayüzlerinde görsel akıl yürütme gerçekleştirir
- Karmaşık kodlama görevlerini yerine getirir
- Çok modlu anlama ile sohbet uygulamalarını güçlendirir
İdeal Kullanım Alanları
- Kodlama ve Web Geliştirme: Görsel bağlamla kod yazma ve hata ayıklama
- Görsel Akıl Yürütme: Ekran görüntülerini, fotoğrafları ve kullanıcı arayüzü öğelerini analiz etme
- Sohbet Uygulamaları: Çok modlu anlama yeteneğine sahip sohbet yapay zekası oluşturma
- Karmaşık Arama: Görüntü ve metinler arasında eş zamanlı arama yapma
- Kullanıcı Arayüzü Otomasyonu: Arayüzlerde özerk olarak gezinme ve etkileşim kurma
NVIDIA Geliştirici Programı: Ücretsiz API Anahtarınızı Alın
NVIDIA, GPU hızlandırmalı uç noktaları aracılığıyla Qwen3.5'e ücretsiz erişim sağlamaktadır. Başlamak için yapmanız gerekenler:
Adım 1: NVIDIA Geliştirici Programına Katılın
- build.nvidia.com adresini ziyaret edin
- Giriş Yapın veya Hesap Oluşturun seçeneğine tıklayın
- NVIDIA Geliştirici Programı'na kaydolun (ücretsiz)
- E-posta adresinizi doğrulayın

Adım 2: API Anahtarınızı Alın
- Giriş yaptıktan sonra hesap ayarlarınıza gidin
- API Anahtarları veya NVIDIA API Anahtarını bulun
- API anahtarınızı kopyalayın (
nvapi-ile başlar) - Güvenli bir şekilde saklayın (kimlik doğrulama için ihtiyacınız olacak)

Önemli
Adım 3: Erişiminizi Test Edin
Qwen3.5'i doğrudan tarayıcınızda build.nvidia.com/qwen/qwen3.5-397b-a17b adresinden test edebilirsiniz. Bu, herhangi bir kod yazmadan önce istemlerle denemeler yapmanıza ve modeli kendi verilerinizle değerlendirmenize olanak tanır.

İlk Qwen3.5 API Çağrınız
Şimdi Qwen3.5'e ilk API çağrımızı yapalım. API, OpenAI'nin formatıyla uyumlu olduğundan mevcut uygulamalarınıza entegre etmesi kolaydır.
Temel API Çağrısı
import requests
# Configuration
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions"
api_key = "YOUR_NVIDIA_API_KEY" # Replace with your API key
headers = {
"Authorization": f"Bearer {api_key}",
"Accept": "application/json",
}
# Payload - simple text-only request
payload = {
"messages": [
{
"role": "user",
"content": "What are the key features of Qwen3.5 VLM?"
}
],
"model": "qwen/qwen3.5-397b-a17b",
"max_tokens": 1024,
"temperature": 0.7,
}
# Make the request
session = requests.Session()
response = session.post(invoke_url, headers=headers, json=payload)
response.raise_for_status()
# Print the response
result = response.json()
print(result['choices'][0]['message']['content'])
Çok Modlu İstekler Yapma (Görüntülerle Birlikte)
Qwen3.5'in görüntü yeteneklerini kullanmak için isteğinize görüntü verilerini ekleyin:
import requests
import base64
# Function to encode image to base64
def encode_image(image_path):
with open(image_path, "rb") as image_file:
return base664.b64encode(image_file.read()).decode('utf-8')
# Encode your image
image_base64 = encode_image("screenshot.png")
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions"
api_key = "YOUR_NVIDIA_API_KEY"
headers = {
"Authorization": f"Bearer {api_key}",
"Accept": "application/json",
}
# Multimodal request with image
payload = {
"messages": [
{
"role": "user",
"content": [
{
"type": "image_url",
"image_url": {"url": f"data:image/png;base64,{image_base64}"}
},
{
"type": "text",
"text": "What do you see in this image? Describe the UI elements."
}
]
}
],
"model": "qwen/qwen3.5-397b-a17b",
"max_tokens": 1024,
}
response = requests.post(invoke_url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])
Python ve JavaScript'te Kod Örnekleri
Python: Tam Entegrasyon Örneği
import os
import requests
from requests.exceptions import RequestException
class QwenClient:
"""Python client for Qwen3.5 API"""
def __init__(self, api_key=None):
self.api_key = api_key or os.getenv("NVIDIA_API_KEY")
self.endpoint = "https://integrate.api.nvidia.com/v1/chat/completions"
self.model = "qwen/qwen3.5-397b-a17b"
def chat(self, message, system_prompt=None, **kwargs):
"""Send a chat message to Qwen3.5"""
headers = {
"Authorization": f"Bearer {self.api_key}",
"Content-Type": "application/json"
}
messages = []
if system_prompt:
messages.append({"role": "system", "content": system_prompt})
messages.append({"role": "user", "content": message})
payload = {
"messages": messages,
"model": self.model,
"max_tokens": kwargs.get("max_tokens", 2048),
"temperature": kwargs.get("temperature", 0.7),
"top_p": kwargs.get("top_p", 0.9),
}
# Enable thinking mode if requested
if kwargs.get("thinking", False):
payload["chat_template_kwargs"] = {"thinking": True}
try:
response = requests.post(
self.endpoint,
headers=headers,
json=payload,
timeout=kwargs.get("timeout", 60)
)
response.raise_for_status()
return response.json()
except RequestException as e:
return {"error": str(e)}
def chat_with_image(self, message, image_path, **kwargs):
"""Send a chat message with image to Qwen3.5"""
import base64
with open(image_path, "rb") as f:
image_base64 = base64.b64encode(f.read()).decode("utf-8")
headers = {
"Authorization": f"Bearer {self.api_key}",
"Content-Type": "application/json"
}
payload = {
"messages": [{
"role": "user",
"content": [
{"type": "image_url", "image_url": {"url": f"data:image/png;base64,{image_base64}"}},
{"type": "text", "text": message}
]
}],
"model": self.model,
"max_tokens": kwargs.get("max_tokens", 2048),
"temperature": kwargs.get("temperature", 0.7),
}
response = requests.post(self.endpoint, headers=headers, json=payload)
response.raise_for_status()
return response.json()
# Usage example
client = QwenClient(api_key="YOUR_NVIDIA_API_KEY")
# Text-only chat
result = client.chat("Explain Mixture of Experts architecture in simple terms")
print(result['choices'][0]['message']['content'])
# Multimodal chat
result = client.chat_with_image(
"What UI elements are in this screenshot?",
"screenshot.png"
)
print(result['choices'][0]['message']['content'])
JavaScript/Node.js: Tam Entegrasyon Örneği
const axios = require('axios');
class QwenClient {
constructor(apiKey) {
this.apiKey = apiKey;
this.endpoint = 'https://integrate.api.nvidia.com/v1/chat/completions';
this.model = 'qwen/qwen3.5-397b-a17b';
}
async chat(message, options = {}) {
const { systemPrompt, temperature = 0.7, maxTokens = 2048, thinking = false } = options;
const messages = [];
if (systemPrompt) {
messages.push({ role: 'system', content: systemPrompt });
}
messages.push({ role: 'user', content: message });
const payload = {
messages,
model: this.model,
temperature,
max_tokens: maxTokens,
...(thinking && { chat_template_kwargs: { thinking: true } })
};
try {
const response = await axios.post(this.endpoint, payload, {
headers: {
'Authorization': `Bearer ${this.apiKey}`,
'Content-Type': 'application/json'
},
timeout: 60000
});
return response.data;
} catch (error) {
console.error('API Error:', error.response?.data || error.message);
throw error;
}
}
async chatWithImage(message, imageBase64, options = {}) {
const { temperature = 0.7, maxTokens = 2048 } = options;
const payload = {
messages: [{
role: 'user',
content: [
{ type: 'image_url', image_url: { url: `data:image/png;base64,${imageBase64}` } },
{ type: 'text', text: message }
]
}],
model: this.model,
temperature,
max_tokens: maxTokens
};
const response = await axios.post(this.endpoint, payload, {
headers: {
'Authorization': `Bearer ${this.apiKey}`,
'Content-Type': 'application/json'
}
});
return response.data;
}
}
// Usage
const client = new QwenClient(process.env.NVIDIA_API_KEY);
// Text chat
const result = await client.chat('What is the advantage of MoE architecture?');
console.log(result.choices[0].message.content);
// With thinking enabled
const deepResult = await client.chat('Explain how reasoning works in LLMs', {
thinking: true
});
console.log(deepResult.choices[0].message.content);
Gelişmiş Özellikler: Düşünme Modu ve Araç Çağırma
Düşünme Modu
Qwen3.5, modelin akıl yürütme sürecini göstermesini sağlayan gelişmiş bir "düşünme" modunu destekler. Bu, özellikle karmaşık problem çözme görevleri için kullanışlıdır.
payload = {
"messages": [{"role": "user", "content": "Solve this step by step: If a train travels 120km in 2 hours, what is its speed?"}],
"model": "qwen/qwen3.5-397b-a17b",
"chat_template_kwargs": {"thinking": True},
"max_tokens": 4096,
}
response = session.post(invoke_url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])
Araç Çağırma
Qwen3.5, OpenAI uyumlu araçlar aracılığıyla fonksiyon çağırmayı destekler. Bu, gerçek eylemleri gerçekleştirebilen ajan tabanlı uygulamalar oluşturmanıza olanak tanır.
import json
# Define tools for the model to use
tools = [
{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get current weather for a location",
"parameters": {
"type": "object",
"properties": {
"location": {"type": "string", "description": "City name"}
},
"required": ["location"]
}
}
}
]
payload = {
"messages": [
{"role": "user", "content": "What's the weather like in Tokyo?"}
],
"model": "qwen/qwen3.5-397b-a17b",
"tools": tools,
"tool_choice": "auto"
}
response = session.post(invoke_url, headers=headers, json=payload)
result = response.json()
# Check if model wants to call a tool
if 'tool_calls' in result['choices'][0]['message']:
tool_call = result['choices'][0]['message']['tool_calls'][0]
print(f"Model wants to call: {tool_call['function']['name']}")
print(f"Arguments: {tool_call['function']['arguments']}")
Oran Sınırlarını ve Fiyatlandırmayı Anlama
Mevcut Ücretsiz Katman (NVIDIA Geliştirici Programı)
| Özellik | Sınır |
|---|---|
| API Erişimi | Kayıtla birlikte ücretsiz |
| GPU Hızlandırmalı Uç Noktalar | Dahil |
| Tarayıcı Testi | Sınırsız |
| Oran Sınırları | Geliştirici panosunu kontrol edin |
Bu Sizin İçin Ne Anlama Geliyor?
- Kredi kartı gerekmez: Sadece ücretsiz NVIDIA Geliştirici Programına kaydolun
- GPU hızlandırmalı: İstekler NVIDIA Blackwell GPU'larında çalışır
- Üretim için hazır: Üretim iş yükleri için kullanılan aynı uç noktalar
Üretime Ölçeklendirme
- NVIDIA NIM: Kapsayıcılaştırılmış modelleri her yerde dağıtın (bulut, şirket içi, hibrit)
- NeMo: Modeli belirli alanınız için özelleştirin
- Kurumsal destek: Özel altyapı için NVIDIA ile iletişime geçin
NVIDIA NIM ile Üretim Ortamına Dağıtım
NVIDIA NIM (NVIDIA Çıkarım Mikrohizmetleri), Qwen3.5'i geliştirmeden üretime taşımayı kolaylaştırır.

NIM Nedir?
NIM, yapay zeka çıkarımı için önceden oluşturulmuş, optimize edilmiş kapsayıcılar sağlar. Her NIM mikrohizmeti şunları içerir:
- Performans optimizasyonları ile model
- Standartlaştırılmış API'ler (OpenAI uyumlu)
- Dağıtım esnekliği (bulut, şirket içi, uç)
Qwen3.5'i NIM ile Dağıtma
# Pull the Qwen3.5 NIM container
docker pull nvcr.io/nim/qwen/qwen3.5-397b-a17b:latest
# Run the container
docker run --gpus all --rm -p 8000:8000 \
-e NVIDIA_API_KEY=$NVIDIA_API_KEY \
nvcr.io/nim/qwen/qwen3.5-397b-a17b:latest
Şimdi modeliniz yerel olarak http://localhost:8000/v1/chat/completions adresinde çalışıyor.
NIM'in Faydaları
- Her yerde dağıtım: Şirket içinde, bulutta veya hibrit olarak çalıştırın
- Optimize edilmiş performans: NVIDIA GPU çıkarımı için ayarlanmıştır
- Tutarlı API'ler: OpenAI uyumlu arayüz
- Ölçeklenebilir: Geliştirmeden üretime sorunsuz bir şekilde ölçeklenir
NVIDIA NeMo ile Özelleştirme
Alana özel uygulamalar için Qwen3.5'i NVIDIA NeMo kullanarak ince ayar yapabilirsiniz.
NeMo Çerçevesi Yetenekleri
- Yüksek verimli ince ayar: PyTorch yerel eğitimi
- LoRA desteği: Bellek açısından verimli özelleştirme
- Çok düğümlü eğitim: Slurm ve Kubernetes desteği
- Hugging Face entegrasyonu: Mevcut kontrol noktaları üzerinde doğrudan eğitim
Örnek: Tıbbi VQA için İnce Ayar
NVIDIA, tıbbi Görsel Soru Yanıtlama için radyolojik veri kümeleri üzerinde Qwen3.5'e ince ayar yapmaya yönelik teknik bir eğitim sunmaktadır. Bu, modelin sağlık hizmetleri gibi özel alanlar için nasıl uyarlanacağını göstermektedir.
Sonuç
Qwen3.5, NVIDIA'nın geliştirici platformu aracılığıyla en son teknolojiye sahip çok modlu bir yapay zeka modelini ücretsiz olarak kullanmak için heyecan verici bir fırsat sunuyor. 397B parametreli MoE mimarisi, yerel görüntü yetenekleri ve ücretsiz API erişimiyle şunlar için mükemmel bir seçimdir:
- Çok modlu yapay zeka ajanları oluşturma
- Görsel akıl yürütme uygulamaları geliştirme
- Görsel bağlamlı kodlama asistanları oluşturma
- Kullanıcı arayüzü navigasyon görevlerini otomatikleştirme
Başlamak çok kolay: NVIDIA Geliştirici Programı'na kaydolun, API anahtarınızı alın ve geliştirmeye başlayın.
Qwen3.5 veya diğer yapay zeka API'leri ile entegre uygulamalar geliştiriyorsanız, Apidog ihtiyacınız olan test altyapısını sağlar. Apidog'un kapsamlı platformu ile API entegrasyonlarınızı test edin, yanıtları doğrulayın, ortam değişkenlerini yönetin ve test iş akışlarınızı otomatikleştirin.
Sıkça Sorulan Sorular
Qwen3.5 gerçekten ücretsiz mi?
Evet, NVIDIA, Geliştirici Programı aracılığıyla Qwen3.5 GPU hızlandırmalı uç noktalarına ücretsiz erişim sağlar. Kredi kartı gerekmez. API anahtarınızı almak için build.nvidia.com adresinden kaydolmanız yeterlidir.
Qwen3.5'i diğer VLM'lerden ayıran nedir?
Qwen3.5, yalnızca metin tabanlı bir modelden uyarlanmak yerine, özerk ajanlar için özel olarak inşa edilmiştir. Uzmanlar Karışımı mimarisi (toplam 397B, aktif 17B) hesaplama açısından verimli kalırken güçlü akıl yürütme sağlar. Kullanıcı arayüzü navigasyonu ve görsel akıl yürütme görevlerinde özellikle başarılıdır.
Qwen3.5'i ticari projeler için kullanabilir miyim?
NVIDIA'nın platformundaki güncel lisans koşullarını kontrol edin. Üretim kullanımı için dağıtım için NVIDIA NIM'i düşünebilir veya kurumsal seçenekler hakkında NVIDIA ile iletişime geçebilirsiniz.
Ücretsiz katman ile NIM arasındaki fark nedir?
Ücretsiz katman (Geliştirici Programı) NVIDIA tarafından barındırılan uç noktaları kullanır. NIM, modeli kapsayıcılar kullanarak kendiniz dağıtmanıza olanak tanır; ister şirket içinde, ister bulutunuzda veya hibrit ortamlarda olsun. NIM, üretim ölçeğinde dağıtımlar için tasarlanmıştır.
Oran sınırlamasını nasıl yönetirim?
Ücretsiz katmanın belirli oran sınırlamaları vardır. Daha yüksek sınırlar için NVIDIA NIM aracılığıyla üretim erişimine yükseltmeyi veya kurumsal seçenekler hakkında NVIDIA ile iletişime geçmeyi düşünebilirsiniz.
Qwen3.5'e ince ayar yapabilir miyim?
Evet! NVIDIA NeMo çerçevesi, Qwen3.5'e alanınıza özel verileriniz üzerinde ince ayar yapmak için araçlar sunar. Bu, bellek açısından verimli özelleştirme için LoRA'yı ve büyük ölçekli eğitim için çok düğümlü desteği içerir.
