NVIDIA ile Ücretsiz Qwen3.5 API Kullanımı

ÖZET

Qwen3.5, Alibaba'nın uzmanlar karışımı (MoE) mimarisine sahip, çığır açan 397 milyar parametreli bir görüntü-dil modelidir. NVIDIA Geliştirici Programı'na kaydolarak, NVIDIA'nın GPU hızlandırmalı uç noktaları aracılığıyla **ücretsiz** olarak erişebilirsiniz. Bu rehber, API anahtarınızı nasıl alacağınızı, ilk çağrılarınızı nasıl yapacağınızı ve Qwen3.5'in çok modlu yeteneklerini uygulamalarınıza nasıl entegre edeceğinizi adım adım anlatmaktadır.

Giriş

Alibaba'nın Qwen3.5'i, çok modlu yapay zeka alanında önemli bir ilerlemeyi temsil etmektedir. Bu 397 milyar parametreli model, Uzmanlar Karışımı (MoE) mimarisini Gated Delta Ağları ile birleştirerek, aktif parametreleri yalnızca 17 milyarda tutarken güçlü akıl yürütme yetenekleri sunar. Sonuç olarak, görüntülerden anlayan, kullanıcı arayüzlerinde gezinebilen ve karmaşık çok modlu görevleri yerine getirebilen, tamamı ücretsiz bir API aracılığıyla erişilebilir bir model ortaya çıkmıştır.

En iyi yanı ne mi? NVIDIA'nın geliştirici platformu aracılığıyla **Qwen3.5'i hemen şimdi ücretsiz kullanmaya başlayabilirsiniz**. İster yapay zeka ajanları oluşturuyor, ister görsel akıl yürütme uygulamaları geliştiriyor veya çok modlu yapay zekayı keşfediyor olun, bu rehber size her adımda yardımcı olacaktır.

💡

Qwen3.5 veya başka bir yapay zeka API'si ile entegre uygulamalar geliştiriyorsanız, güçlü test araçlarına ihtiyacınız olacaktır. Apidog, yapay zeka API entegrasyonlarınızı doğrulamayı, ortam değişkenlerini yönetmeyi ve test iş akışlarını otomatikleştirmeyi kolaylaştıran kapsamlı bir API test platformu sunar.

düğme

Qwen3.5 VLM Nedir?

Qwen3.5, Alibaba'nın Qwen3.5 serisindeki, özerk ajanlar oluşturmak için özel olarak tasarlanmış ilk yerel görüntü-dil modelidir. Metin tabanlı modellerden uyarlanan önceki VLM'lerin aksine, Qwen3.5 çok modlu akıl yürütme ve kullanıcı arayüzü navigasyonu için sıfırdan inşa edilmiştir.

Temel Özellikler

Özellik	Değer
Toplam Parametre Sayısı	397 milyar
Aktif Parametre Sayısı	17 milyar
Aktivasyon Oranı	%4.28
Uzman Sayısı	512 uzman
Token Başına Uzman Sayısı	11 (10 yönlendirilmiş + 1 paylaşımlı)
Giriş Bağlamı	256K (1M'ye genişletilebilir)
Desteklenen Diller	200'den fazla
Mimari	MoE + Gated Delta Ağları

Qwen3.5'i Özel Kılan Nedir?

Uzmanlar Karışımı (MoE) mimarisi, modelin parametrelerinin yalnızca bir alt kümesinin belirli bir girdi için aktif olduğu anlamına gelir. Bu, modelin tüm 397B parametreler boyunca karmaşık akıl yürütme kapasitesini korurken hesaplama açısından verimli olmasını sağlar.

Yerel Çok Modlu Ajan Yetenekleri Qwen3.5'i diğer VLM'lerden ayırır:

Kullanıcı arayüzlerini anlar ve bunlarda gezinir
Mobil ve web arayüzlerinde görsel akıl yürütme gerçekleştirir
Karmaşık kodlama görevlerini yerine getirir
Çok modlu anlama ile sohbet uygulamalarını güçlendirir

İdeal Kullanım Alanları

Kodlama ve Web Geliştirme: Görsel bağlamla kod yazma ve hata ayıklama
Görsel Akıl Yürütme: Ekran görüntülerini, fotoğrafları ve kullanıcı arayüzü öğelerini analiz etme
Sohbet Uygulamaları: Çok modlu anlama yeteneğine sahip sohbet yapay zekası oluşturma
Karmaşık Arama: Görüntü ve metinler arasında eş zamanlı arama yapma
Kullanıcı Arayüzü Otomasyonu: Arayüzlerde özerk olarak gezinme ve etkileşim kurma

NVIDIA Geliştirici Programı: Ücretsiz API Anahtarınızı Alın

NVIDIA, GPU hızlandırmalı uç noktaları aracılığıyla Qwen3.5'e ücretsiz erişim sağlamaktadır. Başlamak için yapmanız gerekenler:

Adım 1: NVIDIA Geliştirici Programına Katılın

build.nvidia.com adresini ziyaret edin
Giriş Yapın veya Hesap Oluşturun seçeneğine tıklayın
NVIDIA Geliştirici Programı'na kaydolun (ücretsiz)
E-posta adresinizi doğrulayın

Adım 2: API Anahtarınızı Alın

Giriş yaptıktan sonra hesap ayarlarınıza gidin
API Anahtarları veya NVIDIA API Anahtarını bulun
API anahtarınızı kopyalayın (nvapi- ile başlar)
Güvenli bir şekilde saklayın (kimlik doğrulama için ihtiyacınız olacak)

Önemli

Adım 3: Erişiminizi Test Edin

Qwen3.5'i doğrudan tarayıcınızda build.nvidia.com/qwen/qwen3.5-397b-a17b adresinden test edebilirsiniz. Bu, herhangi bir kod yazmadan önce istemlerle denemeler yapmanıza ve modeli kendi verilerinizle değerlendirmenize olanak tanır.

İlk Qwen3.5 API Çağrınız

Şimdi Qwen3.5'e ilk API çağrımızı yapalım. API, OpenAI'nin formatıyla uyumlu olduğundan mevcut uygulamalarınıza entegre etmesi kolaydır.

Temel API Çağrısı

import requests

# Configuration
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions"
api_key = "YOUR_NVIDIA_API_KEY"  # Replace with your API key

headers = {
    "Authorization": f"Bearer {api_key}",
    "Accept": "application/json",
}

# Payload - simple text-only request
payload = {
    "messages": [
        {
            "role": "user",
            "content": "What are the key features of Qwen3.5 VLM?"
        }
    ],
    "model": "qwen/qwen3.5-397b-a17b",
    "max_tokens": 1024,
    "temperature": 0.7,
}

# Make the request
session = requests.Session()
response = session.post(invoke_url, headers=headers, json=payload)
response.raise_for_status()

# Print the response
result = response.json()
print(result['choices'][0]['message']['content'])

Çok Modlu İstekler Yapma (Görüntülerle Birlikte)

Qwen3.5'in görüntü yeteneklerini kullanmak için isteğinize görüntü verilerini ekleyin:

import requests
import base64

# Function to encode image to base64
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base664.b64encode(image_file.read()).decode('utf-8')

# Encode your image
image_base64 = encode_image("screenshot.png")

invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions"
api_key = "YOUR_NVIDIA_API_KEY"

headers = {
    "Authorization": f"Bearer {api_key}",
    "Accept": "application/json",
}

# Multimodal request with image
payload = {
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": f"data:image/png;base64,{image_base64}"}
                },
                {
                    "type": "text",
                    "text": "What do you see in this image? Describe the UI elements."
                }
            ]
        }
    ],
    "model": "qwen/qwen3.5-397b-a17b",
    "max_tokens": 1024,
}

response = requests.post(invoke_url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])

Python ve JavaScript'te Kod Örnekleri

Python: Tam Entegrasyon Örneği

import os
import requests
from requests.exceptions import RequestException

class QwenClient:
    """Python client for Qwen3.5 API"""

    def __init__(self, api_key=None):
        self.api_key = api_key or os.getenv("NVIDIA_API_KEY")
        self.endpoint = "https://integrate.api.nvidia.com/v1/chat/completions"
        self.model = "qwen/qwen3.5-397b-a17b"

    def chat(self, message, system_prompt=None, **kwargs):
        """Send a chat message to Qwen3.5"""
        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }

        messages = []
        if system_prompt:
            messages.append({"role": "system", "content": system_prompt})
        messages.append({"role": "user", "content": message})

        payload = {
            "messages": messages,
            "model": self.model,
            "max_tokens": kwargs.get("max_tokens", 2048),
            "temperature": kwargs.get("temperature", 0.7),
            "top_p": kwargs.get("top_p", 0.9),
        }

        # Enable thinking mode if requested
        if kwargs.get("thinking", False):
            payload["chat_template_kwargs"] = {"thinking": True}

        try:
            response = requests.post(
                self.endpoint,
                headers=headers,
                json=payload,
                timeout=kwargs.get("timeout", 60)
            )
            response.raise_for_status()
            return response.json()
        except RequestException as e:
            return {"error": str(e)}

    def chat_with_image(self, message, image_path, **kwargs):
        """Send a chat message with image to Qwen3.5"""
        import base64

        with open(image_path, "rb") as f:
            image_base64 = base64.b64encode(f.read()).decode("utf-8")

        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }

        payload = {
            "messages": [{
                "role": "user",
                "content": [
                    {"type": "image_url", "image_url": {"url": f"data:image/png;base64,{image_base64}"}},
                    {"type": "text", "text": message}
                ]
            }],
            "model": self.model,
            "max_tokens": kwargs.get("max_tokens", 2048),
            "temperature": kwargs.get("temperature", 0.7),
        }

        response = requests.post(self.endpoint, headers=headers, json=payload)
        response.raise_for_status()
        return response.json()


# Usage example
client = QwenClient(api_key="YOUR_NVIDIA_API_KEY")

# Text-only chat
result = client.chat("Explain Mixture of Experts architecture in simple terms")
print(result['choices'][0]['message']['content'])

# Multimodal chat
result = client.chat_with_image(
    "What UI elements are in this screenshot?",
    "screenshot.png"
)
print(result['choices'][0]['message']['content'])

JavaScript/Node.js: Tam Entegrasyon Örneği

const axios = require('axios');

class QwenClient {
  constructor(apiKey) {
    this.apiKey = apiKey;
    this.endpoint = 'https://integrate.api.nvidia.com/v1/chat/completions';
    this.model = 'qwen/qwen3.5-397b-a17b';
  }

  async chat(message, options = {}) {
    const { systemPrompt, temperature = 0.7, maxTokens = 2048, thinking = false } = options;

    const messages = [];
    if (systemPrompt) {
      messages.push({ role: 'system', content: systemPrompt });
    }
    messages.push({ role: 'user', content: message });

    const payload = {
      messages,
      model: this.model,
      temperature,
      max_tokens: maxTokens,
      ...(thinking && { chat_template_kwargs: { thinking: true } })
    };

    try {
      const response = await axios.post(this.endpoint, payload, {
        headers: {
          'Authorization': `Bearer ${this.apiKey}`,
          'Content-Type': 'application/json'
        },
        timeout: 60000
      });

      return response.data;
    } catch (error) {
      console.error('API Error:', error.response?.data || error.message);
      throw error;
    }
  }

  async chatWithImage(message, imageBase64, options = {}) {
    const { temperature = 0.7, maxTokens = 2048 } = options;

    const payload = {
      messages: [{
        role: 'user',
        content: [
          { type: 'image_url', image_url: { url: `data:image/png;base64,${imageBase64}` } },
          { type: 'text', text: message }
        ]
      }],
      model: this.model,
      temperature,
      max_tokens: maxTokens
    };

    const response = await axios.post(this.endpoint, payload, {
      headers: {
        'Authorization': `Bearer ${this.apiKey}`,
        'Content-Type': 'application/json'
      }
    });

    return response.data;
  }
}

// Usage
const client = new QwenClient(process.env.NVIDIA_API_KEY);

// Text chat
const result = await client.chat('What is the advantage of MoE architecture?');
console.log(result.choices[0].message.content);

// With thinking enabled
const deepResult = await client.chat('Explain how reasoning works in LLMs', {
  thinking: true
});
console.log(deepResult.choices[0].message.content);

Gelişmiş Özellikler: Düşünme Modu ve Araç Çağırma

Düşünme Modu

Qwen3.5, modelin akıl yürütme sürecini göstermesini sağlayan gelişmiş bir "düşünme" modunu destekler. Bu, özellikle karmaşık problem çözme görevleri için kullanışlıdır.

payload = {
    "messages": [{"role": "user", "content": "Solve this step by step: If a train travels 120km in 2 hours, what is its speed?"}],
    "model": "qwen/qwen3.5-397b-a17b",
    "chat_template_kwargs": {"thinking": True},
    "max_tokens": 4096,
}

response = session.post(invoke_url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])

Araç Çağırma

Qwen3.5, OpenAI uyumlu araçlar aracılığıyla fonksiyon çağırmayı destekler. Bu, gerçek eylemleri gerçekleştirebilen ajan tabanlı uygulamalar oluşturmanıza olanak tanır.

import json

# Define tools for the model to use
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "Get current weather for a location",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {"type": "string", "description": "City name"}
                },
                "required": ["location"]
            }
        }
    }
]

payload = {
    "messages": [
        {"role": "user", "content": "What's the weather like in Tokyo?"}
    ],
    "model": "qwen/qwen3.5-397b-a17b",
    "tools": tools,
    "tool_choice": "auto"
}

response = session.post(invoke_url, headers=headers, json=payload)
result = response.json()

# Check if model wants to call a tool
if 'tool_calls' in result['choices'][0]['message']:
    tool_call = result['choices'][0]['message']['tool_calls'][0]
    print(f"Model wants to call: {tool_call['function']['name']}")
    print(f"Arguments: {tool_call['function']['arguments']}")

Oran Sınırlarını ve Fiyatlandırmayı Anlama

Mevcut Ücretsiz Katman (NVIDIA Geliştirici Programı)

Özellik	Sınır
API Erişimi	Kayıtla birlikte ücretsiz
GPU Hızlandırmalı Uç Noktalar	Dahil
Tarayıcı Testi	Sınırsız
Oran Sınırları	Geliştirici panosunu kontrol edin

Bu Sizin İçin Ne Anlama Geliyor?

Kredi kartı gerekmez: Sadece ücretsiz NVIDIA Geliştirici Programına kaydolun
GPU hızlandırmalı: İstekler NVIDIA Blackwell GPU'larında çalışır
Üretim için hazır: Üretim iş yükleri için kullanılan aynı uç noktalar

Üretime Ölçeklendirme

NVIDIA NIM: Kapsayıcılaştırılmış modelleri her yerde dağıtın (bulut, şirket içi, hibrit)
NeMo: Modeli belirli alanınız için özelleştirin
Kurumsal destek: Özel altyapı için NVIDIA ile iletişime geçin

NVIDIA NIM ile Üretim Ortamına Dağıtım

NVIDIA NIM (NVIDIA Çıkarım Mikrohizmetleri), Qwen3.5'i geliştirmeden üretime taşımayı kolaylaştırır.

NIM Nedir?

NIM, yapay zeka çıkarımı için önceden oluşturulmuş, optimize edilmiş kapsayıcılar sağlar. Her NIM mikrohizmeti şunları içerir:

Performans optimizasyonları ile model
Standartlaştırılmış API'ler (OpenAI uyumlu)
Dağıtım esnekliği (bulut, şirket içi, uç)

Qwen3.5'i NIM ile Dağıtma

# Pull the Qwen3.5 NIM container
docker pull nvcr.io/nim/qwen/qwen3.5-397b-a17b:latest

# Run the container
docker run --gpus all --rm -p 8000:8000 \
  -e NVIDIA_API_KEY=$NVIDIA_API_KEY \
  nvcr.io/nim/qwen/qwen3.5-397b-a17b:latest

Şimdi modeliniz yerel olarak http://localhost:8000/v1/chat/completions adresinde çalışıyor.

NIM'in Faydaları

Her yerde dağıtım: Şirket içinde, bulutta veya hibrit olarak çalıştırın
Optimize edilmiş performans: NVIDIA GPU çıkarımı için ayarlanmıştır
Tutarlı API'ler: OpenAI uyumlu arayüz
Ölçeklenebilir: Geliştirmeden üretime sorunsuz bir şekilde ölçeklenir

NVIDIA NeMo ile Özelleştirme

Alana özel uygulamalar için Qwen3.5'i NVIDIA NeMo kullanarak ince ayar yapabilirsiniz.

NeMo Çerçevesi Yetenekleri

Yüksek verimli ince ayar: PyTorch yerel eğitimi
LoRA desteği: Bellek açısından verimli özelleştirme
Çok düğümlü eğitim: Slurm ve Kubernetes desteği
Hugging Face entegrasyonu: Mevcut kontrol noktaları üzerinde doğrudan eğitim

Örnek: Tıbbi VQA için İnce Ayar

NVIDIA, tıbbi Görsel Soru Yanıtlama için radyolojik veri kümeleri üzerinde Qwen3.5'e ince ayar yapmaya yönelik teknik bir eğitim sunmaktadır. Bu, modelin sağlık hizmetleri gibi özel alanlar için nasıl uyarlanacağını göstermektedir.

Sonuç

Qwen3.5, NVIDIA'nın geliştirici platformu aracılığıyla en son teknolojiye sahip çok modlu bir yapay zeka modelini ücretsiz olarak kullanmak için heyecan verici bir fırsat sunuyor. 397B parametreli MoE mimarisi, yerel görüntü yetenekleri ve ücretsiz API erişimiyle şunlar için mükemmel bir seçimdir:

Çok modlu yapay zeka ajanları oluşturma
Görsel akıl yürütme uygulamaları geliştirme
Görsel bağlamlı kodlama asistanları oluşturma
Kullanıcı arayüzü navigasyon görevlerini otomatikleştirme

Başlamak çok kolay: NVIDIA Geliştirici Programı'na kaydolun, API anahtarınızı alın ve geliştirmeye başlayın.

Qwen3.5 veya diğer yapay zeka API'leri ile entegre uygulamalar geliştiriyorsanız, Apidog ihtiyacınız olan test altyapısını sağlar. Apidog'un kapsamlı platformu ile API entegrasyonlarınızı test edin, yanıtları doğrulayın, ortam değişkenlerini yönetin ve test iş akışlarınızı otomatikleştirin.

düğme

Sıkça Sorulan Sorular

Qwen3.5 gerçekten ücretsiz mi?

Evet, NVIDIA, Geliştirici Programı aracılığıyla Qwen3.5 GPU hızlandırmalı uç noktalarına ücretsiz erişim sağlar. Kredi kartı gerekmez. API anahtarınızı almak için build.nvidia.com adresinden kaydolmanız yeterlidir.

Qwen3.5'i diğer VLM'lerden ayıran nedir?

Qwen3.5, yalnızca metin tabanlı bir modelden uyarlanmak yerine, özerk ajanlar için özel olarak inşa edilmiştir. Uzmanlar Karışımı mimarisi (toplam 397B, aktif 17B) hesaplama açısından verimli kalırken güçlü akıl yürütme sağlar. Kullanıcı arayüzü navigasyonu ve görsel akıl yürütme görevlerinde özellikle başarılıdır.

Qwen3.5'i ticari projeler için kullanabilir miyim?

NVIDIA'nın platformundaki güncel lisans koşullarını kontrol edin. Üretim kullanımı için dağıtım için NVIDIA NIM'i düşünebilir veya kurumsal seçenekler hakkında NVIDIA ile iletişime geçebilirsiniz.

Ücretsiz katman ile NIM arasındaki fark nedir?

Ücretsiz katman (Geliştirici Programı) NVIDIA tarafından barındırılan uç noktaları kullanır. NIM, modeli kapsayıcılar kullanarak kendiniz dağıtmanıza olanak tanır; ister şirket içinde, ister bulutunuzda veya hibrit ortamlarda olsun. NIM, üretim ölçeğinde dağıtımlar için tasarlanmıştır.

Oran sınırlamasını nasıl yönetirim?

Ücretsiz katmanın belirli oran sınırlamaları vardır. Daha yüksek sınırlar için NVIDIA NIM aracılığıyla üretim erişimine yükseltmeyi veya kurumsal seçenekler hakkında NVIDIA ile iletişime geçmeyi düşünebilirsiniz.

Qwen3.5'e ince ayar yapabilir miyim?

Evet! NVIDIA NeMo çerçevesi, Qwen3.5'e alanınıza özel verileriniz üzerinde ince ayar yapmak için araçlar sunar. Bu, bellek açısından verimli özelleştirme için LoRA'yı ve büyük ölçekli eğitim için çok düğümlü desteği içerir.