كيفية استخدام Qwen3.5 API مجانًا مع NVIDIA

الخلاصة

يعد Qwen3.5 نموذج اللغة البصرية الرائد من علي بابا، والذي يضم 397 مليار معلمة مع بنية مزيج الخبراء (MoE). يمكنك الوصول إليه مجانًا من خلال نقاط نهاية NVIDIA المسرّعة بوحدات معالجة الرسوميات (GPU) عن طريق التسجيل في برنامج مطوري NVIDIA. يرشدك هذا الدليل خلال الحصول على مفتاح API الخاص بك، وإجراء مكالماتك الأولى، ودمج إمكانيات Qwen3.5 متعددة الوسائط في تطبيقاتك.

مقدمة

يمثل Qwen3.5 من علي بابا قفزة كبيرة في الذكاء الاصطناعي متعدد الوسائط. يجمع هذا النموذج الذي يضم 397 مليار معلمة بين بنية مزيج الخبراء (MoE) وشبكات دلتا المُبوبة (Gated Delta Networks)، مما يوفر قدرات استدلال قوية مع الحفاظ على المعلمات النشطة عند 17 مليار فقط. والنتيجة هي نموذج يمكنه فهم الصور، والتنقل في واجهات المستخدم، والتعامل مع المهام المعقدة متعددة الوسائط، وكل ذلك متاح عبر واجهة برمجة تطبيقات (API) مجانية.

أفضل جزء؟ يمكنك البدء في استخدام Qwen3.5 مجانًا الآن من خلال منصة مطوري NVIDIA. سواء كنت تبني وكلاء ذكاء اصطناعي، أو تطور تطبيقات استدلال بصري، أو تستكشف الذكاء الاصطناعي متعدد الوسائط، سيرشدك هذا الدليل خلال كل خطوة.

💡

إذا كنت تبني تطبيقات تتكامل مع Qwen3.5 أو أي واجهة برمجة تطبيقات (API) أخرى للذكاء الاصطناعي، فستحتاج إلى أدوات اختبار قوية. توفر Apidog منصة شاملة لاختبار واجهة برمجة التطبيقات تجعل من السهل التحقق من تكاملات واجهة برمجة تطبيقات الذكاء الاصطناعي الخاصة بك، وإدارة متغيرات البيئة، وأتمتة سير عمل الاختبار.

زر

ما هو Qwen3.5 VLM؟

يعد Qwen3.5 أول نموذج لغوي بصري أصلي من علي بابا ضمن سلسلة Qwen3.5، وقد تم تصميمه خصيصًا لبناء وكلاء مستقلين. على عكس نماذج اللغة البصرية السابقة التي تم تكييفها من نماذج تعتمد على النص فقط، تم بناء Qwen3.5 من الألف إلى الياء للاستدلال متعدد الوسائط والتنقل في واجهة المستخدم.

المواصفات الرئيسية

المواصفات	القيمة
إجمالي المعلمات	397 مليار
المعلمات النشطة	17 مليار
معدل التنشيط	4.28%
عدد الخبراء	512 خبيرًا
الخبراء لكل رمز (توكن)	11 (10 موجهة + 1 مشتركة)
سياق الإدخال	256 ألف (قابل للتوسيع إلى 1 مليون)
اللغات المدعومة	أكثر من 200
البنية	MoE + شبكات دلتا المُبوبة

ما الذي يميز Qwen3.5

تعني بنية مزيج الخبراء (MoE) أن مجموعة فرعية فقط من معلمات النموذج تكون نشطة لأي إدخال معين. وهذا يجعل النموذج فعالاً من الناحية الحسابية مع الحفاظ على القدرة على الاستدلال المعقد عبر جميع المعلمات البالغ عددها 397 مليار.

تميز قدرات الوكيل متعدد الوسائط الأصيلة Qwen3.5 عن نماذج اللغة البصرية الأخرى:

يفهم واجهات المستخدم ويتنقل فيها
يؤدي الاستدلال البصري على واجهات الويب والجوال
يتعامل مع مهام البرمجة المعقدة
يدعم تطبيقات الدردشة بفهم متعدد الوسائط

حالات الاستخدام المثالية

البرمجة وتطوير الويب: اكتب وقم بتصحيح الأخطاء البرمجية مع السياق البصري
الاستدلال البصري: تحليل لقطات الشاشة والصور وعناصر واجهة المستخدم
تطبيقات الدردشة: بناء ذكاء اصطناعي حواري بفهم متعدد الوسائط
البحث المعقد: البحث عبر الصور والنصوص في وقت واحد
أتمتة واجهة المستخدم: التنقل والتفاعل مع الواجهات بشكل مستقل

برنامج مطوري NVIDIA: احصل على مفتاح API المجاني الخاص بك

توفر NVIDIA وصولاً مجانيًا إلى Qwen3.5 من خلال نقاط نهايتها المسرّعة بوحدات معالجة الرسوميات (GPU). إليك كيفية البدء:

الخطوة 1: الانضمام إلى برنامج مطوري NVIDIA

تفضل بزيارة build.nvidia.com
انقر على تسجيل الدخول أو إنشاء حساب
سجل في برنامج مطوري NVIDIA (مجاني)
تحقق من عنوان بريدك الإلكتروني

الخطوة 2: احصل على مفتاح API الخاص بك

بعد تسجيل الدخول، انتقل إلى إعدادات حسابك
ابحث عن مفاتيح API أو مفتاح API الخاص بـ NVIDIA
انسخ مفتاح API الخاص بك (يبدأ بـ nvapi-)
خزنه بأمان (ستحتاجه للمصادقة)

هام

الخطوة 3: اختبار الوصول الخاص بك

يمكنك اختبار Qwen3.5 مباشرة في متصفحك على build.nvidia.com/qwen/qwen3.5-397b-a17b. يتيح لك هذا تجربة المطالبات وتقييم النموذج ببياناتك الخاصة قبل كتابة أي كود.

أول استدعاء لـ API الخاص بـ Qwen3.5

الآن، لنقم بأول استدعاء لـ API الخاص بـ Qwen3.5. تتوافق واجهة برمجة التطبيقات مع تنسيق OpenAI، مما يجعل من السهل دمجها في التطبيقات الحالية.

استدعاء API أساسي

import requests

# التكوين
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions"
api_key = "YOUR_NVIDIA_API_KEY"  # استبدل بمفتاح API الخاص بك

headers = {
    "Authorization": f"Bearer {api_key}",
    "Accept": "application/json",
}

# الحمولة - طلب نصي بسيط فقط
payload = {
    "messages": [
        {
            "role": "user",
            "content": "What are the key features of Qwen3.5 VLM?"
        }
    ],
    "model": "qwen/qwen3.5-397b-a17b",
    "max_tokens": 1024,
    "temperature": 0.7,
}

# قم بإجراء الطلب
session = requests.Session()
response = session.post(invoke_url, headers=headers, json=payload)
response.raise_for_status()

# اطبع الاستجابة
result = response.json()
print(result['choices'][0]['message']['content'])

إجراء طلبات متعددة الوسائط (مع الصور)

لاستخدام إمكانيات الرؤية في Qwen3.5، قم بتضمين بيانات الصورة في طلبك:

import requests
import base64

# دالة لترميز الصورة إلى base64
def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        return base64.b64encode(image_file.read()).decode('utf-8')

# قم بترميز صورتك
image_base64 = encode_image("screenshot.png")

invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions"
api_key = "YOUR_NVIDIA_API_KEY"

headers = {
    "Authorization": f"Bearer {api_key}",
    "Accept": "application/json",
}

# طلب متعدد الوسائط مع الصورة
payload = {
    "messages": [
        {
            "role": "user",
            "content": [
                {
                    "type": "image_url",
                    "image_url": {"url": f"data:image/png;base64,{image_base64}"}
                },
                {
                    "type": "text",
                    "text": "What do you see in this image? Describe the UI elements."
                }
            ]
        }
    ],
    "model": "qwen/qwen3.5-397b-a17b",
    "max_tokens": 1024,
}

response = requests.post(invoke_url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])

أمثلة تعليمات برمجية في بايثون وجافاسكريبت

بايثون: مثال تكامل كامل

import os
import requests
from requests.exceptions import RequestException

class QwenClient:
    """عميل بايثون لواجهة برمجة تطبيقات Qwen3.5"""

    def __init__(self, api_key=None):
        self.api_key = api_key or os.getenv("NVIDIA_API_KEY")
        self.endpoint = "https://integrate.api.nvidia.com/v1/chat/completions"
        self.model = "qwen/qwen3.5-397b-a17b"

    def chat(self, message, system_prompt=None, **kwargs):
        """إرسال رسالة دردشة إلى Qwen3.5"""
        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }

        messages = []
        if system_prompt:
            messages.append({"role": "system", "content": system_prompt})
        messages.append({"role": "user", "content": message})

        payload = {
            "messages": messages,
            "model": self.model,
            "max_tokens": kwargs.get("max_tokens", 2048),
            "temperature": kwargs.get("temperature", 0.7),
            "top_p": kwargs.get("top_p", 0.9),
        }

        # Enable thinking mode if requested
        if kwargs.get("thinking", False):
            payload["chat_template_kwargs"] = {"thinking": True}

        try:
            response = requests.post(
                self.endpoint,
                headers=headers,
                json=payload,
                timeout=kwargs.get("timeout", 60)
            )
            response.raise_for_status()
            return response.json()
        except RequestException as e:
            return {"error": str(e)}

    def chat_with_image(self, message, image_path, **kwargs):
        """إرسال رسالة دردشة مع صورة إلى Qwen3.5"""
        import base64

        with open(image_path, "rb") as f:
            image_base64 = base64.b64encode(f.read()).decode("utf-8")

        headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }

        payload = {
            "messages": [{
                "role": "user",
                "content": [
                    {"type": "image_url", "image_url": {"url": f"data:image/png;base64,{image_base64}"}},
                    {"type": "text", "text": message}
                ]
            }],
            "model": self.model,
            "max_tokens": kwargs.get("max_tokens", 2048),
            "temperature": kwargs.get("temperature", 0.7),
        }

        response = requests.post(self.endpoint, headers=headers, json=payload)
        response.raise_for_status()
        return response.json()


# مثال على الاستخدام
client = QwenClient(api_key="YOUR_NVIDIA_API_KEY")

# دردشة نصية فقط
result = client.chat("Explain Mixture of Experts architecture in simple terms")
print(result['choices'][0]['message']['content'])

# دردشة متعددة الوسائط
result = client.chat_with_image(
    "What UI elements are in this screenshot?",
    "screenshot.png"
)
print(result['choices'][0]['message']['content'])

جافاسكريبت/Node.js: مثال تكامل كامل

const axios = require('axios');

class QwenClient {
  constructor(apiKey) {
    this.apiKey = apiKey;
    this.endpoint = 'https://integrate.api.nvidia.com/v1/chat/completions';
    this.model = 'qwen/qwen3.5-397b-a17b';
  }

  async chat(message, options = {}) {
    const { systemPrompt, temperature = 0.7, maxTokens = 2048, thinking = false } = options;

    const messages = [];
    if (systemPrompt) {
      messages.push({ role: 'system', content: systemPrompt });
    }
    messages.push({ role: 'user', content: message });

    const payload = {
      messages,
      model: this.model,
      temperature,
      max_tokens: maxTokens,
      ...(thinking && { chat_template_kwargs: { thinking: true } })
    };

    try {
      const response = await axios.post(this.endpoint, payload, {
        headers: {
          'Authorization': `Bearer ${this.apiKey}`,
          'Content-Type': 'application/json'
        },
        timeout: 60000
      });

      return response.data;
    } catch (error) {
      console.error('API Error:', error.response?.data || error.message);
      throw error;
    }
  }

  async chatWithImage(message, imageBase64, options = {}) {
    const { temperature = 0.7, maxTokens = 2048 } = options;

    const payload = {
      messages: [{
        role: 'user',
        content: [
          { type: 'image_url', image_url: { url: `data:image/png;base64,${imageBase64}` } },
          { type: 'text', text: message }
        ]
      }],
      model: this.model,
      temperature,
      max_tokens: maxTokens
    };

    const response = await axios.post(this.endpoint, payload, {
      headers: {
        'Authorization': `Bearer ${this.apiKey}`,
        'Content-Type': 'application/json'
      }
    });

    return response.data;
  }
}

// الاستخدام
const client = new QwenClient(process.env.NVIDIA_API_KEY);

// دردشة نصية
const result = await client.chat('What is the advantage of MoE architecture?');
console.log(result.choices[0].message.content);

// مع تمكين وضع التفكير
const deepResult = await client.chat('Explain how reasoning works in LLMs', {
  thinking: true
});
console.log(deepResult.choices[0].message.content);

ميزات متقدمة: وضع التفكير واستدعاء الأدوات

وضع التفكير

يدعم Qwen3.5 وضع "تفكير" متقدمًا يمكّن النموذج من إظهار عملية استدلاله. وهذا مفيد بشكل خاص لمهام حل المشكلات المعقدة.

payload = {
    "messages": [{"role": "user", "content": "Solve this step by step: If a train travels 120km in 2 hours, what is its speed?"}],
    "model": "qwen/qwen3.5-397b-a17b",
    "chat_template_kwargs": {"thinking": True},
    "max_tokens": 4096,
}

response = session.post(invoke_url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])

استدعاء الأدوات

يدعم Qwen3.5 استدعاء الدوال من خلال الأدوات المتوافقة مع OpenAI. وهذا يمكّنك من بناء تطبيقات وكيلية يمكنها تنفيذ إجراءات حقيقية.

import json

# تحديد الأدوات ليستخدمها النموذج
tools = [
    {
        "type": "function",
        "function": {
            "name": "get_weather",
            "description": "Get current weather for a location",
            "parameters": {
                "type": "object",
                "properties": {
                    "location": {"type": "string", "description": "City name"}
                },
                "required": ["location"]
            }
        }
    }
]

payload = {
    "messages": [
        {"role": "user", "content": "What's the weather like in Tokyo?"}
    ],
    "model": "qwen/qwen3.5-397b-a17b",
    "tools": tools,
    "tool_choice": "auto"
}

response = session.post(invoke_url, headers=headers, json=payload)
result = response.json()

# تحقق مما إذا كان النموذج يريد استدعاء أداة
if 'tool_calls' in result['choices'][0]['message']:
    tool_call = result['choices'][0]['message']['tool_calls'][0]
    print(f"يرغب النموذج في استدعاء: {tool_call['function']['name']}")
    print(f"الوسائط: {tool_call['function']['arguments']}")

فهم حدود المعدل والتسعير

الطبقة المجانية الحالية (برنامج مطوري NVIDIA)

الميزة	الحد
الوصول إلى API	مجاني بالتسجيل
نقاط النهاية المسرّعة بوحدة معالجة الرسوميات	مضمنة
اختبار المتصفح	غير محدود
حدود المعدل	تحقق من لوحة تحكم المطور

ماذا يعني هذا بالنسبة لك

لا توجد بطاقة ائتمان مطلوبة: فقط سجل في برنامج مطوري NVIDIA المجاني
مسرّع بوحدة معالجة الرسوميات: تعمل الطلبات على وحدات معالجة الرسوميات NVIDIA Blackwell
جاهز للإنتاج: نفس نقاط النهاية المستخدمة لأعباء عمل الإنتاج

التوسع إلى الإنتاج

عندما تكون مستعدًا للتجاوز الطبقة المجانية:

NVIDIA NIM: نشر النماذج المعبأة في حاويات في أي مكان (سحابي، محلي، هجين)
NeMo: تخصيص النموذج لمجالك المحدد
دعم المؤسسات: اتصل بـ NVIDIA للحصول على بنية تحتية مخصصة

النشر الإنتاجي باستخدام NVIDIA NIM

يجعل NVIDIA NIM (خدمات NVIDIA المصغرة للاستدلال) من السهل نقل Qwen3.5 من التطوير إلى الإنتاج.

ما هو NIM؟

يوفر NIM حاويات مُعدة مسبقًا ومحسّنة للاستدلال بالذكاء الاصطناعي. تتضمن كل خدمة NIM مصغرة:

النموذج مع تحسينات الأداء
واجهات برمجة تطبيقات موحدة (متوافقة مع OpenAI)
مرونة النشر (سحابي، محلي، طرفي)

نشر Qwen3.5 باستخدام NIM

# سحب حاوية Qwen3.5 NIM
docker pull nvcr.io/nim/qwen/qwen3.5-397b-a17b:latest

# تشغيل الحاوية
docker run --gpus all --rm -p 8000:8000 \
  -e NVIDIA_API_KEY=$NVIDIA_API_KEY \
  nvcr.io/nim/qwen/qwen3.5-397b-a17b:latest

الآن يعمل نموذجك محليًا على http://localhost:8000/v1/chat/completions.

فوائد NIM

نشر في أي مكان: تشغيل محليًا، في السحابة، أو هجين
أداء محسن: مُضبط للاستدلال على وحدات معالجة الرسوميات من NVIDIA
واجهات API متسقة: واجهة متوافقة مع OpenAI
قابل للتطوير: التوسع من التطوير إلى الإنتاج بسلاسة

التخصيص باستخدام NVIDIA NeMo

للتطبيقات الخاصة بنطاق معين، يمكنك ضبط Qwen3.5 بدقة باستخدام NVIDIA NeMo.

قدرات إطار عمل NeMo

ضبط دقيق عالي الإنتاجية: تدريب أصيل باستخدام PyTorch
دعم LoRA: تخصيص فعال للذاكرة
تدريب متعدد العقد: دعم Slurm و Kubernetes
تكامل Hugging Face: تدريب مباشر على نقاط التحقق الموجودة

مثال: الضبط الدقيق لـ VQA الطبي

توفر NVIDIA برنامجًا تعليميًا تقنيًا للضبط الدقيق لـ Qwen3.5 على مجموعات بيانات إشعاعية لأسئلة وأجوبة بصرية طبية. يوضح هذا كيفية تكييف النموذج لمجالات متخصصة مثل الرعاية الصحية.

الخلاصة

يمثل Qwen3.5 فرصة مثيرة لاستخدام نموذج ذكاء اصطناعي متعدد الوسائط متطور بدون تكلفة من خلال منصة مطوري NVIDIA. بفضل بنية MoE التي تضم 397 مليار معلمة، وقدرات الرؤية الأصلية، والوصول المجاني إلى واجهة برمجة التطبيقات، يعد خيارًا ممتازًا لما يلي:

بناء وكلاء ذكاء اصطناعي متعدد الوسائط
تطوير تطبيقات استدلال بصري
إنشاء مساعدين برمجيين بسياق بصري
أتمتة مهام التنقل في واجهة المستخدم

البدء بسيط: سجل في برنامج مطوري NVIDIA، واحصل على مفتاح API الخاص بك، وابدأ البناء.

إذا كنت تبني تطبيقات تتكامل مع Qwen3.5 أو واجهات برمجة تطبيقات الذكاء الاصطناعي الأخرى، فإن Apidog يوفر البنية التحتية للاختبار التي تحتاجها. اختبر تكاملات واجهة برمجة التطبيقات الخاصة بك، وتحقق من الاستجابات، وقم بإدارة متغيرات البيئة، وأتمتة سير عمل الاختبار الخاص بك باستخدام منصة Apidog الشاملة.

زر

الأسئلة الشائعة

هل استخدام Qwen3.5 مجاني حقًا؟

نعم، توفر NVIDIA وصولاً مجانيًا إلى نقاط نهاية Qwen3.5 المسرّعة بوحدة معالجة الرسوميات (GPU) من خلال برنامجها للمطورين. لا تتطلب بطاقة ائتمان. ما عليك سوى التسجيل على build.nvidia.com للحصول على مفتاح API الخاص بك.

ما الذي يجعل Qwen3.5 مختلفًا عن نماذج اللغة البصرية الأخرى؟

تم بناء Qwen3.5 خصيصًا للوكلاء المستقلين، ولم يتم تكييفه من نموذج نصي فقط. توفر بنية مزيج الخبراء (MoE) الخاصة به (397 مليار إجمالي، 17 مليار نشط) قدرات استدلال قوية مع الحفاظ على الكفاءة الحسابية. إنه جيد بشكل خاص في مهام التنقل في واجهة المستخدم والاستدلال البصري.

هل يمكنني استخدام Qwen3.5 للمشاريع التجارية؟

تحقق من شروط الترخيص الحالية على منصة NVIDIA. للاستخدام في الإنتاج، ضع في اعتبارك NVIDIA NIM للنشر أو اتصل بـ NVIDIA بخصوص خيارات المؤسسات.

ما الفرق بين الطبقة المجانية و NIM؟

تستخدم الطبقة المجانية (برنامج المطورين) نقاط نهاية مستضافة من NVIDIA. يتيح لك NIM نشر النموذج بنفسك باستخدام الحاويات، سواء في الموقع، أو في سحابتك، أو في بيئات هجينة. تم تصميم NIM لعمليات النشر على نطاق الإنتاج.

كيف أتعامل مع حدود المعدل؟

توجد حدود معينة للمعدل في الطبقة المجانية. للحصول على حدود أعلى، فكر في الترقية إلى وصول الإنتاج من خلال NVIDIA NIM أو اتصل بـ NVIDIA بخصوص خيارات المؤسسات.

هل يمكنني ضبط Qwen3.5 بدقة؟

نعم! يوفر إطار عمل NVIDIA NeMo أدوات لضبط Qwen3.5 بدقة على بياناتك الخاصة بالمجال. يتضمن ذلك LoRA للتخصيص الفعال للذاكرة ودعم العقد المتعددة للتدريب على نطاق واسع.