كيفية استخدام NVIDIA API مجانًا: Nemotron Nano 12B v2 VL

Ashley Innocent

Ashley Innocent

26 نوفمبر 2025

كيفية استخدام NVIDIA API مجانًا: Nemotron Nano 12B v2 VL

Apidog للمؤسسات

نشر محلي

SSO & RBAC

متوافق مع SOC 2

استكشاف Apidog Enterprise

يسعى المطورون إلى أدوات فعالة تتعامل مع النصوص والصور دون تكاليف باهظة. يبرز نموذج NVIDIA Nemotron Nano 12B v2 VL كنموذج لغوي-رؤية مدمج ولكنه قوي، ويجعل الوصول إليه عبر الطبقة المجانية من واجهة برمجة تطبيقات NVIDIA (API) من خلال منصات مثل OpenRouter التجربة مباشرة.

💡
قبل المتابعة، فكر في تجهيز نفسك بـ Apidog—أداة قوية لتطوير واجهات برمجة التطبيقات (API) تبسط الاختبار والتوثيق للنقاط النهائية مثل هذه. قم بتنزيل Apidog مجانًا لاستيراد مجموعات OpenRouter وتصحيح أخطاء طلباتك المجانية لواجهة برمجة تطبيقات NVIDIA بسهولة، مما يضمن تكاملاً أكثر سلاسة في سير عملك.
تنزيل

يقدم هذا المنشور إرشادات لك خلال عملية الاستفادة من واجهة برمجة تطبيقات NVIDIA Nemotron Nano 12B v2 VL مجانًا. ستتعرف على بنية النموذج، ومتطلبات الإعداد، وخطوات التنفيذ العملية، وأنماط الاستخدام المتقدمة. وبنهاية هذا المنشور، ستمتلك المعرفة اللازمة لنشر هذا النموذج في تطبيقاتك، بدءًا من التسميات التوضيحية للصور وصولًا إلى الإجابة على الأسئلة المرئية.

فهم NVIDIA Nemotron Nano 12B v2 VL: البنية الأساسية والقدرات

صمم مهندسو NVIDIA نموذج Nemotron Nano 12B v2 VL لتلبية الطلب المتزايد على معالجة الرؤية واللغة بكفاءة. يجمع هذا النموذج الذي يحتوي على 12 مليار معلمة بين فهم اللغة القائم على المحولات والمشفرات البصرية، مما يمكنه من معالجة سلاسل متداخلة من النصوص والصور. على عكس النماذج الأكبر التي تتطلب موارد GPU كبيرة، يُحسّن Nemotron Nano 12B v2 VL للنشر على الحافة والاستدلال بزمن انتقال منخفض، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي.

في جوهره، يستخدم النموذج محول رؤية (ViT) لاستخلاص الميزات من الصور المدخلة، متبوعًا بمسقط متعدد الوسائط يقوم بمواءمة هذه الميزات مع مساحة تضمين النص. يعتمد المكون اللغوي على بنية Nemotron من NVIDIA، والتي تتضمن تضمينات موضعية دوارة لمعالجة السياق الممتد. يدعم هذا الإعداد طول سياق يصل إلى 4096 رمزًا، وهو كافٍ لمعظم المهام العملية التي تتضمن أوصافًا قصيرة أو استفسارات مقترنة بالمرئيات.

تشمل القدرات الرئيسية ما يلي:

تكشف المعايير عن أداء قوي: على مجموعة بيانات VQAv2، يحقق Nemotron Nano 12B v2 VL دقة تقارب 75%، منافسًا نماذج أكبر بينما يستهلك قدرًا أقل بكثير من الحوسبة. بالنسبة للمطورين، يترجم هذا إلى دورات نماذج أولية أسرع، خاصة عند استخدام الوصول المجاني لواجهة برمجة تطبيقات NVIDIA.

علاوة على ذلك، تقلل خيارات تكميم النموذج—مثل أوزان 4 بت أو 8 بت—من استهلاك الذاكرة دون فقدان كبير في الدقة. توفر NVIDIA هذه الخيارات من خلال كتالوج NGC الخاص بها، ولكن للاستخدام القائم على واجهة برمجة التطبيقات (API)، تتعامل منصات مثل OpenRouter مع الجزء الأكبر، حيث تُعرض النموذج عبر نقاط نهاية HTTP موحدة.

الوصول إلى الطبقة المجانية لواجهة برمجة تطبيقات NVIDIA: تكامل OpenRouter

لاستخدام واجهة برمجة تطبيقات NVIDIA Nemotron Nano 12B v2 VL مجانًا، تقوم بتوجيه الطلبات عبر OpenRouter، وهي بوابة موحدة لنماذج الذكاء الاصطناعي. يقدم OpenRouter طبقة مجانية سخية لهذا الإصدار المحدد من النموذج، مما يسمح بما يصل إلى 10 طلبات في الدقيقة و 1000 رمز في الدقيقة دون رسوم. هذا القيد يناسب الاختبار والتطوير على نطاق صغير، ويمكنك الترقية إلى خطط مدفوعة لزيادة الإنتاجية إذا لزم الأمر.

أولاً، أنشئ حسابًا على OpenRouter. انتقل إلى لوحة التحكم الخاصة بهم واشترك باستخدام بريدك الإلكتروني أو بيانات اعتماد GitHub. بمجرد تسجيل الدخول، قم بإنشاء مفتاح API من قسم "المفاتيح". يقوم هذا المفتاح بمصادقة جميع الاستدعاءات اللاحقة، متبعًا نظامًا بسيطًا لرمز التحقق (Bearer token).

يوحد OpenRouter واجهة برمجة التطبيقات (API) لمحاكاة تنسيق OpenAI، مما يبسط عملية الترحيل للمطورين المعتادين على نقاط نهاية GPT. عنوان URL الأساسي للطلبات هو https://openrouter.ai/api/v1، وتحدد النموذج على أنه nvidia/nemotron-nano-12b-v2-vl:free. يضمن هذا الوسم وصولك إلى نقطة نهاية الطبقة المجانية، متجنبًا أي رسوم غير مقصودة.

بالنسبة لمدخلات الرؤية، تقوم بترميز الصور كسلاسل base64 ضمن حمولة JSON. تدعم واجهة برمجة التطبيقات تنسيقات JPEG و PNG، وبحد أقصى لدقة 1024x1024 بكسل لكل صورة — تؤدي الدقة الأعلى إلى تغيير حجم تلقائي لمنع تجاوز السعة. تظل مدخلات النص سلاسل UTF-8 قياسية، ويخرج النموذج استجابات بتنسيق JSON تحتوي على نص مُنشأ.

عند الانتقال من الإعداد إلى التنفيذ، ستقوم الآن بإعداد بيئة التطوير الخاصة بك. قم بتثبيت Python 3.8 أو أحدث، جنبًا إلى جنب مع مكتبة requests لمعالجة HTTP. للاختبار الأكثر تقدمًا، يتكامل Apidog بسلاسة، مما يتيح لك تصور دورات الطلب/الاستجابة وتصدير المجموعات لتعاون الفريق.

الإعداد خطوة بخطوة: المتطلبات المسبقة وتكوين البيئة

تبدأ بالتحقق من جاهزية نظامك. تأكد من وجود Python على جهازك؛ تحقق من ذلك عبر python --version في الطرفية. إذا كان غير موجود، قم بتنزيله من موقع Python الرسمي.

python -m venv nemotron_env
source nemotron_env/bin/activate  # On Windows: nemotron_env\Scripts\activate

قم بتثبيت الحزمة الضرورية:

pip install requests

قم بتخزين مفتاح OpenRouter API الخاص بك بأمان. استخدم متغيرات البيئة لهذا الغرض — أنشئ ملفًا باسم .env في دليل مشروعك مع OPENROUTER_API_KEY=your_key_here. قم بتحميله باستخدام مكتبة python-dotenv:

pip install python-dotenv

في التعليمات البرمجية الخاصة بك، قم باستيرادها واستخدامها كالتالي:

import os
from dotenv import load_dotenv
load_dotenv()
api_key = os.getenv('OPENROUTER_API_KEY')

يمنع هذا التكوين الترميز الثابت للبيانات الحساسة، وهي ممارسة موصى بها لبيئات الإنتاج. مع هذه الأسس الموضوعة، يمكنك المضي قدمًا في صياغة أول استدعاء لواجهة برمجة التطبيقات (API).

علاوة على ذلك، إذا كنت تفضل الاختبار القائم على واجهة المستخدم الرسومية (GUI)، فإن Apidog يتألق هنا. قم باستيراد مخطط OpenRouter مباشرة إلى Apidog، وقم بتكوين مفتاح NVIDIA API المجاني الخاص بك، وقم بتشغيل المحاكاة دون كتابة تعليمات برمجية. يسرع هذا النهج عملية تصحيح الأخطاء، خاصة بالنسبة للحمولات متعددة الوسائط حيث يهم هيكل JSON.

تنفيذ استدعاءات API الأساسية: أمثلة للنص فقط والصورة فقط

تبدأ بطلبات بسيطة لبناء الثقة. نقطة النهاية الأساسية هي /chat/completions، وهي طريقة POST تقبل جسم JSON يحتوي على model و messages، ومعلمات اختيارية مثل temperature (0-2 للتحكم في الإبداع) و max_tokens (حتى 2048).

لنأخذ مثالاً على استعلام نصي فقط للتعرف على النموذج:

import requests
import json
import base64

url = "https://openrouter.ai/api/v1/chat/completions"
headers = {
    "Authorization": f"Bearer {api_key}",
    "Content-Type": "application/json"
}

payload = {
    "model": "nvidia/nemotron-nano-12b-v2-vl:free",
    "messages": [
        {"role": "user", "content": "اشرح أساسيات نماذج الرؤية واللغة في 100 كلمة."}
    ],
    "max_tokens": 150,
    "temperature": 0.7
}

response = requests.post(url, headers=headers, json=payload)
result = response.json()
print(result['choices'][0]['message']['content'])

يرسل هذا السكريبت مطالبة ويسترجع شرحًا موجزًا. تعود الاستجابة في أقل من ثانيتين في المتوسط، بفضل توجيه OpenRouter المحسن.

الآن، قم بالتوسع إلى معالجة الصور فقط. قم بترميز ملف صورة إلى base64:

with open("sample_image.jpg", "rb") as image_file:
    base64_image = base64.b64encode(image_file.read()).decode('utf-8')

content = [
    {
        "type": "text",
        "text": "صف هذه الصورة بالتفصيل."
    },
    {
        "type": "image_url",
        "image_url": {
            "url": f"data:image/jpeg;base64,{base64_image}"
        }
    }
]

payload["messages"] = [{"role": "user", "content": content}]
# Repeat the POST request as above

يحلل النموذج الصورة، وينتج أوصافًا مثل "سيارة رياضية حمراء متوقفة في شارع بالمدينة عند الغسق، مع مشاة غير واضحين في الخلفية." توضح هذه المخرجات دمج VL بفعالية.

ومع ذلك، بالنسبة للسيناريوهات المعقدة، يمكنك دمج الوسائط، كما سيتم استكشافه لاحقًا.

الاستخدام المتقدم: استعلامات متعددة الوسائط مع NVIDIA Nemotron Nano 12B v2 VL

يفتح الجمع بين النصوص والصور الإمكانات الكاملة للنموذج. تقوم بإنشاء رسائل تحتوي على مصفوفات محتوى متداخلة، حيث يحدد كل عنصر النوع ("text" أو "image_url") والقيمة.

مثال على الإجابة على الأسئلة المرئية:

content = [
    {"type": "image_url", "image_url": {"url": f"data:image/png;base64,{base64_chart_image}"}},
    {"type": "text", "text": "ما هو اتجاه المبيعات من الربع الأول إلى الربع الرابع في هذا الرسم البياني؟"}
]

payload["messages"] = [{"role": "user", "content": content}]
response = requests.post(url, headers=headers, json=payload)

تُرجع واجهة برمجة التطبيقات استجابات منطقية، مثل "تزداد المبيعات بشكل مطرد من 100 ألف دولار في الربع الأول إلى 400 ألف دولار في الربع الرابع، مما يشير إلى نمو بنسبة 300٪." تثبت هذه القدرة أنها لا تقدر بثمن لأدوات تصور البيانات أو أنظمة التقارير الآلية.

لتعزيز الموثوقية، يمكنك دمج مطالبات النظام للعب الأدوار:

payload["messages"] = [
    {"role": "system", "content": "أنت محلل صور دقيق."},
    {"role": "user", "content": content}
]

توجه رسائل النظام سلوك النموذج، مما يقلل من الهلوسات في المخرجات. بالإضافة إلى ذلك، قم بتعيين top_p إلى 0.9 لأخذ العينات النووية (nucleus sampling)، مما يوازن بين التنوع والتماسك.

لمعالجة الدفعات، يدعم OpenRouter الاستدعاءات غير المتزامنة عبر WebSockets، ولكن التزم بطلبات POST المتزامنة لتبسيط الطبقة المجانية. راقب الاستخدام من خلال لوحة التحكم للبقاء ضمن الحدود — تجاوزها يؤدي إلى أخطاء 429، والتي تتعامل معها باستخدام التراجع الأسي:

import time
try:
    response = requests.post(url, headers=headers, json=payload)
    if response.status_code == 429:
        time.sleep(60)  # انتظر دقيقة واحدة
        response = requests.post(url, headers=headers, json=payload)
except Exception as e:
    print(f"Error: {e}")

تضمن هذه المرونة سير عمل متواصلًا. ومع توسع نطاق عملك، تقوم ميزات المحاكاة في Apidog بمحاكاة الاستجابات، مما يساعد في التطوير دون اتصال بالإنترنت.

الاستفادة من Apidog لاختبار وتوثيق واجهة برمجة تطبيقات NVIDIA المجانية

يرتقي Apidog بتفاعلاتك مع واجهة برمجة التطبيقات (API) إلى ما هو أبعد من النصوص البرمجية الخام. تدعم هذه الأداة مفتوحة المصدر استيراد مواصفات OpenAPI، ويوفر OpenRouter واحدة لنقاط نهاية Nemotron.

قم بتنزيل Apidog مجانًا، كما ذكرنا سابقًا، واتبع هذه الخطوات:

  1. شغل Apidog وأنشئ مشروعًا جديدًا.
  2. استورد مجموعة OpenRouter من مستودع GitHub الخاص بهم أو الصق مخطط JSON.
  3. أضف مفتاح NVIDIA API المجاني الخاص بك ضمن متغيرات البيئة.
  4. صمم الطلبات: تتحول تحميلات الصور بالسحب والإفلات إلى base64 تلقائيًا.
  5. قم بتشغيل الاختبارات واعرض الآثار — يسلط Apidog الضوء على ارتفاعات زمن الانتقال أو أخطاء الحمولة.

يمكنك توثيق نقاط النهاية بسهولة، وإنشاء تقارير Markdown مع أمثلة. على سبيل المثال، قم بتصدير أمر curl لاستعلام VQA الخاص بك:

curl -X POST https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"model":"nvidia/nemotron-nano-12b-v2-vl:free","messages":[{"role":"user","content":[{"type":"image_url","image_url":{"url":"data:image/jpeg;base64,..."},"type":"text","text":"حلل هذا."}]}]}'

تسهل هذه الصادرات المشاركة مع الفرق. علاوة على ذلك، يتتبع وضع التعاون في Apidog التغييرات، ويدير إصدارات تجارب NVIDIA Nemotron Nano 12B v2 VL الخاصة بك.

في الممارسة العملية، يبلغ المطورون عن دورات تكرار أسرع بنسبة 40% مع Apidog، حيث يقوم بتجريد التعليمات البرمجية المتكررة. انتقل إلى الإنتاج عن طريق التصدير إلى Postman أو التكامل مباشرة عبر حزم SDK.

معالجة الأخطاء وأفضل الممارسات واستراتيجيات التحسين

تنشأ الأخطاء في استخدام واجهة برمجة التطبيقات، لذا توقعها بشكل استباقي. تتضمن المشكلات الشائعة 401 (مفتاح غير صالح) — تحقق مرة أخرى من رمز Bearer الخاص بك. بالنسبة لـ 400 (JSON مشوه)، قم بالتحقق من صحة الحمولات باستخدام أدوات مثل JSONLint. تُحل أخطاء الصور المحددة، مثل سلاسل base64 ذات الحجم الزائد، عن طريق ضغط الملفات مسبقًا باستخدام Pillow:

from PIL import Image
img = Image.open("large_image.jpg")
img = img.resize((512, 512))
img.save("resized.jpg", quality=85)

تشمل أفضل الممارسات تحديد المعدل من جانبك باستخدام time.sleep(6) بين الاستدعاءات لاحترام حد 10 RPM. قم بتخزين الاستجابات المتكررة مؤقتًا باستخدام Redis لتقليل عدد مرات الوصول إلى واجهة برمجة التطبيقات.

يركز التحسين على هندسة المطالبات. استخدم استعلامات موجزة: "حدد الكائنات وعلاقاتها في هذه الصورة" يعطي نتائج أفضل من الاستعلامات الغامضة. جرب قيم درجة الحرارة — أقل للمهام الواقعية، وأعلى للتوليد الإبداعي.

للتوسع بدون تكلفة ضمن الحدود، اجمع الاستعلامات المنطقية في رسائل فردية، مما يزيد من كفاءة الرموز. راقب استخدام الرموز عبر بيانات تعريف الاستجابة: result['usage']['total_tokens'].

علاوة على ذلك، ادمج التسجيل باستخدام وحدة logging لتتبع الأداء:

import logging
logging.basicConfig(level=logging.INFO)
logging.info(f"Response tokens: {result['usage']['total_tokens']}")

تبني هذه العادات تطبيقات قوية. بينما تقوم بالتحسين، فكر في الإعدادات الهجينة التي تجمع بين Nemotron والمعالجة المسبقة المحلية للحصول على زمن انتقال منخفض للغاية.

الخاتمة

أنت الآن تمتلك الأدوات اللازمة لتسخير واجهة برمجة تطبيقات NVIDIA Nemotron Nano 12B v2 VL مجانًا. من الإعداد الأولي إلى النشرات المتقدمة، يجهزك هذا الدليل للنجاح. جرب بجرأة — ابدأ باستدعاءات بسيطة وتطور نحو تطبيقات متطورة. تذكر أن التعديلات الصغيرة المتسقة، مثل المطالبات المحسنة أو الاختبار بمساعدة Apidog، تحقق مكاسب كبيرة.

لمزيد من القراءة، استكشف منتديات مطوري NVIDIA أو سجل تغييرات OpenRouter. قم بتنزيل Apidog اليوم إذا لم تكن قد فعلت ذلك، وحوّل سير عمل واجهة برمجة التطبيقات الخاصة بك. ما هو المشروع الذي ستتولاه أولاً؟

تنزيل

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات

كيفية استخدام NVIDIA API مجانًا: Nemotron Nano 12B v2 VL