تشغيل Phi-4 للاستدلال: واجهة برمجة تطبيقات مجانية ومحلية مع أولاما

Emmanuel Mumba

Emmanuel Mumba

2 مايو 2025

تشغيل Phi-4 للاستدلال: واجهة برمجة تطبيقات مجانية ومحلية مع أولاما

يتطور مجال الذكاء الاصطناعي بسرعة، وغالبًا ما تحتل نماذج اللغات الكبيرة (LLMs) مركز الصدارة. ومع ذلك، تحدث ثورة موازية في عالم نماذج اللغات الصغيرة (SLMs). كان قسم أبحاث مايكروسوفت لاعبًا رئيسيًا في هذا المجال، لا سيما بسلسلة Phi الخاصة بهم. بناءً على نجاح نماذج مثل Phi-3، كشفت مايكروسوفت مؤخرًا عن قوتين جديدتين: Phi-4-reasoning و Phi-4-reasoning-plus. تمثل هذه النماذج قفزة كبيرة إلى الأمام، حيث تثبت أن النماذج الأصغر والأكثر كفاءة يمكنها منافسة نظيراتها الأكبر في مهام التفكير المعقدة.

💡
هل تريد أداة رائعة لاختبار واجهات برمجة التطبيقات (API) تولد توثيقًا رائعًا لواجهات برمجة التطبيقات؟

هل تريد منصة متكاملة وشاملة لفريق المطورين لديك للعمل معًا بأقصى قدر من الإنتاجية؟

Apidog يلبي جميع متطلباتك، ويحل محل Postman بسعر معقول أكثر بكثير!

زر

Phi-4 يمتلك الآن نماذج تفكير

بدأت الرحلة مع Phi-4، وهو نموذج Transformer كثيف بـ 14 مليار معلمة يعتمد على فك التشفير فقط. بينما كان قادرًا بالفعل، سعت مايكروسوفت إلى تزويده بقدرات تفكير أقوى، لا سيما في مجالات الرياضيات والعلوم والبرمجة. أدى هذا إلى تطوير Phi-4-reasoning ونسخته المحسنة، Phi-4-reasoning-plus.

يشترك كلا النموذجين في بنية Phi-4 ولكنهما يخضعان لتدريب لاحق متخصص يركز على التفكير. يكمن الاختلاف الرئيسي في منهجية التدريب:

  1. Phi-4-reasoning: يتم إنشاء هذا النموذج عن طريق الضبط الدقيق تحت الإشراف (SFT) لـ Phi-4 على مجموعة بيانات منسقة بدقة. تمزج مجموعة البيانات هذه بين البيانات العامة المفلترة عالية الجودة والمطالبات الاصطناعية، مع التركيز بشكل خاص على آثار سلسلة التفكير (CoT). يتضمن تفكير CoT تقسيم المشكلات المعقدة إلى خطوات وسيطة، محاكاة عملية تفكير تشبه الإنسان أكثر. تتضمن مجموعة بيانات SFT أيضًا بيانات محاذاة لضمان السلامة وممارسات الذكاء الاصطناعي المسؤولة. استخدمت مايكروسوفت عروض تفكير من o3-mini من OpenAI كجزء من هذه البيانات المنسقة.
  2. Phi-4-reasoning-plus: يأخذ هذا النموذج Phi-4-reasoning خطوة أخرى إلى الأمام من خلال دمج التعلم المعزز (RL). تسمح مرحلة RL للنموذج بتعلم استخدام المزيد من الحوسبة وقت الاستدلال، مما يولد سلاسل تفكير أكثر تفصيلاً وغالبًا ما تكون أطول (حوالي 1.5 مرة من الرموز أكثر من Phi-4-reasoning الأساسي). يترجم هذا الجهد الحسابي الإضافي مباشرة إلى دقة أعلى في المهام المعقدة، وإن كان ذلك مع زيادة محتملة في زمن الاستجابة.

يتميز كلا النموذجين بطول سياق يبلغ 32 ألف رمز، مما يمكنهما من التعامل مع المطالبات المعقدة وتوليد عمليات تفكير واسعة النطاق. ومن المثير للاهتمام، تشير بطاقة النموذج لـ Phi-4-reasoning-plus إلى نتائج واعدة عند توسيع نافذة السياق إلى 64 ألف رمز أثناء التجارب، مع الحفاظ على التماسك على التسلسلات الأطول.

معايير Phi-4 Reasoning و Phi-4 Reasoning Plus و Phi-4-Reasoning-Mini

معايير Phi-4-Reasoning و Phi-4-Reasoning-Plus
معايير Phi-4-Reasoning و Phi-4-Reasoning-Plus
معايير Phi-4-Reasoning-Mini

المقياس الحقيقي لهذه النماذج يكمن في أدائها. قامت مايكروسوفت بتقييمها مقابل مجموعة من المعايير الصعبة، لا سيما تلك التي تركز على التفكير:

النتائج، كما هي معروضة في التقارير الفنية وبطاقات النموذج، مثيرة للإعجاب:

النموذج AIME 24 AIME 25 OmniMath GPQA-D LiveCodeBench (8/1/24–2/1/25)
Phi-4-reasoning 75.3 62.9 76.6 65.8 53.8
Phi-4-reasoning-plus 81.3 78.0 81.9 68.9 53.1
OpenThinker2-32B 58.0 58.0 64.1
QwQ 32B 79.5 65.8 59.5 63.4
EXAONE-Deep-32B 72.1 65.8 66.1 59.5
DeepSeek-R1-Distill-70B 69.3 51.5 63.4 66.2 57.5
DeepSeek-R1 78.7 70.4 85.0 73.0 62.8
o1-mini 63.6 54.8 60.0 53.8
o1 74.6 75.3 67.5 76.7 71.0
o3-mini 88.0 78.0 74.6 77.7 69.5
Claude-3.7-Sonnet 55.3 58.7 54.6 76.8
Gemini-2.5-Pro 92.0 86.7 61.1 84.0 69.2

(بيانات الجدول مصدرها بطاقات نماذج Hugging Face ومدخلات المستخدم)

النقاط الرئيسية المستخلصة من المعايير:

تؤكد هذه النتائج أطروحة مايكروسوفت الرئيسية: أن البيانات عالية الجودة التي تركز على التفكير والضبط الدقيق الموجه يمكن أن تسمح للنماذج الأصغر بتحقيق قدرات تفكير رائعة كان يُعتقد سابقًا أنها حصرية للنماذج الضخمة.

تشغيل Phi-4-reasoning محليًا باستخدام Ollama (خطوة بخطوة)

أحد المزايا الرئيسية لـ SLMs هو إمكانية تشغيلها محليًا. Ollama، منصة شائعة لتشغيل LLMs محليًا، توفر دعمًا جاهزًا لعائلة Phi-4 reasoning.

اتبع هذه الخطوات لتشغيلها على جهازك:

الخطوة 1: تثبيت Ollama
إذا لم تكن قد فعلت ذلك بالفعل، انتقل إلى ollama.com وقم بتنزيل المثبت لنظام التشغيل الخاص بك (macOS أو Windows أو Linux). قم بتشغيل المثبت.

الخطوة 2: سحب النماذج عبر Terminal
افتح موجه الأوامر أو تطبيق Terminal الخاص بك. استخدم الأمر المناسب أدناه لتنزيل النموذج المطلوب. قد يستغرق هذا بعض الوقت اعتمادًا على سرعة اتصالك بالإنترنت.

الخطوة 3: تشغيل النموذج للتفاعل
بمجرد اكتمال التنزيل، يمكنك البدء في الدردشة مع النموذج مباشرة من Terminal الخاص بك:

بعد تشغيل الأمر، سترى موجهًا (مثل >>> أو Send a message...) حيث يمكنك كتابة أسئلتك.

الخطوة 4: استخدام هيكل المطالبة الموصى به (مهم!)
تعمل هذه النماذج بأفضل شكل عند توجيهها بواسطة مطالبة نظام وهيكل محددين. عند التفاعل (خاصة للمهام المعقدة)، قم بهيكلة إدخالك بهذا الشكل:

مطالبة النظام الموصى بها:

Your role as an assistant involves thoroughly exploring questions through a systematic thinking process before providing the final precise and accurate solutions. This requires engaging in a comprehensive cycle of analysis, summarizing, exploration, reassessment, reflection, backtracing, and iteration to develop well-considered thinking process. Please structure your response into two main sections: Thought and Solution using the specified format: <think> {Thought section} </think> {Solution section}. In the Thought section, detail your reasoning process in steps. Each step should include detailed considerations such as analysing questions, summarizing relevant findings, brainstorming new ideas, verifying the accuracy of the current steps, refining any errors, and revisiting previous steps. In the Solution section, based on various attempts, explorations, and reflections from the Thought section, systematically present the final solution that you deem correct. The Solution section should be logical, accurate, and concise and detail necessary steps needed to reach the conclusion. Now, try to solve the following question through the above guidelines:

(بينما لا يمكنك بسهولة إضافة مطالبة النظام في بداية أمر ollama run الأساسي، كن على دراية بهذا الهيكل عند تفسير المخرجات أو استخدام واجهة برمجة تطبيقات/مكتبات Ollama حيث يمكنك تعيين مطالبات النظام بشكل صريح.)

اعتبارات الأجهزة: تذكر أن نماذج 14B تحتاج إلى قدر كبير من ذاكرة الوصول العشوائي (RAM)/ذاكرة الفيديو (VRAM). تساعد الإصدارات الكمية الافتراضية (~11 جيجابايت)، ولكن تحقق من متطلبات موارد Ollama.

الوصول إلى Phi-4-reasoning عبر واجهة برمجة تطبيقات مجانية باستخدام OpenRouter (خطوة بخطوة)

للوصول المستند إلى السحابة أو التكامل في التطبيقات دون قيود الأجهزة المحلية، يقدم OpenRouter طبقة واجهة برمجة تطبيقات مجانية لـ Phi-4-reasoning.

إليك كيفية استخدامه:

الخطوة 1: الحصول على مفتاح API من OpenRouter

الخطوة 2: تثبيت مكتبة OpenAI Python
إذا لم تكن لديك، قم بتثبيت المكتبة باستخدام pip:
pip install openai

الخطوة 3: إعداد Apidog للاختبار

Apidog، منصة قوية لاختبار واجهات برمجة التطبيقات، تبسط التفاعل مع واجهات برمجة تطبيقات Phi-4-reasoning. تتيح لك واجهته البديهية إرسال الطلبات وعرض الاستجابات وتصحيح الأخطاء بكفاءة. اتبع هذه الخطوات لتكوينه.

زر

ابدأ بتنزيل Apidog وتثبيته على نظامك. قم بتشغيل التطبيق وإنشاء مشروع جديد.

داخل هذا المشروع، أضف طلبًا جديدًا. اضبط الطريقة على POST وأدخل نقطة نهاية OpenRouter: https://openrouter.ai/api/v1/chat/completions.

بعد ذلك، قم بتكوين الرؤوس (Headers). أضف رأس "Authorization" بالقيمة Bearer YOUR_API_KEY، مستبدلاً YOUR_API_KEY بالمفتاح من OpenRouter. هذا يوثق طلبك. ثم، انتقل إلى علامة تبويب Body، حدد تنسيق JSON، وقم بإنشاء حمولة طلبك. إليك مثال لـ microsoft/phi-4-reasoning:free:

{
  "model": "microsoft/phi-4-reasoning:free",
  "messages": [
    {"role": "user", "content": "Hello, how are you?"}
  ]
}

انقر على "Send" في Apidog لتنفيذ الطلب. ستعرض لوحة الاستجابة مخرجات النموذج، والتي تتضمن عادةً النص الذي تم إنشاؤه وبيانات وصفية مثل استخدام الرموز. ميزات Apidog، مثل حفظ الطلبات أو تنظيمها في مجموعات، تعزز سير عملك. باستخدام هذا الإعداد، يمكنك الآن استكشاف قدرات نماذج Qwen 3.

الخلاصة

يمثل Phi-4-reasoning و Phi-4-reasoning-plus تقدمًا كبيرًا في قدرات نماذج اللغات الصغيرة. من خلال التركيز على بيانات التفكير عالية الجودة واستخدام تقنيات الضبط الدقيق المتطورة مثل SFT و RL، أثبتت مايكروسوفت أن أداء التفكير الرائع يمكن تحقيقه دون اللجوء إلى أعداد هائلة من المعلمات. توفرها من خلال منصات مثل Ollama للاستخدام المحلي و OpenRouter للوصول المجاني عبر واجهة برمجة التطبيقات يضفي طابعًا ديمقراطيًا على الوصول إلى أدوات التفكير القوية. مع استمرار تطوير SLMs، تبرز عائلة Phi-4 reasoning كشهادة على قوة الذكاء الاصطناعي الفعال والمركز.

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات