تشغيل Phi-4 للاستدلال: واجهة برمجة تطبيقات مجانية ومحلية مع أولاما

يتطور مجال الذكاء الاصطناعي بسرعة، وغالبًا ما تحتل نماذج اللغات الكبيرة (LLMs) مركز الصدارة. ومع ذلك، تحدث ثورة موازية في عالم نماذج اللغات الصغيرة (SLMs). كان قسم أبحاث مايكروسوفت لاعبًا رئيسيًا في هذا المجال، لا سيما بسلسلة Phi الخاصة بهم. بناءً على نجاح نماذج مثل Phi-3، كشفت مايكروسوفت مؤخرًا عن قوتين جديدتين: Phi-4-reasoning و Phi-4-reasoning-plus. تمثل هذه النماذج قفزة كبيرة إلى الأمام، حيث تثبت أن النماذج الأصغر والأكثر كفاءة يمكنها منافسة نظيراتها الأكبر في مهام التفكير المعقدة.

💡

هل تريد أداة رائعة لاختبار واجهات برمجة التطبيقات (API) تولد توثيقًا رائعًا لواجهات برمجة التطبيقات؟

هل تريد منصة متكاملة وشاملة لفريق المطورين لديك للعمل معًا بأقصى قدر من الإنتاجية؟

Apidog يلبي جميع متطلباتك، ويحل محل Postman بسعر معقول أكثر بكثير!

زر

Phi-4 يمتلك الآن نماذج تفكير

بدأت الرحلة مع Phi-4، وهو نموذج Transformer كثيف بـ 14 مليار معلمة يعتمد على فك التشفير فقط. بينما كان قادرًا بالفعل، سعت مايكروسوفت إلى تزويده بقدرات تفكير أقوى، لا سيما في مجالات الرياضيات والعلوم والبرمجة. أدى هذا إلى تطوير Phi-4-reasoning ونسخته المحسنة، Phi-4-reasoning-plus.

يشترك كلا النموذجين في بنية Phi-4 ولكنهما يخضعان لتدريب لاحق متخصص يركز على التفكير. يكمن الاختلاف الرئيسي في منهجية التدريب:

Phi-4-reasoning: يتم إنشاء هذا النموذج عن طريق الضبط الدقيق تحت الإشراف (SFT) لـ Phi-4 على مجموعة بيانات منسقة بدقة. تمزج مجموعة البيانات هذه بين البيانات العامة المفلترة عالية الجودة والمطالبات الاصطناعية، مع التركيز بشكل خاص على آثار سلسلة التفكير (CoT). يتضمن تفكير CoT تقسيم المشكلات المعقدة إلى خطوات وسيطة، محاكاة عملية تفكير تشبه الإنسان أكثر. تتضمن مجموعة بيانات SFT أيضًا بيانات محاذاة لضمان السلامة وممارسات الذكاء الاصطناعي المسؤولة. استخدمت مايكروسوفت عروض تفكير من o3-mini من OpenAI كجزء من هذه البيانات المنسقة.
Phi-4-reasoning-plus: يأخذ هذا النموذج Phi-4-reasoning خطوة أخرى إلى الأمام من خلال دمج التعلم المعزز (RL). تسمح مرحلة RL للنموذج بتعلم استخدام المزيد من الحوسبة وقت الاستدلال، مما يولد سلاسل تفكير أكثر تفصيلاً وغالبًا ما تكون أطول (حوالي 1.5 مرة من الرموز أكثر من Phi-4-reasoning الأساسي). يترجم هذا الجهد الحسابي الإضافي مباشرة إلى دقة أعلى في المهام المعقدة، وإن كان ذلك مع زيادة محتملة في زمن الاستجابة.

يتميز كلا النموذجين بطول سياق يبلغ 32 ألف رمز، مما يمكنهما من التعامل مع المطالبات المعقدة وتوليد عمليات تفكير واسعة النطاق. ومن المثير للاهتمام، تشير بطاقة النموذج لـ Phi-4-reasoning-plus إلى نتائج واعدة عند توسيع نافذة السياق إلى 64 ألف رمز أثناء التجارب، مع الحفاظ على التماسك على التسلسلات الأطول.

معايير Phi-4 Reasoning و Phi-4 Reasoning Plus و Phi-4-Reasoning-Mini

المقياس الحقيقي لهذه النماذج يكمن في أدائها. قامت مايكروسوفت بتقييمها مقابل مجموعة من المعايير الصعبة، لا سيما تلك التي تركز على التفكير:

التفكير الرياضي: مؤهلات AIME (الاختبار الأمريكي للرياضيات الدعوي) من 2022-2025، OmniMath (مجموعة تضم أكثر من 4000 مشكلة بمستوى الأولمبياد).
التفكير العلمي: GPQA-Diamond (أسئلة علمية بمستوى الدراسات العليا).
البرمجة وحل المشكلات الخوارزمية: LiveCodeBench (مشكلات مسابقات البرمجة التنافسية)، 3SAT (قابلية الإرضاء)، TSP (مشكلة البائع المتجول).
التخطيط والفهم المكاني: تقويم BA، المتاهة، خريطة مكانية.

النتائج، كما هي معروضة في التقارير الفنية وبطاقات النموذج، مثيرة للإعجاب:

النموذج	AIME 24	AIME 25	OmniMath	GPQA-D	LiveCodeBench (8/1/24–2/1/25)
Phi-4-reasoning	75.3	62.9	76.6	65.8	53.8
Phi-4-reasoning-plus	81.3	78.0	81.9	68.9	53.1
OpenThinker2-32B	58.0	58.0	—	64.1	—
QwQ 32B	79.5	65.8	—	59.5	63.4
EXAONE-Deep-32B	72.1	65.8	—	66.1	59.5
DeepSeek-R1-Distill-70B	69.3	51.5	63.4	66.2	57.5
DeepSeek-R1	78.7	70.4	85.0	73.0	62.8
o1-mini	63.6	54.8	—	60.0	53.8
o1	74.6	75.3	67.5	76.7	71.0
o3-mini	88.0	78.0	74.6	77.7	69.5
Claude-3.7-Sonnet	55.3	58.7	54.6	76.8	—
Gemini-2.5-Pro	92.0	86.7	61.1	84.0	69.2

(بيانات الجدول مصدرها بطاقات نماذج Hugging Face ومدخلات المستخدم)

النقاط الرئيسية المستخلصة من المعايير:

تفوق على النماذج الأكبر: يتفوق كلا نموذجي Phi-4-reasoning بشكل كبير على النماذج مفتوحة الوزن الأكبر بكثير مثل DeepSeek-R1-Distill-70B (وهو أكبر بـ 5 مرات) في العديد من معايير التفكير.
منافسة مع العمالقة: تقترب من أو حتى تتجاوز أداء نماذج مثل DeepSeek-R1 الكامل (نموذج MoE بـ 671 مليار) و o1-mini و o1 من OpenAI في مهام محددة (مثل AIME 25).
ميزة Reasoning-Plus: يحقق Phi-4-reasoning-plus باستمرار درجات أعلى من Phi-4-reasoning بشكل عام، مما يؤكد فعالية تدريب RL الإضافي للدقة.
القدرات العامة: بينما تم تدريب النماذج على التفكير، فإنها تظهر أيضًا تحسينات كبيرة على Phi-4 الأساسي في المعايير العامة مثل اتباع التعليمات (IFEval)، والبرمجة (HumanEvalPlus)، وحتى السلامة (ToxiGen)، مما يشير إلى تعميم قوي.

تؤكد هذه النتائج أطروحة مايكروسوفت الرئيسية: أن البيانات عالية الجودة التي تركز على التفكير والضبط الدقيق الموجه يمكن أن تسمح للنماذج الأصغر بتحقيق قدرات تفكير رائعة كان يُعتقد سابقًا أنها حصرية للنماذج الضخمة.

تشغيل Phi-4-reasoning محليًا باستخدام Ollama (خطوة بخطوة)

أحد المزايا الرئيسية لـ SLMs هو إمكانية تشغيلها محليًا. Ollama، منصة شائعة لتشغيل LLMs محليًا، توفر دعمًا جاهزًا لعائلة Phi-4 reasoning.

اتبع هذه الخطوات لتشغيلها على جهازك:

الخطوة 1: تثبيت Ollama
إذا لم تكن قد فعلت ذلك بالفعل، انتقل إلى ollama.com وقم بتنزيل المثبت لنظام التشغيل الخاص بك (macOS أو Windows أو Linux). قم بتشغيل المثبت.

الخطوة 2: سحب النماذج عبر Terminal
افتح موجه الأوامر أو تطبيق Terminal الخاص بك. استخدم الأمر المناسب أدناه لتنزيل النموذج المطلوب. قد يستغرق هذا بعض الوقت اعتمادًا على سرعة اتصالك بالإنترنت.

لتنزيل Phi-4-reasoning:
ollama pull phi4-reasoning
لتنزيل Phi-4-reasoning-plus:
ollama pull phi4-reasoning:plus
(ملاحظة: يتم تحديد متغير plus باستخدام علامة بعد النقطتين.)

الخطوة 3: تشغيل النموذج للتفاعل
بمجرد اكتمال التنزيل، يمكنك البدء في الدردشة مع النموذج مباشرة من Terminal الخاص بك:

لتشغيل Phi-4-reasoning:
ollama run phi4-reasoning
لتشغيل Phi-4-reasoning-plus:
ollama run phi4-reasoning:plus

بعد تشغيل الأمر، سترى موجهًا (مثل >>> أو Send a message...) حيث يمكنك كتابة أسئلتك.

الخطوة 4: استخدام هيكل المطالبة الموصى به (مهم!)
تعمل هذه النماذج بأفضل شكل عند توجيهها بواسطة مطالبة نظام وهيكل محددين. عند التفاعل (خاصة للمهام المعقدة)، قم بهيكلة إدخالك بهذا الشكل:

ابدأ بمطالبة النظام: قبل سؤالك الفعلي، قدم مطالبة النظام التي تخبر النموذج كيف يفكر.
استخدم تنسيق ChatML: على الرغم من أن أمر run في Ollama يبسط هذا، إلا أن النموذج يتوقع داخليًا علامات <|im_start|>system و <|im_start|>user و <|im_start|>assistant.
توقع <think> و <solution>: تم تدريب النموذج على إخراج عملية تفكيره ضمن علامات <think>...</think> والإجابة النهائية ضمن علامات <solution>...</solution>.

مطالبة النظام الموصى بها:

Your role as an assistant involves thoroughly exploring questions through a systematic thinking process before providing the final precise and accurate solutions. This requires engaging in a comprehensive cycle of analysis, summarizing, exploration, reassessment, reflection, backtracing, and iteration to develop well-considered thinking process. Please structure your response into two main sections: Thought and Solution using the specified format: <think> {Thought section} </think> {Solution section}. In the Thought section, detail your reasoning process in steps. Each step should include detailed considerations such as analysing questions, summarizing relevant findings, brainstorming new ideas, verifying the accuracy of the current steps, refining any errors, and revisiting previous steps. In the Solution section, based on various attempts, explorations, and reflections from the Thought section, systematically present the final solution that you deem correct. The Solution section should be logical, accurate, and concise and detail necessary steps needed to reach the conclusion. Now, try to solve the following question through the above guidelines:

(بينما لا يمكنك بسهولة إضافة مطالبة النظام في بداية أمر ollama run الأساسي، كن على دراية بهذا الهيكل عند تفسير المخرجات أو استخدام واجهة برمجة تطبيقات/مكتبات Ollama حيث يمكنك تعيين مطالبات النظام بشكل صريح.)

اعتبارات الأجهزة: تذكر أن نماذج 14B تحتاج إلى قدر كبير من ذاكرة الوصول العشوائي (RAM)/ذاكرة الفيديو (VRAM). تساعد الإصدارات الكمية الافتراضية (~11 جيجابايت)، ولكن تحقق من متطلبات موارد Ollama.

الوصول إلى Phi-4-reasoning عبر واجهة برمجة تطبيقات مجانية باستخدام OpenRouter (خطوة بخطوة)

للوصول المستند إلى السحابة أو التكامل في التطبيقات دون قيود الأجهزة المحلية، يقدم OpenRouter طبقة واجهة برمجة تطبيقات مجانية لـ Phi-4-reasoning.

إليك كيفية استخدامه:

الخطوة 1: الحصول على مفتاح API من OpenRouter

انتقل إلى openrouter.ai.
سجل أو قم بتسجيل الدخول.
انتقل إلى قسم الإعدادات/مفاتيح API الخاص بك وأنشئ مفتاح API جديدًا. انسخه بشكل آمن.

الخطوة 2: تثبيت مكتبة OpenAI Python
إذا لم تكن لديك، قم بتثبيت المكتبة باستخدام pip:
pip install openai

الخطوة 3: إعداد Apidog للاختبار

Apidog، منصة قوية لاختبار واجهات برمجة التطبيقات، تبسط التفاعل مع واجهات برمجة تطبيقات Phi-4-reasoning. تتيح لك واجهته البديهية إرسال الطلبات وعرض الاستجابات وتصحيح الأخطاء بكفاءة. اتبع هذه الخطوات لتكوينه.

زر

ابدأ بتنزيل Apidog وتثبيته على نظامك. قم بتشغيل التطبيق وإنشاء مشروع جديد.

داخل هذا المشروع، أضف طلبًا جديدًا. اضبط الطريقة على POST وأدخل نقطة نهاية OpenRouter: https://openrouter.ai/api/v1/chat/completions.

بعد ذلك، قم بتكوين الرؤوس (Headers). أضف رأس "Authorization" بالقيمة Bearer YOUR_API_KEY، مستبدلاً YOUR_API_KEY بالمفتاح من OpenRouter. هذا يوثق طلبك. ثم، انتقل إلى علامة تبويب Body، حدد تنسيق JSON، وقم بإنشاء حمولة طلبك. إليك مثال لـ microsoft/phi-4-reasoning:free:

{
  "model": "microsoft/phi-4-reasoning:free",
  "messages": [
    {"role": "user", "content": "Hello, how are you?"}
  ]
}

انقر على "Send" في Apidog لتنفيذ الطلب. ستعرض لوحة الاستجابة مخرجات النموذج، والتي تتضمن عادةً النص الذي تم إنشاؤه وبيانات وصفية مثل استخدام الرموز. ميزات Apidog، مثل حفظ الطلبات أو تنظيمها في مجموعات، تعزز سير عملك. باستخدام هذا الإعداد، يمكنك الآن استكشاف قدرات نماذج Qwen 3.

الخلاصة

يمثل Phi-4-reasoning و Phi-4-reasoning-plus تقدمًا كبيرًا في قدرات نماذج اللغات الصغيرة. من خلال التركيز على بيانات التفكير عالية الجودة واستخدام تقنيات الضبط الدقيق المتطورة مثل SFT و RL، أثبتت مايكروسوفت أن أداء التفكير الرائع يمكن تحقيقه دون اللجوء إلى أعداد هائلة من المعلمات. توفرها من خلال منصات مثل Ollama للاستخدام المحلي و OpenRouter للوصول المجاني عبر واجهة برمجة التطبيقات يضفي طابعًا ديمقراطيًا على الوصول إلى أدوات التفكير القوية. مع استمرار تطوير SLMs، تبرز عائلة Phi-4 reasoning كشهادة على قوة الذكاء الاصطناعي الفعال والمركز.