هولو3: أفضل نموذج لاستخدام الكمبيوتر؟

Ashley Innocent

Ashley Innocent

2 أبريل 2026

هولو3: أفضل نموذج لاستخدام الكمبيوتر؟

Apidog للمؤسسات

النشر على الخوادم المحلية

SSO و RBAC

متوافق مع SOC 2

استكشف Apidog للمؤسسات

خلاصة القول

أطلقت شركة H Company نموذجها Holo3 في 31 مارس 2026، وهو نموذج "خليط من الخبراء" (mixture-of-experts) حقق نسبة 78.85% على معيار OSWorld-Verified، وهي أعلى نتيجة تسجل على الإطلاق في معيار استخدام الحاسوب المكتبي الرائد. يتفوق هذا النموذج على GPT-5.4 و Opus 4.6 بجزء صغير من التكلفة. واجهة برمجة التطبيقات (API) متاحة الآن، والنسخة 35B مفتوحة الأوزان على HuggingFace تحت ترخيص Apache 2.0.

فجوة استخدام الحاسوب التي لم يحلها معظم المطورين

لقد قمت بأتمتة واجهات برمجة التطبيقات الخاصة بك (APIs). يعمل خط أنابيب CI/CD الخاص بك بسلاسة. ولكن لا تزال هناك فئة من المهام التي تفسد كل أتمتة: برامج المؤسسات القديمة التي لا تحتوي على واجهة برمجة تطبيقات، وتطبيقات سطح المكتب التي تسبق REST، وسير العمل متعدد الخطوات الذي يتجاوز خمس واجهات مستخدم مختلفة.

تتعامل أدوات التشغيل الآلي للعمليات الروبوتية (RPA) التقليدية (مثل UiPath و Automation Anywhere) مع هذا الأمر باستخدام نصوص برمجية هشة تعتمد على إحداثيات الشاشة وتتعطل في كل مرة تتغير فيها واجهة المستخدم. وكان البديل هو العمل اليدوي.

يغير الذكاء الاصطناعي لاستخدام الحاسوب هذه المعادلة. يمكن للنماذج التي ترى لقطات الشاشة وتصدر إجراءات النقر والكتابة والتمرير التنقل في أي واجهة مستخدم رسومية (GUI) دون الحاجة إلى واجهة برمجة تطبيقات (API). يعد Holo3، الذي أطلقته شركة H Company ومقرها باريس في 31 مارس 2026، حاليًا أقوى نموذج متاح للعامة لهذه الفئة من المهام.

💡
إذا كنت تقوم ببناء سير عمل أتمتة أو خطوط اختبار تلامس برامج سطح المكتب، فإن واجهة برمجة تطبيقات Holo3 تستحق الفهم الآن. وإذا كنت تستخدم Apidog لتصميم واختبار واجهات برمجة تطبيقاتك، فإن الأقسام أدناه توضح لك بالضبط كيفية دمج استدعاءات Holo3 في سير عملك.
زر

ما هو Holo3؟

Holo3 هو نموذج لاستخدام الحاسوب: تعطيه لقطة شاشة لسطح المكتب أو المتصفح، وتخبره بالمهمة المراد إنجازها، وهو بدوره يعيد إجراءات (نقرات، ضغطات مفاتيح، أوامر تمرير) لتنفيذها على تلك الشاشة. تلتقط النتيجة، وتأخذ لقطة شاشة مرة أخرى، وتكرر العملية حتى تكتمل المهمة.

تقدم شركة H Company نسختين:

تعني بنية MoE (مزيج الخبراء) أن جزءًا صغيرًا فقط من المعلمات يتم تنشيطه لكل رمز مميز، لذا فإن النموذج أرخص بكثير في التشغيل مما يوحي به العدد الإجمالي لمعلماته. تذكر شركة H Company أن Holo3-122B-A10B يكلف أقل من GPT-5.4 و Opus 4.6 على أساس كل مهمة.

OSWorld-Verified: ما يقيسه المعيار فعليًا

OSWorld-Verified هو المعيار الرائد لتقييم استخدام الحاسوب بالذكاء الاصطناعي. على عكس المعايير التي تقيم النص الناتج، يختبر OSWorld التنفيذ: يجب على العامل إكمال مهام حقيقية على حاسوب حقيقي، ويتم التحقق من النجاح عن طريق فحص الحالة الفعلية للنظام بعد ذلك.

تتراوح المهام عبر النطاق الكامل للتعقيد:

يسجل Holo3-122B-A10B نسبة 78.85% على OSWorld-Verified. لوضع ذلك في السياق: كانت الدرجات فوق 40% تعتبر هي الأفضل حتى وقت قريب. كانت النماذج الرائدة السابقة من Anthropic و OpenAI تتراوح بين 60-65%.

تزداد أهمية هذه الفجوة في الجزء الصعب من المعيار. تُظهر المعايير المؤسسية الداخلية لشركة H Company (486 مهمة عبر التجارة الإلكترونية وبرامج الأعمال والتعاون وسير عمل التطبيقات المتعددة) أن Holo3 يتفوق بشكل خاص في مهام التطبيقات المتعددة — تلك التي تتطلب تنسيق البيانات عبر عدة تطبيقات في وقت واحد.

كيف تم تدريب Holo3: عجلة التعلم القائم على الوكيل (Agentic Learning Flywheel)

يتم تدريب معظم نماذج استخدام الحاسوب على عروض توضيحية ثابتة. قامت شركة H Company ببناء حلقة تدريب مستمرة تسميها "عجلة التعلم القائم على الوكيل" (Agentic Learning Flywheel):

  1. بيانات التنقل الاصطناعية — التعليمات البشرية والمولدة تنتج أمثلة تنقل خاصة بالسيناريو.
  2. توسيع خارج النطاق — يتم توسيع السيناريوهات برمجيًا لتغطية حالات واجهة المستخدم غير المتوقعة والحالات الهامشية.
  3. التعلم المعزز المنسق — يتم تصفية كل عينة بيانات واستخدامها في مسار التعلم المعزز (RL) لزيادة معدلات إكمال المهام مباشرة.

تأتي بيانات التدريب من مصنع البيئات الاصطناعية (Synthetic Environment Factory) — وهو نظام يقوم فيه وكلاء البرمجة ببناء تطبيقات ويب كاملة للمؤسسات من الصفر بناءً على مواصفات السيناريو. تتضمن هذه البيئات مهام قابلة للتحقق مع نصوص تحقق شاملة، بحيث يتدرب النموذج على سير عمل تجارية واقعية بدلاً من أمثلة بسيطة.

النتيجة: يتفوق Holo3 على نماذج Qwen3.5 الأساسية ذات عدد المعلمات الأكبر في نفس مهام المعيار. لا تفسر البنية وحدها الفجوة؛ بل تفعل ذلك منهجية التدريب.

كيفية استدعاء واجهة برمجة تطبيقات Holo3

تتبع واجهة برمجة تطبيقات Holo3 نمط حلقة لقطة شاشة-إجراء قياسي. إليك سير العمل الأساسي:

1. إعداد المصادقة

# H Company Inference API base URL
https://api.hcompany.ai/v1

# Header
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

احصل على مفتاح واجهة برمجة التطبيقات الخاص بك من hcompany.ai/holo-models-api. تغطي الطبقة المجانية Holo3-35B-A3B.

2. إرسال لقطة شاشة مع مهمة

import base64
import httpx

# Capture your screen (example using pyautogui)
import pyautogui
screenshot = pyautogui.screenshot()
screenshot.save("/tmp/screen.png")

with open("/tmp/screen.png", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = httpx.post(
    "https://api.hcompany.ai/v1/computer-use",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    json={
        "model": "holo3-122b-a10b",
        "task": "Open the invoice folder and find the most recent PDF",
        "screenshot": image_b64,
        "screen_width": 1920,
        "screen_height": 1080
    }
)

action = response.json()
print(action)

3. تحليل وتنفيذ الإجراء

تعيد واجهة برمجة التطبيقات إجراءات منظمة تقوم بتنفيذها على الجهاز المضيف:

{
  "action_type": "click",
  "coordinate": [245, 380],
  "reasoning": "The invoice folder icon is visible at this position"
}

تشمل أنواع الإجراءات: click، double_click، right_click، type، key، scroll، screenshot_request (عندما يحتاج النموذج إلى عرض جديد)، وtask_complete.

4. التكرار حتى الاكتمال

def run_computer_use_task(task: str, max_steps: int = 20):
    for step in range(max_steps):
        screenshot = capture_screen()
        response = call_holo3_api(task, screenshot)
        action = response["action"]

        if action["action_type"] == "task_complete":
            print(f"Done in {step + 1} steps")
            return response["result"]

        execute_action(action)

    raise TimeoutError("Task not completed within step limit")

اختبار استدعاءات واجهة برمجة تطبيقات Holo3 باستخدام Apidog

بمجرد قيامك باستدعاء واجهة برمجة تطبيقات Holo3، تحتاج إلى التحقق من أن تكاملك يعمل بشكل موثوق، خاصة لأتمتة الإنتاج. يتعامل Apidog مع هذا الأمر بوضوح.

استيراد نقطة النهاية: في Apidog، أنشئ طلب HTTP جديدًا إلى https://api.hcompany.ai/v1/computer-use. أضف رأس Authorization الخاص بك كمتغير بيئة حتى لا تقوم بتشفير المفاتيح.

إعداد التحقق من الطلب: تتيح لك تأكيدات اختبار Apidog التحقق من بنية الاستجابة تلقائيًا:

// In Apidog's post-response script
pm.test("Action type is valid", () => {
    const validActions = ["click", "type", "key", "scroll", "task_complete", "screenshot_request"];
    pm.expect(validActions).to.include(pm.response.json().action.action_type);
});

pm.test("Coordinates are within screen bounds", () => {
    const action = pm.response.json().action;
    if (action.coordinate) {
        pm.expect(action.coordinate[0]).to.be.within(0, 1920);
        pm.expect(action.coordinate[1]).to.be.within(0, 1080);
    }
});

محاكاة واجهة برمجة التطبيقات أثناء التطوير: استخدم ميزة Smart Mock من Apidog لإنشاء استجابات Holo3 واقعية دون الحاجة إلى الوصول إلى واجهة برمجة التطبيقات المباشرة. يوفر هذا رصيدًا أثناء اختبار التكامل ويتيح لطبقة الواجهة الأمامية أو طبقة التنسيق الخاصة بك التطوير بشكل متوازٍ.

تشغيل سيناريوهات الاختبار: قم بربط طلبات Holo3 متعددة في سيناريو اختبار Apidog لمحاكاة حلقة مهمة متعددة الخطوات كاملة. يمكنك التحقق من أن تسلسل الإجراءات متسق عبر الخطوات قبل تشغيله على جهاز مباشر.

Holo3 مقابل Claude Computer Use مقابل OpenAI Operator

Holo3-122B Holo3-35B Claude Computer Use OpenAI Operator
OSWorld-Verified 78.85% ~55% (تقديري) ~65% ~62%
الوصول عبر API نعم نعم (طبقة مجانية) نعم نعم
أوزان مفتوحة لا نعم (Apache 2.0) لا لا
قابل للاستضافة الذاتية لا نعم لا لا
التكلفة مقابل GPT-5.4 أقل أقل بكثير مقاربة تسعيرة GPT-5.4
الأفضل لـ المؤسسات الإنتاجية التطوير/الاختبار/المصادر المفتوحة نظام Anthropic البيئي نظام OpenAI البيئي

يعتمد الاختيار العملي على مكدسك التقني:

حالات الاستخدام المؤسسي

يغطي Holo3 سير العمل الذي لا يحتوي على حل نظيف قائم على واجهة برمجة التطبيقات (API):

تُظهر المعايير المؤسسية الداخلية لشركة H Company أن Holo3 يحقق نتائج قوية عبر الفئات الأربع: التجارة الإلكترونية، برامج الأعمال، التعاون، والتطبيقات المتعددة. تُظهر سير عمل التطبيقات المتعددة أكبر فجوة في الأداء مقارنة بالمنافسين — المهام التي تتطلب الاستنتاج عبر عدة تطبيقات دون فقدان الحالة هي حيث تؤتي منهجية التدريب ثمارها بأكبر قدر.

ما التالي: الوكالة التكيفية (Adaptive Agency)

تتحدث شركة H Company مباشرة عما يأتي بعد Holo3. يركز عملهم الحالي على الوكالة التكيفية (Adaptive Agency) — نماذج لا تقتصر على التنقل في البرامج التي رأتها من قبل فحسب، بل تتعلم كيفية التنقل في برامج مؤسسية جديدة تمامًا ومخصصة في الوقت الفعلي.

لا تزال نماذج استخدام الحاسوب الحالية، بما في ذلك Holo3، مدربة على مجموعة محدودة من بيئات البرامج. سيحقق الوكيل الذي يواجه أداة داخلية مخصصة لم يرها من قبل معدلات نجاح أقل من تلك التي يحققها على التطبيقات القياسية. تهدف الوكالة التكيفية إلى سد هذه الفجوة: حيث سيفسر النموذج بنية البرنامج عند أول اتصال، ويبني نموذجًا عمليًا لكيفية عمله، وينفذ المهام دون بيانات تدريب مسبقة.

إذا وفت شركة H Company بهذا الوعد، فإنه سيزيل القيد الرئيسي المتبقي على استخدام الذكاء الاصطناعي في الحاسوب لنشره في المؤسسات.

الخلاصة

يضع Holo3 معيارًا جديدًا لاستخدام الحاسوب المكتبي. بنسبة 78.85% على OSWorld-Verified، إنه أفضل بشكل ملموس من بدائل Claude والحلول القائمة على GPT في المهام المعقدة متعددة الخطوات. الطبقة المجانية على Holo3-35B-A3B والأوزان المفتوحة بترخيص Apache 2.0 تجعله متاحًا للمطورين للاختبار دون تكلفة مسبقة.

نمط التكامل بسيط ومباشر: لقطة شاشة، إرسال POST إلى واجهة برمجة التطبيقات، تنفيذ الإجراء المعاد، ثم التكرار. تكمن مساعدة Apidog في جعل هذا التكامل موثوقًا — التحقق من هياكل الاستجابة، والمحاكاة أثناء التطوير، وتشغيل سيناريوهات الاختبار قبل النشر على الأنظمة الحية.

إذا كنت تبني أي شيء يلامس واجهات المستخدم الرسومية لسطح المكتب، جرب Apidog مجانًا واختبر تكاملك مع Holo3 قبل أن يصل إلى الإنتاج.

زر

الأسئلة الشائعة

ما هو Holo3؟Holo3 هو نموذج ذكاء اصطناعي لاستخدام الحاسوب من شركة H Company، يأخذ لقطات الشاشة كمدخل ويعيد إجراءات (نقرات، ضغطات مفاتيح، تمرير) لإكمال المهام على سطح المكتب أو المتصفح. يسجل النموذج 78.85% على معيار OSWorld-Verified، وهي أعلى نتيجة مسجلة في هذا الاختبار.

هل Holo3 مفتوح المصدر؟النسخة الأصغر، Holo3-35B-A3B، مفتوحة الأوزان بموجب ترخيص Apache 2.0 وقابلة للتنزيل من HuggingFace. أما النموذج الرائد Holo3-122B-A10B فهو متاح عبر واجهة برمجة التطبيقات فقط. وكلاهما متاح عبر واجهة برمجة تطبيقات الاستدلال الخاصة بشركة H Company، مع طبقة مجانية لنموذج 35B.

كيف يعمل معيار OSWorld؟يختبر OSWorld وكلاء الذكاء الاصطناعي في مهام حاسوبية حقيقية — التنقل عبر الويب، إدارة الملفات، سير عمل عبر التطبيقات. يتم التحقق من النجاح عن طريق فحص الحالة الفعلية للنظام بعد تشغيل الوكيل، وليس عن طريق تقييم النص الناتج. تتراوح المهام من عمليات التطبيق الواحد إلى تسلسلات تطبيقات متعددة ذات أفق طويل.

كيف يقارن Holo3 بـ Claude Computer Use؟يسجل Holo3-122B درجات أعلى في OSWorld-Verified (78.85% مقابل 65% تقريبًا لـ Claude). كما أنه أرخص لكل مهمة. يظل Claude Computer Use خيارًا قويًا للفرق التي تستخدم بالفعل واجهة برمجة تطبيقات Anthropic وترغب في علاقة فوترة واحدة.

هل يمكنني تشغيل Holo3 محليًا؟نعم، إذا كنت تستخدم Holo3-35B-A3B. الأوزان موجودة على HuggingFace بموجب ترخيص Apache 2.0. نموذج 122B متاح عبر واجهة برمجة تطبيقات الاستدلال فقط.

ما هي حالات الاستخدام الرئيسية لواجهات برمجة تطبيقات استخدام الحاسوب؟أتمتة الأنظمة القديمة (لا تتوفر واجهة برمجة تطبيقات REST)، سير عمل البيانات عبر التطبيقات، اختبار الانحدار لتطبيقات الويب بدون محددات هشة، كشط الذكاء التنافسي، وأي سير عمل لسطح المكتب يتطلب حاليًا تفاعلًا بشريًا يدويًا.

كيف أختبر تكاملي مع واجهة برمجة تطبيقات Holo3؟استخدم Apidog لاستيراد نقطة النهاية، وإعداد تأكيدات التحقق من الاستجابة، ومحاكاة واجهة برمجة التطبيقات أثناء التطوير، وربط الطلبات في سيناريوهات اختبار. هذا يكتشف مشكلات التكامل قبل تشغيل الأتمتة على الأجهزة الحية.

ما هي "الوكالة التكيفية" (Adaptive Agency) في خارطة طريق Holo3؟تعمل شركة H Company على نماذج يمكنها التنقل في برامج المؤسسات التي لم ترها من قبل، وتعلم بنية واجهة المستخدم في الوقت الفعلي بدلاً من الاعتماد على بيانات التدريب المسبقة. سيزيل هذا القيد الرئيسي المتبقي على استخدام الذكاء الاصطناعي في الحاسوب لعمليات النشر المؤسسية المخصصة بالكامل.

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات