سونا AI: الوكيل العام للذكاء الاصطناعي مفتوح المصدر

@apidog

@apidog

25 أبريل 2025

سونا AI: الوكيل العام للذكاء الاصطناعي مفتوح المصدر

مجال الذكاء الاصطناعي يتحرك بشكل متزايد نحو وكلاء يمكنهم القيام بأكثر من مجرد معالجة المعلومات - يمكنهم التحرك. تظهر Suna AI في هذا الفضاء كوكيل ذكاء اصطناعي عام ومفتوح المصدر يجذب الانتباه، مصمم ليعمل كرفيق رقمي قادر على فهم التعليمات باللغة الطبيعية وتنفيذ المهام المعقدة في العالم الواقعي بشكل مباشر نيابة عنك. تم تطويره بواسطة Kortix AI وتم إصداره بموجب ترخيص Apache 2.0 المخفف، وتتميز Suna بدمج مجموعة قوية من الأدوات مع واجهة محادثة، بهدف سد الفجوة بين نية المستخدم والعمل الرقمي الملموس.

على عكس أدوات الذكاء الاصطناعي المتخصصة، تكمن قوة Suna في مرونتها. تم بناؤها لتنظيم قدرات متنوعة - من تصفح الويب وإدارة الملفات إلى تنفيذ التعليمات البرمجية والتفاعل مع واجهات برمجة التطبيقات - جميعها مدفوعة بإشعاراتك المحادثية. يوفر هذا المقال نظرة عامة على قدرات Suna الأساسية وهندستها، يليه دليل تفصيلي خطوة بخطوة حول كيفية إعداد وتشغيل مثيلك المحلي، مما يمكّنك من الاستفادة من هذا الوكيل القوي في بيئتك الخاصة.

💡
هل ترغب في أداة اختبار واجهة برمجة التطبيقات رائعة تنتج وثائق واجهة برمجة التطبيقات الجميلة?

هل ترغب في منصة متكاملة، شاملة، لفريق المطورين الخاص بك للعمل معًا بأقصى ميزة إنتاجية?

تقدم Apidog جميع طلباتك، وتحل محل Postman بسعر أكثر قابلية للتحمل بكثير!
زر

ما هو Suna AI وكيف يعمل Suna AI؟

لفهم ما يمكن أن تفعله Suna، من الضروري أن نفهم الأدوات التي تمتلكها. تسمح هذه القدرات لها بالتفاعل مع العالم الرقمي مثل المستخدم البشري، ولكن بطريقة مؤتمتة ومدفوعة بالذكاء الاصطناعي.

  1. أتمتة المتصفح (عبر Playwright): يمكن لـ Suna تشغيل والتحكم في مثيل متصفح ويب داخل بيئتها الآمنة. وهذا يعني أنها يمكنها التنقل إلى عناوين URL محددة، وتسجيل الدخول إلى مواقع الويب (إذا تم توفير بيانات الاعتماد بشكل آمن)، والنقر على الأزرار، وملء النماذج، والتمرير عبر الصفحات، والأهم من ذلك، استخراج البيانات مباشرة من محتوى صفحات الويب. تفتح هذه القدرة الكم الهائل من المعلومات والوظائف المتاحة على الويب للأتمتة.
  2. إدارة الملفات: الوكيل ليس محدودًا فقط بالبيانات على الويب. لديه القدرة على التفاعل مع نظام الملفات داخل بيئته المنعزلة. وهذا يشمل إنشاء ملفات جديدة (مثل التقارير أو تصديرات البيانات)، وقراءة الوثائق الحالية، وتحرير محتواها، وتنظيم الملفات في أدلة. هذا أمر حيوي للمهام التي تتضمن إنشاء مخرجات أو معالجة بيانات محلية.
  3. زحف الويب & البحث المعزز: بالإضافة إلى تصفح صفحة واحدة، يمكن لـ Suna الزحف المنتظم إلى المواقع (متبعًا الروابط) لجمع معلومات شاملة. يمكنها أيضًا التكامل مع واجهات برمجة تطبيقات البحث المخصصة (مثل تكامل Tavily الاختياري) لأداء استرجاع معلومات يستهدف بشكل أكثر تطورًا من استخدام محركات البحث العادية، مما يتيح قدرات بحث أعمق.
  4. تنفيذ سطر الأوامر: داخل حاوية Docker الآمنة الخاصة بها، تتمتع Suna بالقدرة على تنفيذ أوامر shell. تسمح هذه الميزة القوية لها بتشغيل البرامج النصية، واستخدام وحدات سطر الأوامر الأخرى، والتفاعل مع موارد النظام (ضمن حدود الحاوية)، وقد تعمل على أتمتة المهام مثل بناء البرنامج أو النشر إذا تم تكوينها بشكل ملائم. الأمان هو الأهم هنا، يتم التعامل معه بواسطة البيئة المعزولة.
  5. تكامل واجهة برمجة التطبيقات (عبر RapidAPI & المكالمات المباشرة): يمكن لـ Suna إجراء مكالمات إلى واجهات برمجة التطبيقات الخارجية. وهذا يسمح لها بالاتصال بنظام بيئي واسع من الخدمات التابعة. تسلط الوثائق الضوء على تكامل RapidAPI الاختياري، مما يمكّن الوصول إلى موفري بيانات مختلفين (مثل بيانات LinkedIn، المعلومات المالية، إلخ)، ولكن يمكن أيضًا تكوينها للتفاعل مباشرة مع واجهات برمجة التطبيقات RESTful الأخرى، مما يزيد بشكل كبير من إمكانياتها في جمع البيانات واتخاذ الإجراءات.
  6. تفسير الشفرات البرمجية: تشمل Suna القدرة على تنفيذ مقاطع من الشفرات (أساسًا بايثون) داخل بيئتها الآمنة. هذا ليس فقط لتشغيل النصوص الموجودة، ولكن يسمح للوكيل بإنشاء رمز ديناميكيًا وتشغيله لأداء عمليات حسابية معقدة، تحليل البيانات، معالجة المنطق المخصص، أو التحولات التي تتجاوز قدرات أدواتها الأخرى.

تكمن القوة الحقيقية لـ Suna في قدرة الذكاء الاصطناعي على اختيار وتنسيق هذه الأدوات بشكل مناسب استنادًا إلى طلب المستخدم. قد تؤدي تعليمات واحدة إلى تنشيط سير عمل يتضمن البحث على الويب، استخراج البيانات، معالجتها باستخدام الشفرة المفسرة، تنسيق النتيجة في ملف، وحفظها - كل ذلك يتم إدارته بواسطة الوكيل.

بنية Suna: المكونات المعنية

لفهم عملية الإعداد، يتطلب الأمر فهمًا أساسيًا للمكونات المعمارية الرئيسية لـ Suna:

  1. واجهات برمجة التطبيقات الخلفية (بايثون/FastAPI): المنطق الأساسي هنا. يدير طلبات المستخدمين، ويحافظ على حالة المحادثة، وينظم استخدام الوكيل للأدوات، ويتولى الاتصال مع نموذج اللغة الكبير المختار (LLM) عبر LiteLLM (مما يوفر مرونة مع مزودين مثل OpenAI وAnthropic).
  2. الواجهة الأمامية (Next.js/React): هذا هو التطبيق الويب الموجه للمستخدم. يوفر واجهة محادثة للتفاعل مع Suna، ويعرض النتائج، ويشمل عناصر لوحة التحكم لمراقبة نشاط الوكيل.
  3. بيئة Docker للوكيل (عبر Daytona): الأمان والعزلة أمران حاسمان. تعمل كل مهمة وكيل داخل حاوية Docker مخصصة يتم إدارتها بواسطة Daytona. تحتوي هذه الحاوية على جميع الأدوات الضرورية (متصفح، مفسر الشفرة، الوصول إلى نظام الملفات) وتمنع الوكيل من التدخل في النظام المضيف.
  4. قاعدة بيانات Supabase (PostgreSQL): تتولى جميع احتياجات الحفاظ على البيانات، بما في ذلك حسابات المستخدمين والمصادقة، تاريخ المحادثات، التخزين للملفات التي تم إنشاؤها بواسطة الوكيل، تتبع حالة الوكيل، وربما التحليلات.

تعمل هذه المكونات معًا، تتواصل عبر واجهات برمجة التطبيقات، لتقديم تجربة Suna. يتطلب إعداد الاستضافة الذاتية تكوين وتشغيل هذه الأجزاء المتصلة.

كيف يمكن إعداد Suna AI

تشغيل Suna بنفسك يوفر أكبر قدر من التحكم والخصوصية. الخطوات التالية توجهك خلال عملية الإعداد:

المرحلة 1: جمع المتطلبات الأساسية

قبل تثبيت Suna، تحتاج إلى العديد من الخدمات الخارجية والاعتمادات:

مشروع Supabase:

قاعدة بيانات Redis:

حساب Daytona & تكوين الصورة:

مفتاح API لنموذج اللغة الكبير:

(اختياري) مفتاح API Tavily: للحصول على نتائج بحث أفضل. احصل على مفتاح من Tavily AI.

(اختياري) مفتاح API RapidAPI: إذا كنت تنوي استخدام تكاملات مسبقة البناء تحتاج إليها (مثل حاصرات ويب معينة).

المرحلة 2: التثبيت والتكوين

الآن، قم بتكوين مكونات تطبيق Suna:

استنساخ المستودع:

git clone https://github.com/kortix-ai/suna.git
cd suna

تكوين الخلفية (.env):

NEXT_PUBLIC_URL="http://localhost:3000" # أو عنوان URL للواجهة الأمامية الخاص بك إذا كان مختلفًا

# Supabase
SUPABASE_URL=YOUR_SUPABASE_URL
SUPABASE_ANON_KEY=YOUR_SUPABASE_ANON_KEY
SUPABASE_SERVICE_ROLE_KEY=YOUR_SUPABASE_SERVICE_ROLE_KEY

# Redis
REDIS_HOST=YOUR_REDIS_HOST
REDIS_PORT=YOUR_REDIS_PORT
REDIS_PASSWORD=YOUR_REDIS_PASSWORD # اترك فارغاً إذا لم يكن هناك
REDIS_SSL=True # أو False لـ Redis المحلي بدون SSL

# Daytona
DAYTONA_API_KEY=YOUR_DAYTONA_API_KEY
DAYTONA_SERVER_URL="https://app.daytona.io/api"
DAYTONA_TARGET="us" # أو منطقتك

# --- تكوين LLM (املأ مجموعة واحدة فقط) ---
# مثال Anthropic:
ANTHROPIC_API_KEY=YOUR_ANTHROPIC_API_KEY
MODEL_TO_USE="anthropic/claude-3-5-sonnet-latest" # أو نموذج Claude آخر
OPENAI_API_KEY=
# مثال OpenAI:
# ANTHROPIC_API_KEY=
# OPENAI_API_KEY=YOUR_OPENAI_API_KEY
# MODEL_TO_USE="gpt-4o" # أو نموذج OpenAI آخر
# -----------------------------------------

# اختياري
TAVILY_API_KEY=YOUR_TAVILY_API_KEY # اختياري
RAPID_API_KEY=YOUR_RAPID_API_KEY # اختياري

إعداد مخطط قاعدة بيانات Supabase:

تكوين الواجهة الأمامية (.env.local):

NEXT_PUBLIC_SUPABASE_URL=YOUR_SUPABASE_URL # كما هو في الخلفية .env
NEXT_PUBLIC_SUPABASE_ANON_KEY=YOUR_SUPABASE_ANON_KEY # كما هو في الخلفية .env
NEXT_PUBLIC_BACKEND_URL="http://localhost:8000/api" # الموقع الافتراضي للخلفية
NEXT_PUBLIC_URL="http://localhost:3000" # الموقع الافتراضي للواجهة الأمامية

تثبيت الاعتمادات:

# في دليل الواجهة الأمامية
npm install
# في دليل الخلفية (استخدم بيئة افتراضية!)
# python -m venv venv
# source venv/bin/activate  OR .\venv\Scripts\activate (Windows)
pip install -r requirements.txt

المرحلة 3: تشغيل Suna

بدء خدمة الخلفية:

بدء خدمة الواجهة الأمامية:

الوصول إلى مثيل Suna الخاص بك:

الخاتمة

تمثل Suna AI خطوة عملية نحو وكلاء الذكاء الاصطناعي المستقلين القادرين على تنفيذ المهام في المجال الرقمي. طبيعتها المفتوحة المصدر، إلى جانب مجموعة أدوات قوية وهندسة معمارية نمطية، تجعلها خيارًا جذابًا للمطورين والمستخدمين الذين يبحثون عن مساعد ذكي قابل للتخصيص ويمكن استضافته ذاتيًا. من خلال اتباع عملية الإعداد التفصيلية الموضحة أعلاه، يمكنك نشر مثيلك الخاص من Suna، مما يمنحك واجهة محادثة لأتمتة التصفح، والتلاعب بالملفات، وجمع البيانات، وتنفيذ الشفرات، والمزيد، كلها ضمن بيئة تسيطر عليها. بينما يتطلب إعدادها اهتمامًا دقيقًا لمكوناتها المتعددة، فإن النتيجة هي وكيل ذكاء اصطناعي متعدد الاستخدامات جاهز للعمل نيابة عنك.

💡
هل ترغب في أداة اختبار واجهة برمجة التطبيقات رائعة تنتج وثائق واجهة برمجة التطبيقات الجميلة?

هل ترغب في منصة متكاملة، شاملة، لفريق المطورين الخاص بك للعمل معًا بأقصى ميزة إنتاجية?

تقدم Apidog جميع طلباتك، وتحل محل Postman بسعر أكثر قابلية للتحمل بكثير!
زر

ممارسة تصميم API في Apidog

اكتشف طريقة أسهل لبناء واستخدام واجهات برمجة التطبيقات