Skip to content
تم إنشاء هذه الصفحة وترجمتها بمساعدة الذكاء الاصطناعي. إذا لاحظت أي أخطاء، لا تتردد في المساهمة في تحسينها. تعديل على GitHub

نموذج التهديد

توثق هذه الصفحة نموذج التهديد في PRX: مجموعة التهديدات التي نأخذها بالحسبان، وافتراضات الأمان لدينا، وإجراءات التخفيف المعتمدة.

فئات التهديد

1. Prompt Injection

التهديد: محتوى عدائي في مدخلات المستخدم أو البيانات المسترجعة يوجّه الوكيل لتنفيذ إجراءات غير مقصودة.

إجراءات التخفيف:

  • سير عمل الموافقة على استدعاءات الأدوات
  • محرك السياسات يقيّد الإجراءات المتاحة
  • تعقيم المدخلات لأنماط الحقن المعروفة

2. إساءة استخدام الأدوات

التهديد: يستخدم الوكيل الأدوات بطرق غير مقصودة (مثل قراءة ملفات حساسة أو تنفيذ طلبات شبكة غير مصرح بها).

إجراءات التخفيف:

  • عزل sandbox لتنفيذ الأدوات
  • محرك سياسات بقواعد رفض افتراضي
  • تحديد معدل لكل أداة
  • تسجيل تدقيق لجميع استدعاءات الأدوات

3. تسريب البيانات

التهديد: إرسال بيانات حساسة من النظام المحلي إلى خدمات خارجية عبر سياق LLM أو استدعاءات الأدوات.

إجراءات التخفيف:

  • قائمة سماح للشبكة داخل sandbox
  • تصفية المحتوى للأنماط الحساسة (مفاتيح API، كلمات المرور)
  • قواعد سياسات تقيّد تدفق البيانات

4. سلسلة التوريد

التهديد: إضافات أو تبعيات خبيثة تُخترق الوكيل.

إجراءات التخفيف:

  • WASM sandbox للإضافات
  • ملفات manifest لصلاحيات الإضافات
  • تدقيق التبعيات (cargo audit)

افتراضات الأمان

  • نظام التشغيل المضيف موثوق
  • مزودو LLM يتعاملون مع مفاتيح API بأمان
  • المستخدم مسؤول عن مراجعة إجراءات الوكيل عندما تكون الموافقة مطلوبة

الإبلاغ عن الثغرات

إذا اكتشفت ثغرة أمنية، يُرجى الإبلاغ عنها إلى [email protected].

صفحات ذات صلة

Released under the Apache-2.0 License.