تم إنشاء هذه الصفحة وترجمتها بمساعدة الذكاء الاصطناعي. إذا لاحظت أي أخطاء، لا تتردد في المساهمة في تحسينها. تعديل على GitHub

نموذج التهديد

توثق هذه الصفحة نموذج التهديد في PRX: مجموعة التهديدات التي نأخذها بالحسبان، وافتراضات الأمان لدينا، وإجراءات التخفيف المعتمدة.

فئات التهديد

1. Prompt Injection

التهديد: محتوى عدائي في مدخلات المستخدم أو البيانات المسترجعة يوجّه الوكيل لتنفيذ إجراءات غير مقصودة.

إجراءات التخفيف:

سير عمل الموافقة على استدعاءات الأدوات
محرك السياسات يقيّد الإجراءات المتاحة
تعقيم المدخلات لأنماط الحقن المعروفة

2. إساءة استخدام الأدوات

التهديد: يستخدم الوكيل الأدوات بطرق غير مقصودة (مثل قراءة ملفات حساسة أو تنفيذ طلبات شبكة غير مصرح بها).

إجراءات التخفيف:

عزل sandbox لتنفيذ الأدوات
محرك سياسات بقواعد رفض افتراضي
تحديد معدل لكل أداة
تسجيل تدقيق لجميع استدعاءات الأدوات

3. تسريب البيانات

التهديد: إرسال بيانات حساسة من النظام المحلي إلى خدمات خارجية عبر سياق LLM أو استدعاءات الأدوات.

إجراءات التخفيف:

قائمة سماح للشبكة داخل sandbox
تصفية المحتوى للأنماط الحساسة (مفاتيح API، كلمات المرور)
قواعد سياسات تقيّد تدفق البيانات

4. سلسلة التوريد

التهديد: إضافات أو تبعيات خبيثة تُخترق الوكيل.

إجراءات التخفيف:

WASM sandbox للإضافات
ملفات manifest لصلاحيات الإضافات
تدقيق التبعيات (cargo audit)

افتراضات الأمان

نظام التشغيل المضيف موثوق
مزودو LLM يتعاملون مع مفاتيح API بأمان
المستخدم مسؤول عن مراجعة إجراءات الوكيل عندما تكون الموافقة مطلوبة

الإبلاغ عن الثغرات

إذا اكتشفت ثغرة أمنية، يُرجى الإبلاغ عنها إلى [email protected].

صفحات ذات صلة