نموذج التهديد
توثق هذه الصفحة نموذج التهديد في PRX: مجموعة التهديدات التي نأخذها بالحسبان، وافتراضات الأمان لدينا، وإجراءات التخفيف المعتمدة.
فئات التهديد
1. Prompt Injection
التهديد: محتوى عدائي في مدخلات المستخدم أو البيانات المسترجعة يوجّه الوكيل لتنفيذ إجراءات غير مقصودة.
إجراءات التخفيف:
- سير عمل الموافقة على استدعاءات الأدوات
- محرك السياسات يقيّد الإجراءات المتاحة
- تعقيم المدخلات لأنماط الحقن المعروفة
2. إساءة استخدام الأدوات
التهديد: يستخدم الوكيل الأدوات بطرق غير مقصودة (مثل قراءة ملفات حساسة أو تنفيذ طلبات شبكة غير مصرح بها).
إجراءات التخفيف:
- عزل sandbox لتنفيذ الأدوات
- محرك سياسات بقواعد رفض افتراضي
- تحديد معدل لكل أداة
- تسجيل تدقيق لجميع استدعاءات الأدوات
3. تسريب البيانات
التهديد: إرسال بيانات حساسة من النظام المحلي إلى خدمات خارجية عبر سياق LLM أو استدعاءات الأدوات.
إجراءات التخفيف:
- قائمة سماح للشبكة داخل sandbox
- تصفية المحتوى للأنماط الحساسة (مفاتيح API، كلمات المرور)
- قواعد سياسات تقيّد تدفق البيانات
4. سلسلة التوريد
التهديد: إضافات أو تبعيات خبيثة تُخترق الوكيل.
إجراءات التخفيف:
- WASM sandbox للإضافات
- ملفات manifest لصلاحيات الإضافات
- تدقيق التبعيات (cargo audit)
افتراضات الأمان
- نظام التشغيل المضيف موثوق
- مزودو LLM يتعاملون مع مفاتيح API بأمان
- المستخدم مسؤول عن مراجعة إجراءات الوكيل عندما تكون الموافقة مطلوبة
الإبلاغ عن الثغرات
إذا اكتشفت ثغرة أمنية، يُرجى الإبلاغ عنها إلى [email protected].