نظام التطور الذاتي
يتضمن PRX نظام تطور ذاتي من 3 طبقات يمكّن الوكلاء من تحسين سلوكهم بشكل مستقل مع مرور الوقت. يحلل النظام أداء الوكيل باستمرار ويطبق تحسينات متدرجة، من تحسين الذاكرة إلى ضبط المطالبات ثم تغييرات السياسات الاستراتيجية.
نظرة عامة
يُنظَّم التطور الذاتي في ثلاث طبقات، تعمل كل منها على مستوى مختلف من التجريد:
| الطبقة | النطاق | التكرار | المخاطر |
|---|---|---|---|
| L1: الذاكرة | ضغط الذاكرة، تجميع المواضيع | كل جلسة | منخفض |
| L2: المطالبة | تحسين مطالبة النظام، A/B testing | يومي/أسبوعي | متوسط |
| L3: الاستراتيجية | سياسات الأدوات، قواعد التوجيه، الحوكمة | أسبوعي/شهري | مرتفع |
المعمارية
┌───────────────────────────────────────┐
│ Self-Evolution Engine │
│ │
│ L3: Strategy ← Low frequency │
│ ├── Tool policy tuning │
│ ├── Routing optimization │
│ └── Governance adjustments │
│ │
│ L2: Prompt ← Medium frequency │
│ ├── System prompt refinement │
│ └── A/B testing framework │
│ │
│ L1: Memory ← High frequency │
│ ├── Memory compaction │
│ └── Topic clustering │
└───────────────────────────────────────┘السلامة أولًا
يمر كل مقترح تطور عبر خط أنابيب أمان قبل التنفيذ. راجع السلامة للتفاصيل حول حماية rollback وفحوصات sanity.
الإعداد
toml
[self_evolution]
enabled = false # opt-in only
auto_apply = false # require manual approval by default
[self_evolution.l1]
enabled = true
schedule = "after_session"
[self_evolution.l2]
enabled = false
schedule = "weekly"
[self_evolution.l3]
enabled = false
schedule = "monthly"
require_approval = true