L3: تطور الاستراتيجية
الطبقة 3 هي طبقة التطور الأعلى أثرًا والأقل تكرارًا. تُعدّل السلوك الاستراتيجي للوكيل: سياسات الوصول إلى الأدوات، وقواعد توجيه LLM، ومعلمات الحوكمة. بسبب أثرها الواسع، تتطلب تغييرات L3 دائمًا موافقة صريحة.
نظرة عامة
يعالج تطور L3 ما يلي:
- Tool policy tuning -- ضبط الأدوات المتاحة ومستويات أذوناتها
- Routing optimization -- تحسين إرشادات اختيار النموذج بناءً على بيانات الأداء
- Governance parameters -- ضبط حدود الأمان وتحديد المعدل وسير عمل الموافقة
- Cost optimization -- موازنة الجودة مقابل استهلاك الموارد
آلية العمل
- يجمع L3 بيانات أداء مجمّعة على مدى أسابيع/أشهر
- يحدد الأنماط (مثلًا: نموذج أرخص يتعامل مع 80% من الاستفسارات بشكل كافٍ)
- يقترح تغييرات استراتيجية مع تحليل أثر متوقع
- تُدرج التغييرات في قائمة انتظار الموافقة البشرية
- تُطبّق التغييرات المعتمدة مع إمكانية rollback تلقائي
الإعداد
toml
[self_evolution.l3]
enabled = false
schedule = "monthly"
require_approval = true
rollback_window_hours = 168 # 7 days
max_policy_changes_per_cycle = 3