Skip to content
تم إنشاء هذه الصفحة وترجمتها بمساعدة الذكاء الاصطناعي. إذا لاحظت أي أخطاء، لا تتردد في المساهمة في تحسينها. تعديل على GitHub

L2: تطور المطالبة

تعمل الطبقة 2 بتكرار متوسط لتحسين مطالبات النظام الخاصة بالوكيل. تحلل مؤشرات جودة المحادثة وتقترح تعديلات على المطالبة، ثم تختبرها عبر إطار A/B قبل الاعتماد الدائم.

نظرة عامة

يعالج تطور L2 ما يلي:

  • System prompt refinement -- تحسين وضوح التعليمات وتغطية المهام
  • Persona tuning -- ضبط النبرة والإسهاب وأسلوب التواصل
  • Tool usage instructions -- تحسين طريقة وصف الأدوات إلى LLM
  • A/B testing -- التحقق إحصائيًا من تغييرات المطالبة قبل الإطلاق

إطار A/B testing

عند اقتراح تعديل على المطالبة، يشغّل L2 كلًا من المطالبة الأصلية والمعدلة بالتوازي لفترة تقييم قابلة للضبط:

  1. Split traffic -- التناوب بين المطالبات الأصلية والمرشحة
  2. Collect metrics -- تتبع إنجاز المهام ورضا المستخدم وكفاءة استخدام الأدوات
  3. Statistical test -- تطبيق اختبار الدلالة لتحديد الفائز
  4. Promote or rollback -- اعتماد الفائز أو الإبقاء على الأصل

الإعداد

toml
[self_evolution.l2]
enabled = false
schedule = "weekly"
min_samples = 50
confidence_level = 0.95
max_concurrent_experiments = 2

صفحات ذات صلة

Released under the Apache-2.0 License.