Skip to content
تم إنشاء هذه الصفحة وترجمتها بمساعدة الذكاء الاصطناعي. إذا لاحظت أي أخطاء، لا تتردد في المساهمة في تحسينها. تعديل على GitHub

الموجّه الاستدلالي

يستخدم الموجّه الاستدلالي نظام تقييم قائمًا على القواعد لاختيار النموذج الأمثل لكل استعلام. يحلل خصائص الاستعلام (الطول، التعقيد، متطلبات الأدوات) ويطابقها مع ملفات قدرات النماذج.

كيف يعمل

  1. استخراج الخصائص -- تحليل الاستعلام للطول وأنماط الكلمات المفتاحية ومتطلبات الأدوات
  2. تقييم القدرات -- تقييم ملاءمة كل نموذج بناءً على الخصائص المستخرجة
  3. وزن التكلفة -- تطبيق تفضيلات التكلفة لتفضيل النماذج الأرخص للاستعلامات البسيطة
  4. الاختيار -- اختيار النموذج الأعلى تقييمًا الذي يحقق الحد الأدنى من عتبات الجودة

عوامل التقييم

العاملالوزنالوصف
مطابقة القدرات0.4قدرة النموذج على معالجة نوع الاستعلام
تقييم Elo0.2الأداء التاريخي للنموذج
كفاءة التكلفة0.2Tokens per dollar
زمن الاستجابة0.1متوسط وقت الاستجابة
نافذة السياق0.1مدى ملاءمة سياق المحادثة

الإعداد

toml
[router]
strategy = "heuristic"

[router.heuristic]
complexity_threshold = 0.6
prefer_cheap_below = 0.4
elo_weight = 0.2
cost_weight = 0.2

صفحات ذات صلة

Released under the Apache-2.0 License.