موجّه LLM
موجّه PRX هو نظام ذكي لاختيار النماذج يختار تلقائيًا أفضل مزوّد LLM وأفضل نموذج لكل طلب. يوازن بين الجودة والتكلفة وزمن الاستجابة باستخدام عدة استراتيجيات توجيه.
نظرة عامة
بدل استخدام نموذج واحد دائمًا، يختار الموجّه ديناميكيًا من النماذج المُعدّة بناءً على:
- تعقيد الاستعلام ونوعه
- درجات قدرات النماذج وتقييمات Elo
- قيود التكلفة
- متطلبات زمن الاستجابة
- بيانات الأداء التاريخية
استراتيجيات التوجيه
| الاستراتيجية | الوصف | الأنسب لـ |
|---|---|---|
| Heuristic | تقييم قائم على القواعد باستخدام خصائص الاستعلام | إعدادات بسيطة وسلوك متوقع |
| KNN | تشابه دلالي مع استعلامات سابقة ناجحة | توجيه متعلّم ودقة عالية |
| Automix | البدء برخيص ثم التصعيد عند انخفاض الثقة | تحسين التكلفة |
الإعداد
toml
[router]
enabled = true
strategy = "heuristic" # "heuristic" | "knn" | "automix"
default_model = "anthropic/claude-sonnet-4-6"
[router.models]
cheap = "anthropic/claude-haiku"
standard = "anthropic/claude-sonnet-4-6"
premium = "anthropic/claude-opus-4-6"