Skip to content
Cette page a été générée et traduite avec l'aide de l'IA. Si vous remarquez des inexactitudes, n'hésitez pas à contribuer. Modifier sur GitHub

Routeur LLM

Le routeur PRX est un systeme intelligent de selection de modeles qui choisit automatiquement le meilleur fournisseur et modele LLM pour chaque requete. Il equilibre qualite, cout et latence en utilisant plusieurs strategies de routage.

Apercu

Au lieu d'utiliser toujours un seul modele, le routeur selectionne dynamiquement parmi les modeles configures en fonction de :

  • La complexite et le type de la requete
  • Les scores de capacite et classements Elo des modeles
  • Les contraintes de cout
  • Les exigences de latence
  • Les donnees de performance historiques

Strategies de routage

StrategieDescriptionIdeal pour
HeuristiqueScoring base sur des regles utilisant les caracteristiques de la requeteConfigurations simples, comportement previsible
KNNSimilarite semantique avec les requetes passees reussiesRoutage appris, haute precision
AutomixCommencer economique, escalader en cas de faible confianceOptimisation des couts

Configuration

toml
[router]
enabled = true
strategy = "heuristic"  # "heuristic" | "knn" | "automix"
default_model = "anthropic/claude-sonnet-4-6"

[router.models]
cheap = "anthropic/claude-haiku"
standard = "anthropic/claude-sonnet-4-6"
premium = "anthropic/claude-opus-4-6"

Pages associees

Released under the Apache-2.0 License.