Skip to content
Esta página fue generada y traducida con asistencia de IA. Si encuentra alguna imprecisión, no dude en ayudar a mejorarla. Editar en GitHub

Router LLM

El router de PRX es un sistema inteligente de seleccion de modelos que elige automaticamente el mejor proveedor LLM y modelo para cada solicitud. Equilibra calidad, costo y latencia usando multiples estrategias de enrutamiento.

Vision general

En lugar de usar siempre un unico modelo, el router selecciona dinamicamente entre los modelos configurados basandose en:

  • Complejidad y tipo de consulta
  • Puntuaciones de capacidad del modelo y ratings Elo
  • Restricciones de costo
  • Requisitos de latencia
  • Datos historicos de rendimiento

Estrategias de enrutamiento

EstrategiaDescripcionMejor para
HeuristicoPuntuacion basada en reglas usando caracteristicas de la consultaConfiguraciones simples, comportamiento predecible
KNNSimilitud semantica con consultas exitosas pasadasEnrutamiento aprendido, alta precision
AutomixComenzar barato, escalar con baja confianzaOptimizacion de costos

Configuracion

toml
[router]
enabled = true
strategy = "heuristic"  # "heuristic" | "knn" | "automix"
default_model = "anthropic/claude-sonnet-4-6"

[router.models]
cheap = "anthropic/claude-haiku"
standard = "anthropic/claude-sonnet-4-6"
premium = "anthropic/claude-opus-4-6"

Paginas relacionadas

Released under the Apache-2.0 License.