Skip to content
Esta página fue generada y traducida con asistencia de IA. Si encuentra alguna imprecisión, no dude en ayudar a mejorarla. Editar en GitHub

Router heuristico

El router heuristico usa un sistema de puntuacion basado en reglas para seleccionar el modelo optimo para cada consulta. Analiza las caracteristicas de la consulta (longitud, complejidad, requisitos de herramientas) y las compara con los perfiles de capacidad de cada modelo.

Como funciona

  1. Extraccion de caracteristicas -- analizar la consulta en busca de longitud, patrones de palabras clave y requisitos de herramientas
  2. Puntuacion de capacidades -- puntuar la idoneidad de cada modelo basandose en las caracteristicas extraidas
  3. Ponderacion de costo -- aplicar preferencias de costo para favorecer modelos mas economicos en consultas simples
  4. Seleccion -- elegir el modelo con mayor puntuacion que cumpla los umbrales minimos de calidad

Factores de puntuacion

FactorPesoDescripcion
Coincidencia de capacidad0.4Capacidad del modelo para manejar el tipo de consulta
Rating Elo0.2Rendimiento historico del modelo
Eficiencia de costo0.2Tokens por dolar
Latencia0.1Tiempo de respuesta promedio
Ventana de contexto0.1Se ajusta al contexto de la conversacion

Configuracion

toml
[router]
strategy = "heuristic"

[router.heuristic]
complexity_threshold = 0.6
prefer_cheap_below = 0.4
elo_weight = 0.2
cost_weight = 0.2

Paginas relacionadas

Released under the Apache-2.0 License.