Skip to content
Esta página fue generada y traducida con asistencia de IA. Si encuentra alguna imprecisión, no dude en ayudar a mejorarla. Editar en GitHub

Router KNN

El router KNN (K-Nearest Neighbors) usa similitud semantica para comparar consultas entrantes contra una base de datos de consultas historicas con asignaciones de modelos optimos conocidas. Esto permite un enrutamiento aprendido que mejora con el tiempo.

Como funciona

  1. Embeber consulta -- convertir la consulta entrante en un embedding vectorial
  2. Busqueda KNN -- encontrar las K consultas pasadas mas similares en el almacen de embeddings
  3. Votacion -- agregar las asignaciones de modelo de los K vecinos
  4. Seleccion -- elegir el modelo con mas votos (ponderados por similitud)

Datos de entrenamiento

El router KNN construye su conjunto de datos a partir de:

  • Registros de sesion del agente con calificaciones de calidad
  • Resultados de pruebas A/B de la evolucion de prompts
  • Retroalimentacion manual y correcciones

Configuracion

toml
[router]
strategy = "knn"

[router.knn]
k = 5
embedding_provider = "ollama"
embedding_model = "nomic-embed-text"
min_similarity = 0.6
min_dataset_size = 100
fallback_strategy = "heuristic"

Arranque en frio

Cuando no hay suficientes datos de entrenamiento disponibles (por debajo de min_dataset_size), el router KNN recurre a la estrategia heuristica.

Paginas relacionadas

Released under the Apache-2.0 License.