Router KNN
El router KNN (K-Nearest Neighbors) usa similitud semantica para comparar consultas entrantes contra una base de datos de consultas historicas con asignaciones de modelos optimos conocidas. Esto permite un enrutamiento aprendido que mejora con el tiempo.
Como funciona
- Embeber consulta -- convertir la consulta entrante en un embedding vectorial
- Busqueda KNN -- encontrar las K consultas pasadas mas similares en el almacen de embeddings
- Votacion -- agregar las asignaciones de modelo de los K vecinos
- Seleccion -- elegir el modelo con mas votos (ponderados por similitud)
Datos de entrenamiento
El router KNN construye su conjunto de datos a partir de:
- Registros de sesion del agente con calificaciones de calidad
- Resultados de pruebas A/B de la evolucion de prompts
- Retroalimentacion manual y correcciones
Configuracion
toml
[router]
strategy = "knn"
[router.knn]
k = 5
embedding_provider = "ollama"
embedding_model = "nomic-embed-text"
min_similarity = 0.6
min_dataset_size = 100
fallback_strategy = "heuristic"Arranque en frio
Cuando no hay suficientes datos de entrenamiento disponibles (por debajo de min_dataset_size), el router KNN recurre a la estrategia heuristica.