Skip to content
Эта страница создана и переведена с помощью ИИ. Если вы заметили неточности, помогите нам улучшить её. Редактировать на GitHub

Эвристический маршрутизатор

Эвристический маршрутизатор использует систему скоринга на основе правил для выбора оптимальной модели для каждого запроса. Он анализирует признаки запроса (длина, сложность, требования к инструментам) и сопоставляет их с профилями возможностей модели.

Как это работает

  1. Извлечение признаков -- анализ запроса по длине, паттернам ключевых слов и требованиям к инструментам
  2. Скоринг возможностей -- оценка пригодности каждой модели на основе извлечённых признаков
  3. Весовой коэффициент стоимости -- применение предпочтений стоимости для предпочтения дешёвых моделей для простых запросов
  4. Выбор -- выбор модели с наивысшим баллом, удовлетворяющей минимальным порогам качества

Факторы скоринга

ФакторВесОписание
Совпадение возможностей0.4Способность модели обработать тип запроса
Рейтинг Elo0.2Историческая производительность модели
Экономичность0.2Токенов за доллар
Задержка0.1Среднее время ответа
Контекстное окно0.1Вмещение контекста разговора

Конфигурация

toml
[router]
strategy = "heuristic"

[router.heuristic]
complexity_threshold = 0.6
prefer_cheap_below = 0.4
elo_weight = 0.2
cost_weight = 0.2

Связанные страницы

Released under the Apache-2.0 License.