Skip to content
Эта страница создана и переведена с помощью ИИ. Если вы заметили неточности, помогите нам улучшить её. Редактировать на GitHub

LLM-маршрутизатор

Маршрутизатор PRX -- это интеллектуальная система выбора модели, автоматически подбирающая наилучшего LLM-провайдера и модель для каждого запроса. Он балансирует качество, стоимость и задержку с помощью нескольких стратегий маршрутизации.

Обзор

Вместо постоянного использования одной модели маршрутизатор динамически выбирает из настроенных моделей на основе:

  • Сложности и типа запроса
  • Баллов возможностей модели и рейтингов Elo
  • Ограничений стоимости
  • Требований к задержке
  • Исторических данных производительности

Стратегии маршрутизации

СтратегияОписаниеЛучше всего для
ЭвристическаяСкоринг на основе правил по признакам запросаПростые настройки, предсказуемое поведение
KNNСемантическое сходство с прошлыми успешными запросамиОбучаемая маршрутизация, высокая точность
AutomixНачать с дешёвой модели, эскалировать при низкой уверенностиОптимизация затрат

Конфигурация

toml
[router]
enabled = true
strategy = "heuristic"  # "heuristic" | "knn" | "automix"
default_model = "anthropic/claude-sonnet-4-6"

[router.models]
cheap = "anthropic/claude-haiku"
standard = "anthropic/claude-sonnet-4-6"
premium = "anthropic/claude-opus-4-6"

Связанные страницы

Released under the Apache-2.0 License.