Skip to content
Эта страница создана и переведена с помощью ИИ. Если вы заметили неточности, помогите нам улучшить её. Редактировать на GitHub

Automix-маршрутизатор

Automix-маршрутизатор оптимизирует затраты, начиная каждый запрос с дешёвой модели и переходя к премиальной модели только при низком балле уверенности начального ответа.

Как это работает

  1. Начальный запрос -- отправка запроса дешёвой модели
  2. Проверка уверенности -- оценка балла уверенности ответа
  3. Эскалация при необходимости -- если уверенность ниже порога, повторный запрос к премиальной модели
  4. Возврат -- возврат первого уверенного ответа

Скоринг уверенности

Уверенность оценивается на основе:

  • Самооценка уверенности в ответе
  • Наличие хеджирующих формулировок ("я не уверен", "возможно")
  • Энтропия на уровне токенов ответа
  • Доля успешных вызовов инструментов

Конфигурация

toml
[router]
strategy = "automix"

[router.automix]
enabled = true
confidence_threshold = 0.7
cheap_model = "anthropic/claude-haiku"
premium_model = "anthropic/claude-opus-4-6"
max_escalations = 1

Экономия затрат

В типичном использовании Automix направляет 60-80% запросов к дешёвой модели, достигая значительной экономии при сохранении качества для сложных запросов.

Связанные страницы

Released under the Apache-2.0 License.