Automix-маршрутизатор
Automix-маршрутизатор оптимизирует затраты, начиная каждый запрос с дешёвой модели и переходя к премиальной модели только при низком балле уверенности начального ответа.
Как это работает
- Начальный запрос -- отправка запроса дешёвой модели
- Проверка уверенности -- оценка балла уверенности ответа
- Эскалация при необходимости -- если уверенность ниже порога, повторный запрос к премиальной модели
- Возврат -- возврат первого уверенного ответа
Скоринг уверенности
Уверенность оценивается на основе:
- Самооценка уверенности в ответе
- Наличие хеджирующих формулировок ("я не уверен", "возможно")
- Энтропия на уровне токенов ответа
- Доля успешных вызовов инструментов
Конфигурация
toml
[router]
strategy = "automix"
[router.automix]
enabled = true
confidence_threshold = 0.7
cheap_model = "anthropic/claude-haiku"
premium_model = "anthropic/claude-opus-4-6"
max_escalations = 1Экономия затрат
В типичном использовании Automix направляет 60-80% запросов к дешёвой модели, достигая значительной экономии при сохранении качества для сложных запросов.