Skip to content
このページは AI の支援により作成・翻訳されました。誤りがあれば、改善にご協力ください。 GitHub で編集

ヒューリスティックルーター

ヒューリスティックルーターは、ルールベースのスコアリングシステムを使用して各クエリに最適なモデルを選択します。クエリの特徴(長さ、複雑さ、ツール要件)を分析し、モデルの機能プロファイルと照合します。

仕組み

  1. 特徴抽出 -- クエリの長さ、キーワードパターン、ツール要件を分析
  2. 機能スコアリング -- 抽出された特徴に基づいて各モデルの適合性をスコアリング
  3. コスト重み付け -- シンプルなクエリにはより安価なモデルを優先するコスト設定を適用
  4. 選択 -- 最小品質しきい値を満たす最高スコアのモデルを選択

スコアリング要素

要素重み説明
機能マッチ0.4クエリタイプを処理するモデルの能力
Elo レーティング0.2モデルの履歴パフォーマンス
コスト効率0.2ドルあたりのトークン数
レイテンシ0.1平均応答時間
コンテキストウィンドウ0.1会話コンテキストへの適合

設定

toml
[router]
strategy = "heuristic"

[router.heuristic]
complexity_threshold = 0.6
prefer_cheap_below = 0.4
elo_weight = 0.2
cost_weight = 0.2

関連ページ

Released under the Apache-2.0 License.