Skip to content
このページは AI の支援により作成・翻訳されました。誤りがあれば、改善にご協力ください。 GitHub で編集

LLM ルーター

PRX ルーターは、各リクエストに対して最適な LLM プロバイダーとモデルを自動的に選択するインテリジェントなモデル選択システムです。複数のルーティング戦略を使用して、品質、コスト、レイテンシのバランスを取ります。

概要

常に単一のモデルを使用する代わりに、ルーターは以下に基づいて設定されたモデルから動的に選択します:

  • クエリの複雑さとタイプ
  • モデルの機能スコアと Elo レーティング
  • コスト制約
  • レイテンシ要件
  • 履歴パフォーマンスデータ

ルーティング戦略

戦略説明最適な用途
ヒューリスティッククエリ特徴を使用したルールベースのスコアリングシンプルなセットアップ、予測可能な動作
KNN過去の成功クエリとのセマンティック類似度学習型ルーティング、高精度
Automix安価に開始し、信頼度が低い場合にエスカレーションコスト最適化

設定

toml
[router]
enabled = true
strategy = "heuristic"  # "heuristic" | "knn" | "automix"
default_model = "anthropic/claude-sonnet-4-6"

[router.models]
cheap = "anthropic/claude-haiku"
standard = "anthropic/claude-sonnet-4-6"
premium = "anthropic/claude-opus-4-6"

関連ページ

Released under the Apache-2.0 License.