Skip to content
Diese Seite wurde mit KI-Unterstützung erstellt und übersetzt. Falls Ihnen Ungenauigkeiten auffallen, helfen Sie gerne bei der Verbesserung. Auf GitHub bearbeiten

LLM-Router

Der PRX-Router ist ein intelligentes Modellauswahlsystem, das automatisch den besten LLM-Anbieter und das beste Modell fur jede Anfrage wahlt. Er balanciert Qualitat, Kosten und Latenz durch mehrere Routing-Strategien.

Ubersicht

Anstatt immer ein einzelnes Modell zu verwenden, wahlt der Router dynamisch aus konfigurierten Modellen basierend auf:

  • Abfragekomplexitat und -typ
  • Modellfahigkeits-Scores und Elo-Bewertungen
  • Kostenbeschrankungen
  • Latenzanforderungen
  • Historische Leistungsdaten

Routing-Strategien

StrategieBeschreibungGeeignet fur
HeuristischRegelbasierte Bewertung anhand von AbfragemerkmalenEinfache Setups, vorhersagbares Verhalten
KNNSemantische Ahnlichkeit zu vergangenen erfolgreichen AbfragenGelerntes Routing, hohe Genauigkeit
AutomixGunstig starten, bei niedriger Konfidenz eskalierenKostenoptimierung

Konfiguration

toml
[router]
enabled = true
strategy = "heuristic"  # "heuristic" | "knn" | "automix"
default_model = "anthropic/claude-sonnet-4-6"

[router.models]
cheap = "anthropic/claude-haiku"
standard = "anthropic/claude-sonnet-4-6"
premium = "anthropic/claude-opus-4-6"

Verwandte Seiten

Released under the Apache-2.0 License.