Skip to content
Diese Seite wurde mit KI-Unterstützung erstellt und übersetzt. Falls Ihnen Ungenauigkeiten auffallen, helfen Sie gerne bei der Verbesserung. Auf GitHub bearbeiten

Heuristischer Router

Der heuristische Router verwendet ein regelbasiertes Bewertungssystem, um das optimale Modell fur jede Abfrage auszuwahlen. Er analysiert Abfragemerkmale (Lange, Komplexitat, Werkzeuganforderungen) und gleicht sie mit Modellfahigkeitsprofilen ab.

Funktionsweise

  1. Merkmalsextraktion -- die Abfrage auf Lange, Schlusselwortmuster und Werkzeuganforderungen analysieren
  2. Fahigkeitsbewertung -- die Eignung jedes Modells basierend auf extrahierten Merkmalen bewerten
  3. Kostengewichtung -- Kostenpraferenzen anwenden, um gunstigere Modelle fur einfache Abfragen zu bevorzugen
  4. Auswahl -- das hochstbewertete Modell wahlen, das die Mindestqualitatsschwellen erfullt

Bewertungsfaktoren

FaktorGewichtBeschreibung
Fahigkeitsabgleich0,4Fahigkeit des Modells, den Abfragetyp zu verarbeiten
Elo-Bewertung0,2Historische Modellleistung
Kosteneffizienz0,2Tokens pro Dollar
Latenz0,1Durchschnittliche Antwortzeit
Kontextfenster0,1Passt zum Gesprachskontext

Konfiguration

toml
[router]
strategy = "heuristic"

[router.heuristic]
complexity_threshold = 0.6
prefer_cheap_below = 0.4
elo_weight = 0.2
cost_weight = 0.2

Verwandte Seiten

Released under the Apache-2.0 License.