Skip to content
Diese Seite wurde mit KI-Unterstützung erstellt und übersetzt. Falls Ihnen Ungenauigkeiten auffallen, helfen Sie gerne bei der Verbesserung. Auf GitHub bearbeiten

Reranking-Engine

Reranking ist ein optionaler zweistufiger Retrieval-Schritt, der Kandidatenergebnisse mit einem dedizierten Cross-Encoder-Modell neu ordnet. Während Embedding-basiertes Retrieval schnell ist, arbeitet es mit vorberechneten Vektoren, die möglicherweise keine feinkörnige Relevanz erfassen. Reranking wendet ein leistungsfähigeres Modell auf einen kleineren Kandidatensatz an und verbessert die Präzision erheblich.

Funktionsweise

  1. Erste Stufe (Retrieval): Vektorähnlichkeitssuche gibt einen breiten Satz von Kandidaten zurück (z.B. Top 50).
  2. Zweite Stufe (Reranking): Ein Cross-Encoder-Modell bewertet jeden Kandidaten gegen die Abfrage und erzeugt ein verfeinerte Ranking.
  3. Endergebnis: Die Top-k neu geordneten Ergebnisse werden an den Aufrufer zurückgegeben.
mermaid
graph LR
    QUERY["Recall-Abfrage"] --> EMBED["Embedding-Suche<br/>Top-50-Kandidaten"]
    EMBED --> RERANK["Reranker<br/>Cross-Encoder-Bewertung"]
    RERANK --> RESULTS["Neu geordnete Top-K"]

Warum Reranking wichtig ist

MetrikOhne RerankingMit Reranking
Recall-AbdeckungHoch (breites Retrieval)Gleich (unverändert)
Präzision bei Top-5ModeratErheblich verbessert
LatenzNiedriger (~50ms)Höher (~150ms zusätzlich)
API-KostenNur EmbeddingEmbedding + Reranking

Reranking ist am wertvollsten wenn:

  • Die Speicherdatenbank groß ist (1000+ Einträge).
  • Abfragen mehrdeutig oder in natürlicher Sprache sind.
  • Präzision am Anfang der Ergebnisliste wichtiger als Latenz ist.

Unterstützte Provider

ProviderKonfigurationswertBeschreibung
JinaPRX_RERANK_PROVIDER=jinaJina-AI-Reranker-Modelle
CoherePRX_RERANK_PROVIDER=cohereCohere-Rerank-API
PineconePRX_RERANK_PROVIDER=pineconePinecone-Rerank-Dienst
Pinecone-kompatibelPRX_RERANK_PROVIDER=pinecone-compatibleBenutzerdefinierte Pinecone-kompatible Endpunkte
KeinerPRX_RERANK_PROVIDER=noneReranking deaktivieren

Konfiguration

bash
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5

Provider-Fallback-Schlüssel

Wenn PRX_RERANK_API_KEY nicht gesetzt ist, greift das System auf provider-spezifische Schlüssel zurück:

  • Jina: JINA_API_KEY
  • Cohere: COHERE_API_KEY
  • Pinecone: PINECONE_API_KEY

Reranking deaktivieren

Um ohne Reranking zu betreiben, entweder die Variable PRX_RERANK_PROVIDER weglassen oder explizit setzen:

bash
PRX_RERANK_PROVIDER=none

Recall funktioniert weiterhin mit lexikalischem Matching und Vektorähnlichkeit ohne die Reranking-Stufe.

Nächste Schritte

Released under the Apache-2.0 License.