Skip to content
Cette page a été générée et traduite avec l'aide de l'IA. Si vous remarquez des inexactitudes, n'hésitez pas à contribuer. Modifier sur GitHub

Modèles de reranking

PRX-Memory prend en charge plusieurs fournisseurs de reranking via le crate prx-memory-rerank. Chaque fournisseur implémente le même trait d'adaptateur, permettant un changement transparent.

Jina AI

Jina propose des modèles de reranking cross-encoder avec support multilingue.

bash
PRX_RERANK_PROVIDER=jina
PRX_RERANK_API_KEY=your_jina_key
PRX_RERANK_MODEL=jina-reranker-v2-base-multilingual
ModèleNotes
jina-reranker-v2-base-multilingualCross-encoder multilingue
jina-reranker-v1-base-enOptimisé pour l'anglais

INFO

Le reranking Jina peut utiliser la même clé API que l'embedding Jina. Définissez JINA_API_KEY une fois pour couvrir les deux.

Cohere

Cohere propose un reranking de haute qualité via leur API Rerank.

bash
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5
ModèleNotes
rerank-v3.5Dernier modèle, meilleure qualité
rerank-english-v3.0Optimisé pour l'anglais
rerank-multilingual-v3.0Support multilingue

Pinecone

Pinecone propose le reranking dans le cadre de leur API d'inférence.

bash
PRX_RERANK_PROVIDER=pinecone
PRX_RERANK_API_KEY=your_pinecone_key
PRX_RERANK_MODEL=bge-reranker-v2-m3

Pour les points de terminaison compatibles Pinecone personnalisés :

bash
PRX_RERANK_PROVIDER=pinecone-compatible
PRX_RERANK_API_KEY=your_key
PRX_RERANK_ENDPOINT=https://your-endpoint.example.com
PRX_RERANK_API_VERSION=2025-01

Choisir un rerankeur

PrioritéFournisseur recommandéModèle
Meilleure qualitéCoherererank-v3.5
MultilingueJinajina-reranker-v2-base-multilingual
Intégré avec PineconePineconebge-reranker-v2-m3
Pas de reranking nécessaire--PRX_RERANK_PROVIDER=none

Combiner embedding et reranking

Une configuration haute qualité courante associe les embeddings Jina avec le reranking Cohere :

bash
# Embedding
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3

# Reranking
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5

Cette configuration exploite les embeddings multilingues rapides de Jina pour une récupération large et le rerankeur haute précision de Cohere pour l'ordonnancement final.

Étapes suivantes

Released under the Apache-2.0 License.