Skip to content
本页内容由 AI 辅助生成与翻译,如有不当之处,欢迎协助改进。 在 GitHub 上编辑

重排序模型

PRX-Memory 通过 prx-memory-rerank crate 支持多个重排序供应商。每个供应商都实现相同的适配器 trait,允许无缝切换。

Jina AI

Jina 提供支持多语言的交叉编码器重排序模型。

bash
PRX_RERANK_PROVIDER=jina
PRX_RERANK_API_KEY=your_jina_key
PRX_RERANK_MODEL=jina-reranker-v2-base-multilingual
模型备注
jina-reranker-v2-base-multilingual多语言交叉编码器
jina-reranker-v1-base-en英语优化

INFO

Jina 重排序可以使用与 Jina 嵌入相同的 API 密钥。设置一次 JINA_API_KEY 即可覆盖两者。

Cohere

Cohere 通过其 Rerank API 提供高质量的重排序。

bash
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5
模型备注
rerank-v3.5最新模型,最佳质量
rerank-english-v3.0英语优化
rerank-multilingual-v3.0多语言支持

Pinecone

Pinecone 作为其推理 API 的一部分提供重排序。

bash
PRX_RERANK_PROVIDER=pinecone
PRX_RERANK_API_KEY=your_pinecone_key
PRX_RERANK_MODEL=bge-reranker-v2-m3

对于自定义 Pinecone 兼容端点:

bash
PRX_RERANK_PROVIDER=pinecone-compatible
PRX_RERANK_API_KEY=your_key
PRX_RERANK_ENDPOINT=https://your-endpoint.example.com
PRX_RERANK_API_VERSION=2025-01

选择重排器

优先级推荐供应商模型
最佳质量Coherererank-v3.5
多语言Jinajina-reranker-v2-base-multilingual
与 Pinecone 集成Pineconebge-reranker-v2-m3
不需要重排序--PRX_RERANK_PROVIDER=none

组合嵌入和重排序

一个常见的高质量配置是将 Jina 嵌入与 Cohere 重排序配对:

bash
# 嵌入
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3

# 重排序
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5

这种设置利用 Jina 快速的多语言嵌入进行广泛检索,并利用 Cohere 高精度的重排器进行最终排序。

下一步

Released under the Apache-2.0 License.