重排序引擎

重排序是一个可选的第二阶段检索步骤，使用专用的交叉编码器模型对候选结果进行重新排序。虽然基于嵌入的检索速度快，但它基于预计算的向量运作，可能无法捕获细粒度的相关性。重排序对较小的候选集应用更强大的模型，显著提高精度。

工作原理

mermaid

graph LR
    QUERY["召回查询"] --> EMBED["嵌入搜索<br/>前 50 个候选"]
    EMBED --> RERANK["重排器<br/>交叉编码器评分"]
    RERANK --> RESULTS["重排序后的 Top-K"]

重排序在以下场景最有价值：

供应商	配置值	说明
Jina	`PRX_RERANK_PROVIDER=jina`	Jina AI 重排器模型
Cohere	`PRX_RERANK_PROVIDER=cohere`	Cohere 重排 API
Pinecone	`PRX_RERANK_PROVIDER=pinecone`	Pinecone 重排服务
Pinecone 兼容	`PRX_RERANK_PROVIDER=pinecone-compatible`	自定义 Pinecone 兼容端点
无	`PRX_RERANK_PROVIDER=none`	禁用重排序

bash

PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5

供应商备用密钥

如果未设置 PRX_RERANK_API_KEY，系统会回退到供应商专用密钥：

要在不使用重排序的情况下运行，省略 PRX_RERANK_PROVIDER 变量或显式设置：

bash

PRX_RERANK_PROVIDER=none

召回仍然使用词法匹配和向量相似度，不经过重排序阶段。