Skip to content
このページは AI の支援により作成・翻訳されました。誤りがあれば、改善にご協力ください。 GitHub で編集

リランキングエンジン

リランキングはオプションの第2段階検索ステップで、専用のクロスエンコーダモデルを使用して候補結果を並べ替えます。埋め込みベースの検索は高速ですが、細かい関連性を捉えられない可能性がある事前計算されたベクトルで動作します。リランキングはより強力なモデルを小さな候補セットに適用し、精度を大幅に向上させます。

動作の仕組み

  1. 第1段階(検索): ベクトル類似度検索が幅広い候補セット(例:上位50件)を返します。
  2. 第2段階(リランキング): クロスエンコーダモデルが各候補をクエリに対してスコアリングし、洗練されたランキングを生成します。
  3. 最終結果: リランク済みの上位k件の結果が呼び出し元に返されます。
mermaid
graph LR
    QUERY["Recall Query"] --> EMBED["Embedding Search<br/>Top 50 Candidates"]
    EMBED --> RERANK["Reranker<br/>Cross-Encoder Scoring"]
    RERANK --> RESULTS["Reranked Top-K"]

リランキングが重要な理由

メトリクスリランキングなしリランキングあり
検索カバレッジ高い(幅広い検索)同じ(変わらない)
上位5件の精度中程度大幅に向上
レイテンシ低い(~50ms)高い(~150ms追加)
APIコスト埋め込みのみ埋め込み + リランキング

リランキングが最も価値を発揮するのは:

  • メモリデータベースが大きい場合(1000件以上)。
  • クエリが曖昧または自然言語の場合。
  • レイテンシよりも結果リストの上位の精度が重要な場合。

サポートされるプロバイダ

プロバイダ設定値説明
JinaPRX_RERANK_PROVIDER=jinaJina AIリランカーモデル
CoherePRX_RERANK_PROVIDER=cohereCohereリランク API
PineconePRX_RERANK_PROVIDER=pineconePineconeリランクサービス
Pinecone互換PRX_RERANK_PROVIDER=pinecone-compatibleカスタムPinecone互換エンドポイント
なしPRX_RERANK_PROVIDER=noneリランキングを無効化

設定

bash
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5

プロバイダフォールバックキー

PRX_RERANK_API_KEYが設定されていない場合、システムはプロバイダ固有キーにフォールバックします:

  • Jina: JINA_API_KEY
  • Cohere: COHERE_API_KEY
  • Pinecone: PINECONE_API_KEY

リランキングの無効化

リランキングなしで実行するには、PRX_RERANK_PROVIDER変数を省略するか明示的に設定します:

bash
PRX_RERANK_PROVIDER=none

リランキングステージなしでも語彙マッチングとベクトル類似度を使用して検索は機能します。

次のステップ

Released under the Apache-2.0 License.