Skip to content
ეს გვერდი შეიქმნა და ითარგმნა ხელოვნური ინტელექტის დახმარებით. თუ შეამჩნევთ უზუსტობას, გთხოვთ, დაგვეხმარეთ გაუმჯობესებაში. GitHub-ზე რედაქტირება

Reranking ძრავა

Reranking სურვილისამებრ მეორე-საფეხურიანი მოძიების ეტაპია, რომელიც კანდიდატ შედეგებს გადააწყობს სპეციალიზებული cross-encoder მოდელის გამოყენებით. Embedding-ზე დაფუძნებული მოძიება სწრაფია, მაგრამ ის წინასწარ გამოთვლილ ვექტორებზე მუშაობს, რომლებმა შეიძლება ვერ ასახონ დეტალური შესაბამისობა. Reranking უფრო ძლიერ მოდელს კანდიდატების მცირე ნაკრებზე იყენებს, მნიშვნელოვნად სიზუსტეს აუმჯობესებს.

მუშაობის პრინციპი

  1. პირველი საფეხური (მოძიება): ვექტორული მსგავსების ძიება აბრუნებს კანდიდატების ფართო ნაკრებს (მაგ., top 50).
  2. მეორე საფეხური (reranking): cross-encoder მოდელი ყოველ კანდიდატს შეკითხვის მიმართ ასწორებს, რეფინირებული რანჟირების მისაღებად.
  3. საბოლოო შედეგი: rerank-ული top-k შედეგები მომხმარებელს ეძლევა.
mermaid
graph LR
    QUERY["Recall Query"] --> EMBED["Embedding Search<br/>Top 50 Candidates"]
    EMBED --> RERANK["Reranker<br/>Cross-Encoder Scoring"]
    RERANK --> RESULTS["Reranked Top-K"]

რატომ არის Reranking მნიშვნელოვანი

მეტრიკაReranking-ის გარეშეReranking-ით
Recall coverageმაღალი (ფართო მოძიება)იგივე (უცვლელი)
Precision top-5-ზეზომიერიმნიშვნელოვნად გაუმჯობესებული
Latencyდაბალი (~50ms)უფრო მაღალი (~150ms დამატებით)
API ხარჯიმხოლოდ embeddingEmbedding + reranking

Reranking ყველაზე ღირებულია, როდესაც:

  • მეხსიერების მონაცემთა ბაზა დიდია (1000+ ჩანაწერი).
  • შეკითხვები ორაზროვანი ან ბუნებრივი ენის.
  • შედეგების სიაში სიზუსტე latency-ზე მნიშვნელოვანია.

მხარდაჭერილი პროვაიდერები

პროვაიდერიკონფიგ. მნიშვნელობააღწერა
JinaPRX_RERANK_PROVIDER=jinaJina AI reranker მოდელები
CoherePRX_RERANK_PROVIDER=cohereCohere rerank API
PineconePRX_RERANK_PROVIDER=pineconePinecone rerank სერვისი
Pinecone-თავსებადიPRX_RERANK_PROVIDER=pinecone-compatibleსპეციალური Pinecone-თავსებადი endpoint-ები
NonePRX_RERANK_PROVIDER=noneReranking-ის გამორთვა

კონფიგურაცია

bash
PRX_RERANK_PROVIDER=cohere
PRX_RERANK_API_KEY=your_cohere_key
PRX_RERANK_MODEL=rerank-v3.5

პროვაიდერის სარეზერვო გასაღებები

PRX_RERANK_API_KEY-ის დაუყენებლობისას სისტემა პროვაიდერ-სპეციფიკური გასაღებებზე გადადის:

  • Jina: JINA_API_KEY
  • Cohere: COHERE_API_KEY
  • Pinecone: PINECONE_API_KEY

Reranking-ის გამორთვა

Reranking-ის გარეშე გასაშვებად ან გამოტოვეთ PRX_RERANK_PROVIDER ცვლადი ან მკაფიოდ დააყენეთ:

bash
PRX_RERANK_PROVIDER=none

გამოძახება კვლავ ფუნქციონირებს ლექსიკური შეწყობისა და ვექტორული მსგავსების გამოყენებით reranking-ის ეტაპის გარეშე.

შემდეგი ნაბიჯები

Released under the Apache-2.0 License.