Skip to content
ეს გვერდი შეიქმნა და ითარგმნა ხელოვნური ინტელექტის დახმარებით. თუ შეამჩნევთ უზუსტობას, გთხოვთ, დაგვეხმარეთ გაუმჯობესებაში. GitHub-ზე რედაქტირება

მხარდაჭერილი Embedding მოდელები

PRX-Memory მხარს უჭერს სამ embedding პროვაიდერის ოჯახს. ყოველი პროვაიდერი prx-memory-embed crate-ის ერთიანი adapter ინტერფეისის მეშვეობით ერთვება.

OpenAI-თავსებადი

ნებისმიერი API, რომელიც OpenAI embedding endpoint-ის ფორმატს მიჰყვება (/v1/embeddings), შეიძლება გამოყენებულ იქნეს. ეს მოიცავს OpenAI-ს, Azure OpenAI-ს და ლოკალური inference სერვერებს.

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com  # optional
მოდელიგანზომილებებიშენიშვნა
text-embedding-3-small1536ხარისხისა და ღირებულების კარგი ბალანსი
text-embedding-3-large3072უმაღლეს ხარისხი, უფრო ძვირი
text-embedding-ada-0021536მოძველებული მოდელი

ლოკალური Inference

კონფიდენციალობის მგრძნობიარე განასახებებისთვის მიუთითეთ PRX_EMBED_BASE_URL ლოკალური inference სერვერისთვის, რომელიც ღია წყაროს embedding მოდელს გაუშვებს (მაგ., Ollama, vLLM ან text-embeddings-inference-ის მეშვეობით).

Jina AI

Jina უზრუნველყოფს მაღალ-ხარისხიანი მრავალენოვანი embedding მოდელებს, მოძიების ამოცანებისთვის ოპტიმიზებული.

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
მოდელიგანზომილებებიშენიშვნა
jina-embeddings-v31024უახლესი მრავალენოვანი მოდელი
jina-embeddings-v2-base-en768ინგლისურისთვის ოპტიმიზებული
jina-embeddings-v2-base-code768კოდისთვის ოპტიმიზებული

სარეზერვო გასაღები

PRX_EMBED_API_KEY-ის დაუყენებლობისას სისტემა JINA_API_KEY-ს ამოწმებს სარეზერვოდ.

Google Gemini

Gemini embedding მოდელები Google AI API-ის მეშვეობით ხელმისაწვდომია.

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
მოდელიგანზომილებებიშენიშვნა
text-embedding-004768მიმდინარე სასურველი მოდელი
embedding-001768მოძველებული მოდელი

სარეზერვო გასაღები

PRX_EMBED_API_KEY-ის დაუყენებლობისას სისტემა GEMINI_API_KEY-ს ამოწმებს სარეზერვოდ.

მოდელის არჩევა

პრიორიტეტისასურველი მოდელიპროვაიდერი
საუკეთესო ხარისხიtext-embedding-3-largeOpenAI-თავსებადი
კოდისთვის საუკეთესოjina-embeddings-v2-base-codeJina
მრავალენოვანიjina-embeddings-v3Jina
კონფიდენციალობა / ლოკალურინებისმიერი ლოკალური მოდელი openai-compatible-ის მეშვეობითSelf-hosted
ეკონომიურიtext-embedding-3-smallOpenAI-თავსებადი

მოდელების გადართვა

Embedding მოდელების გადართვისას, არსებული ვექტორები ახალი მოდელის ვექტორულ სივრცესთან შეუთავსებელი ხდება. გამოიყენეთ memory_reembed ინსტრუმენტი ყველა შენახული მეხსიერების ახლად embedding-ისთვის ახალი მოდელით:

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

WARNING

ახლად embedding-ი API გამოძახებებს საჭიროებს ყოველი შენახული მეხსიერებისთვის. დიდი მონაცემთა ბაზებისთვის ამ შეიძლება მნიშვნელოვანი დრო და API ხარჯები მოჰყვეს. გეგმეთ ახლად embedding-ი დაბალი გამოყენების პერიოდებში.

შემდეგი ნაბიჯები

Released under the Apache-2.0 License.