Skip to content
ეს გვერდი შეიქმნა და ითარგმნა ხელოვნური ინტელექტის დახმარებით. თუ შეამჩნევთ უზუსტობას, გთხოვთ, დაგვეხმარეთ გაუმჯობესებაში. GitHub-ზე რედაქტირება

LLM პროვაიდერები

PRX დიდ ენობრივ მოდელებთან პროვაიდერების მეშვეობით უკავშირდება -- ესენია ჩართვადი ბექენდები, რომლებიც Provider ტრეიტს ახორციელებს. თითოეული პროვაიდერი მართავს ავთენტიფიკაციას, მოთხოვნის ფორმატირებას, სტრიმინგსა და შეცდომების კლასიფიკაციას კონკრეტული LLM API-სთვის.

PRX-ს გააჩნია 9 ჩაშენებული პროვაიდერი, OpenAI-თავსებადი ენდფოინთი მესამე მხარის სერვისებისთვის, და ინფრასტრუქტურა სარეზერვო ჯაჭვებისა და ინტელექტუალური მარშრუტიზაციისთვის.

შესაძლებლობების მატრიცა

პროვაიდერიძირითადი მოდელებისტრიმინგიხედვაინსტრუმენტებიOAuthთვითჰოსტინგი
AnthropicClaude Opus 4, Claude Sonnet 4დიახდიახდიახდიახ (Claude Code)არა
OpenAIGPT-4o, o1, o3დიახდიახდიახარაარა
Google GeminiGemini 2.0 Flash, Gemini 1.5 Proდიახდიახდიახდიახ (Gemini CLI)არა
OpenAI CodexCodex მოდელებიდიახარადიახდიახარა
GitHub CopilotCopilot Chat მოდელებიდიახარადიახდიახ (Device Flow)არა
OllamaLlama 3, Mistral, Qwen, ნებისმიერი GGUFდიახდამოკიდებულია მოდელზედიახარადიახ
AWS BedrockClaude, Titan, Llamaდიახდამოკიდებულია მოდელზედამოკიდებულია მოდელზეAWS IAMარა
GLMGLM-4, Zhipu, Minimax, Moonshot, Qwen, Z.AIდიახდამოკიდებულია მოდელზედამოკიდებულია მოდელზედიახ (Minimax/Qwen)არა
OpenRouter200+ მოდელი მრავალი მომწოდებლისგანდიახდამოკიდებულია მოდელზედამოკიდებულია მოდელზეარაარა
მორგებული თავსებადინებისმიერი OpenAI-თავსებადი APIდიახდამოკიდებულია ენდფოინთზედამოკიდებულია ენდფოინთზეარადიახ

სწრაფი კონფიგურაცია

პროვაიდერები კონფიგურირდება ~/.config/openprx/config.toml (ან ~/.openprx/config.toml) ფაილში. მინიმუმ მიუთითეთ ნაგულისხმევი პროვაიდერი და API გასაღები:

toml
# ნაგულისხმევი პროვაიდერისა და მოდელის არჩევა
default_provider = "anthropic"
default_model = "anthropic/claude-sonnet-4-6"
default_temperature = 0.7

# API გასაღები (ასევე შეიძლება ANTHROPIC_API_KEY env ცვლადით)
api_key = "sk-ant-..."

თვითჰოსტინგის პროვაიდერებისთვის, როგორიცაა Ollama, მიუთითეთ ენდფოინთი:

toml
default_provider = "ollama"
default_model = "llama3:70b"
api_url = "http://localhost:11434"

თითოეული პროვაიდერი API გასაღებს შემდეგი თანმიმდევრობით წყვეტს:

  1. api_key ველი config.toml-ში
  2. პროვაიდერისთვის სპეციფიკური გარემოს ცვლადი (მაგ., ANTHROPIC_API_KEY, OPENAI_API_KEY)
  3. ზოგადი API_KEY გარემოს ცვლადი

იხილეთ გარემოს ცვლადები მხარდაჭერილი ცვლადების სრული სიისთვის.

სარეზერვო ჯაჭვები ReliableProvider-ით

PRX პროვაიდერის გამოძახებებს ReliableProvider ფენაში ახვევს, რომელიც უზრუნველყოფს:

  • ავტომატურ ხელახალ ცდას ექსპონენციალური უკანდახევით დროებითი შეფერხებებისთვის (5xx, 429 რეიტ ლიმიტები, ქსელის ტაიმაუტები)
  • სარეზერვო ჯაჭვებს -- როდესაც ძირითადი პროვაიდერი ვერ ახერხებს, მოთხოვნები ავტომატურად გადამისამართდება ჯაჭვის შემდეგ პროვაიდერზე
  • არახელახალცდადი შეცდომების გამოვლენას -- კლიენტის შეცდომები, როგორიცაა არასწორი API გასაღებები (401/403) და უცნობი მოდელები (404), სწრაფად ფეილდება ხელახალი ცდების ხარჯვის გარეშე

საიმედოობის კონფიგურაცია [reliability] სექციაში:

toml
[reliability]
max_retries = 3
fallback_providers = ["openai", "gemini"]

როდესაც ძირითადი პროვაიდერი (მაგ., Anthropic) დროებით შეცდომას აბრუნებს, PRX ხელახლა ცდის max_retries-ჯერ უკანდახევით. თუ ყველა ცდა ამოიწურა, ის გადაინაცვლებს პირველ სარეზერვო პროვაიდერზე. სარეზერვო ჯაჭვი გრძელდება წარმატებულ პასუხამდე ან ყველა პროვაიდერის ამოწურვამდე.

შეცდომების კლასიფიკაცია

ReliableProvider შეცდომებს ორ კატეგორიად ყოფს:

  • ხელახალცდადი: HTTP 5xx, 429 (რეიტ ლიმიტი), 408 (ტაიმაუტი), ქსელის შეცდომები
  • არახელახალცდადი: HTTP 4xx (429/408-ის გარდა), არასწორი API გასაღებები, უცნობი მოდელები, დეფორმირებული პასუხები

არახელახალცდადი შეცდომები ხელახალ ცდებს გამოტოვებენ და დაუყოვნებლივ გადადიან შემდეგ პროვაიდერზე, რითაც ზედმეტ შეყოვნებას თავიდან იცილებენ.

მარშრუტიზატორის ინტეგრაცია

გაფართოებული მრავალმოდელიანი კონფიგურაციებისთვის, PRX მხარს უჭერს ევრისტიკულ LLM მარშრუტიზატორს, რომელიც ირჩევს ოპტიმალურ პროვაიდერსა და მოდელს თითოეული მოთხოვნისთვის, ეფუძნება:

  • შესაძლებლობების ქულას -- მოთხოვნის სირთულეს მოდელის ძლიერ მხარეებს ადარებს
  • Elo რეიტინგს -- დროთა განმავლობაში მოდელის წარმადობას აკვირდება
  • ხარჯების ოპტიმიზაციას -- მარტივი მოთხოვნებისთვის იაფ მოდელებს ანიჭებს უპირატესობას
  • შეყოვნების წონას -- პასუხის დროს ითვალისწინებს
  • KNN სემანტიკურ მარშრუტიზაციას -- ისტორიული მოთხოვნების ემბედინგებს იყენებს მსგავსებაზე დაფუძნებული მარშრუტიზაციისთვის
  • Automix ესკალაციას -- იწყებს იაფი მოდელით და ესკალაციას ახდენს პრემიუმ მოდელზე, როდესაც საიმედოობა დაბალია
toml
[router]
enabled = true
knn_enabled = true

[router.automix]
enabled = true
confidence_threshold = 0.7
premium_model_id = "anthropic/claude-sonnet-4-6"

იხილეთ მარშრუტიზატორის კონფიგურაცია სრული დეტალებისთვის.

პროვაიდერების გვერდები

Released under the Apache-2.0 License.