Skip to content
Эта страница создана и переведена с помощью ИИ. Если вы заметили неточности, помогите нам улучшить её. Редактировать на GitHub

Поддерживаемые модели эмбеддингов

PRX-Memory поддерживает три семейства провайдеров эмбеддингов. Каждый провайдер подключается через унифицированный интерфейс адаптера крейта prx-memory-embed.

OpenAI-совместимый

Может использоваться любой API, следующий формату эндпоинта эмбеддингов OpenAI (/v1/embeddings). Сюда входят сам OpenAI, Azure OpenAI и локальные серверы инференса.

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com  # опционально
МодельРазмерностьПримечания
text-embedding-3-small1536Хороший баланс качества и стоимости
text-embedding-3-large3072Наивысшее качество, выше стоимость
text-embedding-ada-0021536Устаревшая модель

Локальный инференс

Для развёртываний с требованиями к конфиденциальности укажите в PRX_EMBED_BASE_URL адрес локального сервера инференса, запускающего open-source модель эмбеддингов (например, через Ollama, vLLM или text-embeddings-inference).

Jina AI

Jina предоставляет высококачественные многоязычные модели эмбеддингов, оптимизированные для задач извлечения.

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
МодельРазмерностьПримечания
jina-embeddings-v31024Последняя многоязычная модель
jina-embeddings-v2-base-en768Оптимизирована для английского
jina-embeddings-v2-base-code768Оптимизирована для кода

Резервный ключ

Если PRX_EMBED_API_KEY не установлен, система проверяет JINA_API_KEY как резервный вариант.

Google Gemini

Модели эмбеддингов Gemini доступны через Google AI API.

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
МодельРазмерностьПримечания
text-embedding-004768Текущая рекомендуемая модель
embedding-001768Устаревшая модель

Резервный ключ

Если PRX_EMBED_API_KEY не установлен, система проверяет GEMINI_API_KEY как резервный вариант.

Выбор модели

ПриоритетРекомендуемая модельПровайдер
Наилучшее качествоtext-embedding-3-largeOpenAI-совместимый
Лучшее для кодаjina-embeddings-v2-base-codeJina
Многоязычноеjina-embeddings-v3Jina
Конфиденциальность / локальноЛюбая локальная модель через openai-compatibleSelf-hosted
Экономичноеtext-embedding-3-smallOpenAI-совместимый

Смена модели

При смене модели эмбеддингов существующие векторы становятся несовместимы с векторным пространством новой модели. Используйте инструмент memory_reembed, чтобы перегенерировать эмбеддинги всех сохранённых воспоминаний с новой моделью:

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

WARNING

Перегенерация требует вызовов API для каждого сохранённого воспоминания. Для больших баз данных это может занять значительное время и повлечь расходы на API. Планируйте перегенерацию на периоды низкой нагрузки.

Следующие шаги

Released under the Apache-2.0 License.