Поддерживаемые модели эмбеддингов
PRX-Memory поддерживает три семейства провайдеров эмбеддингов. Каждый провайдер подключается через унифицированный интерфейс адаптера крейта prx-memory-embed.
OpenAI-совместимый
Может использоваться любой API, следующий формату эндпоинта эмбеддингов OpenAI (/v1/embeddings). Сюда входят сам OpenAI, Azure OpenAI и локальные серверы инференса.
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com # опционально2
3
4
| Модель | Размерность | Примечания |
|---|---|---|
text-embedding-3-small | 1536 | Хороший баланс качества и стоимости |
text-embedding-3-large | 3072 | Наивысшее качество, выше стоимость |
text-embedding-ada-002 | 1536 | Устаревшая модель |
Локальный инференс
Для развёртываний с требованиями к конфиденциальности укажите в PRX_EMBED_BASE_URL адрес локального сервера инференса, запускающего open-source модель эмбеддингов (например, через Ollama, vLLM или text-embeddings-inference).
Jina AI
Jina предоставляет высококачественные многоязычные модели эмбеддингов, оптимизированные для задач извлечения.
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v32
3
| Модель | Размерность | Примечания |
|---|---|---|
jina-embeddings-v3 | 1024 | Последняя многоязычная модель |
jina-embeddings-v2-base-en | 768 | Оптимизирована для английского |
jina-embeddings-v2-base-code | 768 | Оптимизирована для кода |
Резервный ключ
Если PRX_EMBED_API_KEY не установлен, система проверяет JINA_API_KEY как резервный вариант.
Google Gemini
Модели эмбеддингов Gemini доступны через Google AI API.
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-0042
3
| Модель | Размерность | Примечания |
|---|---|---|
text-embedding-004 | 768 | Текущая рекомендуемая модель |
embedding-001 | 768 | Устаревшая модель |
Резервный ключ
Если PRX_EMBED_API_KEY не установлен, система проверяет GEMINI_API_KEY как резервный вариант.
Выбор модели
| Приоритет | Рекомендуемая модель | Провайдер |
|---|---|---|
| Наилучшее качество | text-embedding-3-large | OpenAI-совместимый |
| Лучшее для кода | jina-embeddings-v2-base-code | Jina |
| Многоязычное | jina-embeddings-v3 | Jina |
| Конфиденциальность / локально | Любая локальная модель через openai-compatible | Self-hosted |
| Экономичное | text-embedding-3-small | OpenAI-совместимый |
Смена модели
При смене модели эмбеддингов существующие векторы становятся несовместимы с векторным пространством новой модели. Используйте инструмент memory_reembed, чтобы перегенерировать эмбеддинги всех сохранённых воспоминаний с новой моделью:
{
"jsonrpc": "2.0",
"id": 1,
"method": "tools/call",
"params": {
"name": "memory_reembed",
"arguments": {}
}
}2
3
4
5
6
7
8
9
WARNING
Перегенерация требует вызовов API для каждого сохранённого воспоминания. Для больших баз данных это может занять значительное время и повлечь расходы на API. Планируйте перегенерацию на периоды низкой нагрузки.
Следующие шаги
- Пакетная обработка — эффективная массовая генерация эмбеддингов
- Модели реранкинга — варианты моделей второго этапа реранкинга
- Справочник конфигурации — все переменные окружения