Skip to content
Cette page a été générée et traduite avec l'aide de l'IA. Si vous remarquez des inexactitudes, n'hésitez pas à contribuer. Modifier sur GitHub

Modèles d'embedding pris en charge

PRX-Memory prend en charge trois familles de fournisseurs d'embedding. Chaque fournisseur se connecte via l'interface d'adaptateur unifiée du crate prx-memory-embed.

Compatible OpenAI

Toute API qui suit le format de point de terminaison d'embedding OpenAI (/v1/embeddings) peut être utilisée. Cela inclut OpenAI lui-même, Azure OpenAI et les serveurs d'inférence locaux.

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com  # optionnel
ModèleDimensionsNotes
text-embedding-3-small1536Bon équilibre qualité/coût
text-embedding-3-large3072Meilleure qualité, coût plus élevé
text-embedding-ada-0021536Modèle hérité

Inférence locale

Pour les déploiements sensibles à la confidentialité, pointez PRX_EMBED_BASE_URL vers un serveur d'inférence local exécutant un modèle d'embedding open source (par exemple, via Ollama, vLLM ou text-embeddings-inference).

Jina AI

Jina propose des modèles d'embedding multilingues de haute qualité optimisés pour les tâches de récupération.

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
ModèleDimensionsNotes
jina-embeddings-v31024Dernier modèle multilingue
jina-embeddings-v2-base-en768Optimisé pour l'anglais
jina-embeddings-v2-base-code768Optimisé pour le code

Clé de fallback

Si PRX_EMBED_API_KEY n'est pas défini, le système vérifie JINA_API_KEY en fallback.

Google Gemini

Les modèles d'embedding Gemini sont disponibles via l'API Google AI.

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
ModèleDimensionsNotes
text-embedding-004768Modèle actuel recommandé
embedding-001768Modèle hérité

Clé de fallback

Si PRX_EMBED_API_KEY n'est pas défini, le système vérifie GEMINI_API_KEY en fallback.

Choisir un modèle

PrioritéModèle recommandéFournisseur
Meilleure qualitétext-embedding-3-largeCompatible OpenAI
Meilleur pour le codejina-embeddings-v2-base-codeJina
Multilinguejina-embeddings-v3Jina
Confidentialité / localTout modèle local via openai-compatibleAuto-hébergé
Rentabletext-embedding-3-smallCompatible OpenAI

Changer de modèle

Lors du changement de modèle d'embedding, les vecteurs existants deviennent incompatibles avec l'espace vectoriel du nouveau modèle. Utilisez l'outil memory_reembed pour ré-embéder toutes les mémoires stockées avec le nouveau modèle :

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

WARNING

Le ré-embedding nécessite des appels API pour chaque mémoire stockée. Pour les grandes bases de données, cela peut prendre un temps significatif et entraîner des coûts API. Planifiez le ré-embedding pendant les périodes de faible utilisation.

Étapes suivantes

Released under the Apache-2.0 License.