Skip to content
Esta página fue generada y traducida con asistencia de IA. Si encuentra alguna imprecisión, no dude en ayudar a mejorarla. Editar en GitHub

Modelos de Embedding

PRX-Memory soporta múltiples proveedores de embedding a través del crate prx-memory-embed. Cada proveedor implementa el mismo trait adaptador, lo que permite cambios sin problemas.

OpenAI-Compatible

Cualquier API compatible con OpenAI puede usarse como proveedor de embedding. Esto incluye el propio OpenAI, así como endpoints compatibles auto-alojados.

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_api_key
PRX_EMBED_MODEL=text-embedding-3-small
# PRX_EMBED_BASE_URL=https://custom-endpoint.example.com  # Optional
ModeloDimensionesNotas
text-embedding-3-small1536Buen equilibrio calidad/costo
text-embedding-3-large3072Mayor calidad, más caro
text-embedding-ada-0021536Modelo heredado

Jina AI

Jina ofrece modelos de embedding optimizados para texto de código y multilingüe.

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
ModeloDimensionesNotas
jina-embeddings-v31024Última generación, multilingüe
jina-embeddings-v2-base-en768Optimizado para inglés
jina-embeddings-v2-base-code768Optimizado para código

TIP

La clave de API de Jina puede usarse tanto para embedding como para reranking. Establece JINA_API_KEY una vez para cubrir ambos.

Google Gemini

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
ModeloDimensionesNotas
text-embedding-004768Modelo de embedding Gemini más reciente
embedding-001768Modelo de embedding original

Elegir un Modelo

PrioridadProveedor RecomendadoModelo
Mejor calidad generalOpenAItext-embedding-3-large
MultilingüeJinajina-embeddings-v3
Optimizado para códigoJinajina-embeddings-v2-base-code
Costo/calidad equilibradoOpenAItext-embedding-3-small
Auto-alojado / personalizadoopenai-compatibleCualquier endpoint compatible

Cambiar de Modelo

Cuando cambias modelos de embedding, los vectores existentes quedan desactualizados porque han sido calculados con un modelo diferente. Usa memory_reembed para recalcularlos:

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

Esto re-embebe todas las entradas de memoria con el modelo configurado actualmente.

Siguientes Pasos

Released under the Apache-2.0 License.