Skip to content
Esta página fue generada y traducida con asistencia de IA. Si encuentra alguna imprecisión, no dude en ayudar a mejorarla. Editar en GitHub

Motor de Embedding

El motor de embedding convierte el texto de las memorias en vectores numéricos de alta dimensión que capturan el significado semántico. Esto permite la búsqueda por similitud conceptual en lugar de solo coincidencia de palabras clave.

Pipeline de Embedding

mermaid
graph LR
    TEXT["Texto de Memoria"] --> PROVIDER["Proveedor de Embedding<br/>(OpenAI / Jina / Gemini)"]
    PROVIDER --> VECTOR["Vector de Alta Dimensión<br/>[0.12, -0.03, 0.87, ...]"]
    VECTOR --> STORAGE["Almacenamiento<br/>(SQLite / LanceDB)"]

    QUERY["Consulta de Recuperación"] --> QPROVIDER["Proveedor de Embedding"]
    QPROVIDER --> QVECTOR["Vector de Consulta"]
    QVECTOR --> SIMILARITY["Similitud Coseno<br/>vs Vectores Almacenados"]
    SIMILARITY --> RESULTS["Resultados Clasificados"]

Proveedores Soportados

ProveedorValor de ConfiguraciónDescripción
OpenAI-compatiblePRX_EMBED_PROVIDER=openai-compatibleCualquier API compatible con OpenAI
Jina AIPRX_EMBED_PROVIDER=jinaModelos de embedding Jina
Google GeminiPRX_EMBED_PROVIDER=geminiAPI de embedding de Google Gemini

Configuración

bash
# Jina AI
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3

# OpenAI-compatible
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small

# Gemini
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004

Claves de Respaldo de Proveedor

Si PRX_EMBED_API_KEY no está establecido, el sistema verifica claves específicas del proveedor:

  • Jina: JINA_API_KEY
  • Gemini: GEMINI_API_KEY

Cuándo Habilitar

Caso de UsoEmbedding Necesario
Búsqueda por palabras clave exactasNo
Búsqueda semántica / lenguaje natural
Base de datos de memoria < 500 entradasOpcional
Base de datos de memoria > 500 entradasRecomendado
Alta precisión en recuperación requeridaSí (+ reranking)

Sin Embedding

PRX-Memory funciona sin un proveedor de embedding usando coincidencia léxica solamente. Los resultados son correctos pero no capturan similitud semántica.

bash
# Works without embedding
PRX_MEMORYD_TRANSPORT=stdio \
PRX_MEMORY_DB=./data/memory-db.json \
prx-memoryd

Características de Rendimiento

  • Latencia de embedding: 50--200ms por solicitud de API (dependiendo del proveedor)
  • Benchmark de 100k entradas: p95 < 123ms (solo path de ranking, sin llamadas de red)
  • Soporte de batch: Embebe múltiples textos en una sola llamada de API (ver Procesamiento en Batch)

Siguientes Pasos

Released under the Apache-2.0 License.