Búsqueda Vectorial

La búsqueda vectorial es el mecanismo central que habilita la recuperación semántica de memorias en PRX-Memory. En lugar de hacer coincidir palabras clave, la búsqueda vectorial compara la similitud matemática entre los embeddings de la consulta y la memoria para encontrar resultados conceptualmente relacionados.

Cómo Funciona

Embedding de la consulta: La consulta de recall se envía al proveedor de embedding configurado, produciendo un vector.
Cálculo de similitud: El vector de consulta se compara contra todos los vectores de memoria almacenados usando similitud coseno.
Puntuación: Cada memoria recibe una puntuación de similitud entre -1.0 y 1.0 (mayor significa más similar).
Clasificación: Los resultados se ordenan por puntuación y se combinan con otras señales (coincidencia léxica, importancia, recencia).

mermaid

graph TB
    QUERY["Consulta de Recall<br/>'SQL injection prevention'"]
    QEMBED["Embedding de Consulta<br/>[0.12, -0.03, 0.87, ...]"]

    subgraph Storage["Vectores de Memoria Almacenados"]
        M1["Memoria 1<br/>[0.11, -0.02, 0.85, ...]<br/>similitud: 0.97"]
        M2["Memoria 2<br/>[0.45, 0.12, -0.33, ...]<br/>similitud: 0.23"]
        M3["Memoria 3<br/>[0.09, -0.05, 0.82, ...]<br/>similitud: 0.94"]
    end

    RESULTS["Resultados Clasificados<br/>1. Memoria 1 (0.97)<br/>2. Memoria 3 (0.94)<br/>3. Memoria 2 (0.23)"]

    QUERY --> QEMBED
    QEMBED --> M1
    QEMBED --> M2
    QEMBED --> M3
    M1 --> RESULTS
    M2 --> RESULTS
    M3 --> RESULTS

Similitud Coseno

PRX-Memory usa la similitud coseno como métrica de distancia. La similitud coseno mide el ángulo entre dos vectores, ignorando la magnitud:

similarity(A, B) = (A . B) / (|A| * |B|)

Puntuación	Significado
0.95--1.0	Significado casi idéntico
0.80--0.95	Altamente relacionado
0.60--0.80	Algo relacionado
< 0.60	Probablemente no relacionado

Clasificación Combinada

La similitud vectorial es una señal en la clasificación multi-señal de PRX-Memory. La puntuación final combina:

Señal	Peso	Descripción
Similitud vectorial	Alto	Relevancia semántica de la comparación de embeddings
Coincidencia léxica	Medio	Superposición de palabras clave entre la consulta y el texto de memoria
Puntuación de importancia	Medio	Importancia asignada por el usuario o calculada por el sistema
Recencia	Bajo	Las memorias más recientes reciben un pequeño impulso

La ponderación exacta depende de la configuración de recall y de si los embeddings y el reranking están habilitados.

Rendimiento

El benchmark de 100k entradas muestra:

Métrica	Valor
Tamaño del conjunto de datos	100,000 entradas
Latencia p95	122.683ms
Umbral	< 300ms
Método	Léxico + importancia + recencia (sin llamadas de red)

INFO

Este benchmark mide solo el path de clasificación de recuperación, sin llamadas de red de embedding o reranking. La latencia de extremo a extremo depende de los tiempos de respuesta del proveedor.

Consideraciones de Escalado

Tamaño del Conjunto de Datos	Enfoque Recomendado
< 10,000	Similitud coseno de fuerza bruta (backend JSON o SQLite)
10,000--100,000	SQLite con escaneo vectorial en memoria
> 100,000	LanceDB con indexación ANN

Para conjuntos de datos que superan las 100,000 entradas, habilita el backend LanceDB para búsqueda de vecino más cercano aproximado (ANN), que proporciona tiempo de consulta sub-lineal.

Siguientes Pasos

Motor de Embedding -- Cómo se generan los vectores
Reranking -- Mejora de precisión de segunda etapa
Backends de Almacenamiento -- Elegir el backend de almacenamiento correcto

Búsqueda Vectorial ​

Cómo Funciona ​

Similitud Coseno ​

Clasificación Combinada ​

Rendimiento ​

Consideraciones de Escalado ​

Siguientes Pasos ​