Vektorsuche

Vektorsuche ist der Kernmechanismus, der semantisches Speicher-Retrieval in PRX-Memory ermöglicht. Anstatt Schlüsselwörter abzugleichen, vergleicht die Vektorsuche die mathematische Ähnlichkeit zwischen Abfrage- und Speicher-Embeddings, um konzeptuell verwandte Ergebnisse zu finden.

Funktionsweise

Abfrage-Embedding: Die Recall-Abfrage wird an den konfigurierten Embedding-Provider gesendet und erzeugt einen Vektor.
Ähnlichkeitsberechnung: Der Abfragevektor wird mit allen gespeicherten Speichervektoren unter Verwendung von Kosinus-Ähnlichkeit verglichen.
Bewertung: Jede Erinnerung erhält einen Ähnlichkeitsscore zwischen -1,0 und 1,0 (höher ist ähnlicher).
Ranking: Ergebnisse werden nach Score sortiert und mit anderen Signalen kombiniert (lexikalisches Matching, Wichtigkeit, Aktualität).

mermaid

graph TB
    QUERY["Recall-Abfrage<br/>'SQL injection prevention'"]
    QEMBED["Abfrage-Embedding<br/>[0.12, -0.03, 0.87, ...]"]

    subgraph Storage["Gespeicherte Speichervektoren"]
        M1["Erinnerung 1<br/>[0.11, -0.02, 0.85, ...]<br/>Ähnlichkeit: 0,97"]
        M2["Erinnerung 2<br/>[0.45, 0.12, -0.33, ...]<br/>Ähnlichkeit: 0,23"]
        M3["Erinnerung 3<br/>[0.09, -0.05, 0.82, ...]<br/>Ähnlichkeit: 0,94"]
    end

    RESULTS["Geordnete Ergebnisse<br/>1. Erinnerung 1 (0,97)<br/>2. Erinnerung 3 (0,94)<br/>3. Erinnerung 2 (0,23)"]

    QUERY --> QEMBED
    QEMBED --> M1
    QEMBED --> M2
    QEMBED --> M3
    M1 --> RESULTS
    M2 --> RESULTS
    M3 --> RESULTS

Kosinus-Ähnlichkeit

PRX-Memory verwendet Kosinus-Ähnlichkeit als Distanzmetrik. Kosinus-Ähnlichkeit misst den Winkel zwischen zwei Vektoren, unabhängig von der Magnitude:

similarity(A, B) = (A . B) / (|A| * |B|)

Score	Bedeutung
0,95--1,0	Fast identische Bedeutung
0,80--0,95	Stark verwandt
0,60--0,80	Etwas verwandt
< 0,60	Wahrscheinlich nicht verwandt

Kombiniertes Ranking

Vektorähnlichkeit ist ein Signal in PRX-Memorys Multi-Signal-Ranking. Der finale Score kombiniert:

Signal	Gewichtung	Beschreibung
Vektorähnlichkeit	Hoch	Semantische Relevanz aus Embedding-Vergleich
Lexikalisches Matching	Mittel	Keyword-Überlappung zwischen Abfrage und Erinnerungstext
Wichtigkeitsscore	Mittel	Benutzer-zugewiesene oder systemberechnete Wichtigkeit
Aktualität	Niedrig	Neuere Erinnerungen erhalten einen kleinen Bonus

Die genaue Gewichtung hängt von der Recall-Konfiguration und davon ab, ob Embeddings und Reranking aktiviert sind.

Leistung

Der 100k-Eintrags-Benchmark zeigt:

Metrik	Wert
Datensatzgröße	100.000 Einträge
p95-Latenz	122,683ms
Schwellenwert	< 300ms
Methode	Lexikalisch + Wichtigkeit + Aktualität (ohne Netzwerkaufrufe)

INFO

Dieser Benchmark misst nur den Retrieval-Ranking-Pfad, ohne Netzwerk-Embedding- oder Rerank-Aufrufe. Die End-to-End-Latenz hängt von den Provider-Antwortzeiten ab.

Skalierungsüberlegungen

Datensatzgröße	Empfohlener Ansatz
< 10.000	Brute-Force-Kosinus-Ähnlichkeit (JSON- oder SQLite-Backend)
10.000--100.000	SQLite mit In-Memory-Vektorscan
> 100.000	LanceDB mit ANN-Indizierung

Für Datensätze über 100.000 Einträge das LanceDB-Backend für Approximate-Nearest-Neighbor (ANN)-Suche aktivieren, das sub-lineare Abfragezeit bietet.

Nächste Schritte

Embedding-Engine -- Wie Vektoren generiert werden
Reranking -- Zweistufige Präzisionsverbesserung
Speicher-Backends -- Das richtige Speicher-Backend wählen

Vektorsuche ​

Funktionsweise ​

Kosinus-Ähnlichkeit ​

Kombiniertes Ranking ​

Leistung ​

Skalierungsüberlegungen ​

Nächste Schritte ​