PRX-Memory
PRX-Memory ist eine lokale semantische Speicher-Engine für Coding-Agenten. Sie kombiniert Embedding-basiertes Retrieval, Reranking, Governance-Kontrollen und messbare Evolution in einer einzelnen MCP-kompatiblen Komponente. PRX-Memory wird als eigenständiger Daemon (prx-memoryd) geliefert, der über stdio oder HTTP kommuniziert und mit Codex, Claude Code, OpenClaw, OpenPRX und jedem anderen MCP-Client kompatibel ist.
PRX-Memory konzentriert sich auf wiederverwendbares Engineering-Wissen, nicht auf rohe Protokolle. Das System speichert strukturierte Erinnerungen mit Tags, Scopes und Wichtigkeitsbewertungen und ruft sie mit einer Kombination aus lexikalischer Suche, Vektorähnlichkeit und optionalem Reranking ab -- alles durch Qualitäts- und Sicherheitseinschränkungen gesteuert.
Warum PRX-Memory?
Die meisten Coding-Agenten behandeln Speicher als Nachgedanken -- flache Dateien, unstrukturierte Protokolle oder anbietergebundene Cloud-Dienste. PRX-Memory verfolgt einen anderen Ansatz:
- Lokal zuerst. Alle Daten bleiben auf Ihrem Computer. Keine Cloud-Abhängigkeit, keine Telemetrie, keine Daten verlassen Ihr Netzwerk.
- Strukturiert und gesteuert. Jeder Speichereintrag folgt einem standardisierten Format mit Tags, Scopes, Kategorien und Qualitätseinschränkungen. Tag-Normalisierung und Verhältnisbeschränkungen verhindern Drift.
- Semantisches Retrieval. Kombiniert lexikalisches Matching mit Vektorähnlichkeit und optionalem Reranking, um die relevantesten Erinnerungen für einen gegebenen Kontext zu finden.
- Messbare Evolution. Das
memory_evolve-Tool verwendet Train/Holdout-Splits und Constraint-Gating, um Kandidatenverbesserungen zu akzeptieren oder abzulehnen -- kein Rätselraten. - MCP-nativ. Erstklassige Unterstützung für das Model Context Protocol über stdio und HTTP-Transporte, mit Ressourcentemplates, Skill-Manifesten und Streaming-Sitzungen.
Hauptfunktionen
Multi-Provider-Embedding -- Unterstützt OpenAI-kompatible, Jina- und Gemini-Embedding-Provider durch eine einheitliche Adapter-Schnittstelle. Provider durch Änderung einer Umgebungsvariablen wechseln.
Reranking-Pipeline -- Optionales zweistufiges Reranking mit Jina-, Cohere- oder Pinecone-Rerankern zur Verbesserung der Retrieval-Präzision über rohe Vektorähnlichkeit hinaus.
Governance-Kontrollen -- Strukturiertes Speicherformat mit Tag-Normalisierung, Verhältnisbeschränkungen, periodischer Wartung und Qualitätseinschränkungen sorgen für dauerhaft hohe Speicherqualität.
Speicher-Evolution -- Das
memory_evolve-Tool bewertet Kandidatenänderungen mithilfe von Train/Holdout-Akzeptanztests und Constraint-Gating und bietet messbare Verbesserungsgarantien.Dual-Transport-MCP-Server -- Als stdio-Server für direkte Integration oder als HTTP-Server mit Integritätsprüfungen, Prometheus-Metriken und Streaming-Sitzungen betreiben.
Skill-Verteilung -- Eingebaute Governance-Skill-Pakete, die über MCP-Ressourcen- und Tool-Protokolle auffindbar sind, mit Nutzlastvorlagen für standardisierte Speicheroperationen.
Beobachtbarkeit -- Prometheus-Metriken-Endpunkt, Grafana-Dashboard-Vorlagen, konfigurierbare Alarmschwellenwerte und Kardinalitätskontrollen für Produktionsbereitstellungen.
Architektur
graph TB
CLIENT["MCP-Client<br/>Codex | Claude Code | OpenClaw"]
subgraph Transport["Transport-Schicht"]
STDIO["stdio-Transport"]
HTTP["HTTP-Transport<br/>Health | Metriken | SSE"]
end
subgraph Engine["Speicher-Engine"]
GOVERN["Governance-Schicht<br/>Tag-Normalisierung | Verhältnisbeschr. | Qualitätsbeschr."]
RETRIEVE["Retrieval-Schicht<br/>Lexikalische Suche | Vektorähnlichkeit"]
RERANK["Rerank-Schicht<br/>Jina | Cohere | Pinecone"]
EVOLVE["Evolution-Schicht<br/>Train/Holdout | Constraint-Gating"]
end
subgraph Providers["KI-Provider"]
EMBED["Embedding-Provider<br/>OpenAI-kompatibel | Jina | Gemini"]
RERANKP["Rerank-Provider<br/>Jina | Cohere | Pinecone"]
end
subgraph Storage["Speicher"]
JSON["JSON-Backend<br/>Dateibasiert"]
SQLITE["SQLite + Vektor<br/>Lokal persistent"]
end
CLIENT --> STDIO
CLIENT --> HTTP
STDIO --> GOVERN
HTTP --> GOVERN
GOVERN --> RETRIEVE
RETRIEVE --> RERANK
RERANK --> EVOLVE
RETRIEVE --> EMBED
RERANK --> RERANKP
GOVERN --> JSON
GOVERN --> SQLITESchnellstart
Daemon erstellen und ausführen:
cargo build -p prx-memory-mcp --bin prx-memoryd
PRX_MEMORYD_TRANSPORT=stdio \
PRX_MEMORY_DB=./data/memory-db.json \
./target/debug/prx-memorydOder über Cargo installieren:
cargo install prx-memory-mcpSiehe den Installationsleitfaden für alle Methoden und Konfigurationsoptionen.
Workspace-Crates
| Crate | Beschreibung |
|---|---|
prx-memory-core | Kern-Bewertungs- und Evolutionsdomänen-Primitive |
prx-memory-embed | Embedding-Provider-Abstraktion und Adapter |
prx-memory-rerank | Rerank-Provider-Abstraktion und Adapter |
prx-memory-ai | Einheitliche Provider-Abstraktion für Embeddings und Reranking |
prx-memory-skill | Eingebaute Governance-Skill-Nutzlasten |
prx-memory-storage | Lokale persistente Speicher-Engine (JSON, SQLite, LanceDB) |
prx-memory-mcp | MCP-Server-Oberfläche mit stdio- und HTTP-Transporten |
Dokumentationsabschnitte
| Abschnitt | Beschreibung |
|---|---|
| Installation | Aus dem Quellcode erstellen oder über Cargo installieren |
| Schnellstart | PRX-Memory in 5 Minuten zum Laufen bringen |
| Embedding-Engine | Embedding-Provider und Stapelverarbeitung |
| Unterstützte Modelle | OpenAI-kompatibel, Jina, Gemini-Modelle |
| Reranking-Engine | Zweistufige Reranking-Pipeline |
| Speicher-Backends | JSON, SQLite und Vektorsuche |
| MCP-Integration | MCP-Protokoll, Tools, Ressourcen und Vorlagen |
| Rust-API-Referenz | Bibliotheks-API zum Einbetten von PRX-Memory in Rust-Projekte |
| Konfiguration | Alle Umgebungsvariablen und Profile |
| Fehlerbehebung | Häufige Probleme und Lösungen |
Projektinfo
- Lizenz: MIT OR Apache-2.0
- Sprache: Rust (2024 Edition)
- Repository: github.com/openprx/prx-memory
- Mindest-Rust: Stable Toolchain
- Transporte: stdio, HTTP