Skip to content
Diese Seite wurde mit KI-Unterstützung erstellt und übersetzt. Falls Ihnen Ungenauigkeiten auffallen, helfen Sie gerne bei der Verbesserung. Auf GitHub bearbeiten

Unterstützte Embedding-Modelle

PRX-Memory unterstützt drei Embedding-Provider-Familien. Jeder Provider verbindet sich über die einheitliche Adapter-Schnittstelle des prx-memory-embed-Crates.

OpenAI-kompatibel

Jede API, die das OpenAI-Embedding-Endpunktformat (/v1/embeddings) folgt, kann verwendet werden. Dies umfasst OpenAI selbst, Azure OpenAI und lokale Inferenzserver.

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com  # optional
ModellDimensionenHinweise
text-embedding-3-small1536Gute Balance zwischen Qualität und Kosten
text-embedding-3-large3072Höchste Qualität, höhere Kosten
text-embedding-ada-0021536Legacy-Modell

Lokale Inferenz

Für datenschutzsensitive Bereitstellungen PRX_EMBED_BASE_URL auf einen lokalen Inferenzserver zeigen lassen, der ein Open-Source-Embedding-Modell ausführt (z.B. via Ollama, vLLM oder text-embeddings-inference).

Jina AI

Jina bietet hochwertige mehrsprachige Embedding-Modelle, optimiert für Retrieval-Aufgaben.

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
ModellDimensionenHinweise
jina-embeddings-v31024Neuestes mehrsprachiges Modell
jina-embeddings-v2-base-en768Englisch-optimiert
jina-embeddings-v2-base-code768Code-optimiert

Fallback-Schlüssel

Wenn PRX_EMBED_API_KEY nicht gesetzt ist, prüft das System JINA_API_KEY als Fallback.

Google Gemini

Gemini-Embedding-Modelle sind über die Google-AI-API verfügbar.

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
ModellDimensionenHinweise
text-embedding-004768Aktuell empfohlenes Modell
embedding-001768Legacy-Modell

Fallback-Schlüssel

Wenn PRX_EMBED_API_KEY nicht gesetzt ist, prüft das System GEMINI_API_KEY als Fallback.

Modell auswählen

PrioritätEmpfohlenes ModellProvider
Beste Qualitättext-embedding-3-largeOpenAI-kompatibel
Beste für Codejina-embeddings-v2-base-codeJina
Mehrsprachigjina-embeddings-v3Jina
Datenschutz / lokalBeliebiges lokales Modell via openai-compatibleSelf-hosted
Kosteneffektivtext-embedding-3-smallOpenAI-kompatibel

Modelle wechseln

Beim Wechsel von Embedding-Modellen werden vorhandene Vektoren mit dem Vektorraum des neuen Modells inkompatibel. Das memory_reembed-Tool verwenden, um alle gespeicherten Erinnerungen mit dem neuen Modell neu einzubetten:

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

WARNING

Neu-Embedding erfordert API-Aufrufe für jeden gespeicherten Speichereintrag. Bei großen Datenbanken kann dies erhebliche Zeit in Anspruch nehmen und API-Kosten verursachen. Neu-Embedding in Zeiten geringer Nutzung planen.

Nächste Schritte

Released under the Apache-2.0 License.