Skip to content
本页内容由 AI 辅助生成与翻译,如有不当之处,欢迎协助改进。 在 GitHub 上编辑

支持的嵌入模型

PRX-Memory 支持三个嵌入供应商系列。每个供应商通过 prx-memory-embed crate 的统一适配器接口连接。

OpenAI 兼容

任何遵循 OpenAI 嵌入端点格式(/v1/embeddings)的 API 都可以使用。包括 OpenAI 本身、Azure OpenAI 和本地推理服务器。

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com  # 可选
模型维度备注
text-embedding-3-small1536质量和成本的良好平衡
text-embedding-3-large3072最高质量,成本较高
text-embedding-ada-0021536旧版模型

本地推理

对于隐私敏感的部署,将 PRX_EMBED_BASE_URL 指向运行开源嵌入模型的本地推理服务器(例如通过 Ollama、vLLM 或 text-embeddings-inference)。

Jina AI

Jina 提供针对检索任务优化的高质量多语言嵌入模型。

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
模型维度备注
jina-embeddings-v31024最新多语言模型
jina-embeddings-v2-base-en768英语优化
jina-embeddings-v2-base-code768代码优化

备用密钥

如果未设置 PRX_EMBED_API_KEY,系统会检查 JINA_API_KEY 作为备用。

Google Gemini

Gemini 嵌入模型通过 Google AI API 提供。

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
模型维度备注
text-embedding-004768当前推荐模型
embedding-001768旧版模型

备用密钥

如果未设置 PRX_EMBED_API_KEY,系统会检查 GEMINI_API_KEY 作为备用。

选择模型

优先级推荐模型供应商
最佳质量text-embedding-3-largeOpenAI 兼容
最适合代码jina-embeddings-v2-base-codeJina
多语言jina-embeddings-v3Jina
隐私/本地部署任何本地模型通过 openai-compatible自托管
性价比text-embedding-3-smallOpenAI 兼容

切换模型

切换嵌入模型时,现有向量与新模型的向量空间不兼容。使用 memory_reembed 工具将所有存储的记忆用新模型重新嵌入:

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

WARNING

重新嵌入需要对每条存储的记忆进行 API 调用。对于大型数据库,这可能需要较长时间并产生 API 费用。请在低使用率时段计划重新嵌入。

下一步

Released under the Apache-2.0 License.