Skip to content
このページは AI の支援により作成・翻訳されました。誤りがあれば、改善にご協力ください。 GitHub で編集

サポートされる埋め込みモデル

PRX-Memoryはprx-memory-embedクレートの統一アダプタインターフェースを通じて3つの埋め込みプロバイダファミリーをサポートします。

OpenAI互換

OpenAI埋め込みエンドポイント形式(/v1/embeddings)に従う任意のAPIが使用できます。OpenAI自体、Azure OpenAI、ローカル推論サーバーなどが含まれます。

bash
PRX_EMBED_PROVIDER=openai-compatible
PRX_EMBED_API_KEY=your_openai_key
PRX_EMBED_MODEL=text-embedding-3-small
PRX_EMBED_BASE_URL=https://api.openai.com  # optional
モデル次元数備考
text-embedding-3-small1536品質とコストのバランスが良い
text-embedding-3-large3072最高品質、高コスト
text-embedding-ada-0021536レガシーモデル

ローカル推論

プライバシーに敏感なデプロイメントでは、PRX_EMBED_BASE_URLをオープンソース埋め込みモデルを実行するローカル推論サーバー(Ollama、vLLM、text-embeddings-inferenceなど)に向けてください。

Jina AI

Jinaは検索タスクに最適化された高品質な多言語埋め込みモデルを提供します。

bash
PRX_EMBED_PROVIDER=jina
PRX_EMBED_API_KEY=your_jina_key
PRX_EMBED_MODEL=jina-embeddings-v3
モデル次元数備考
jina-embeddings-v31024最新の多言語モデル
jina-embeddings-v2-base-en768英語最適化
jina-embeddings-v2-base-code768コード最適化

フォールバックキー

PRX_EMBED_API_KEYが設定されていない場合、システムはフォールバックとしてJINA_API_KEYをチェックします。

Google Gemini

Gemini埋め込みモデルはGoogle AI APIを通じて利用できます。

bash
PRX_EMBED_PROVIDER=gemini
PRX_EMBED_API_KEY=your_gemini_key
PRX_EMBED_MODEL=text-embedding-004
モデル次元数備考
text-embedding-004768現在推奨のモデル
embedding-001768レガシーモデル

フォールバックキー

PRX_EMBED_API_KEYが設定されていない場合、システムはフォールバックとしてGEMINI_API_KEYをチェックします。

モデルの選び方

優先事項推奨モデルプロバイダ
最高品質text-embedding-3-largeOpenAI互換
コード向け最適jina-embeddings-v2-base-codeJina
多言語jina-embeddings-v3Jina
プライバシー/ローカルopenai-compatible経由の任意のローカルモデルセルフホスト
コスト効率text-embedding-3-smallOpenAI互換

モデルの切り替え

埋め込みモデルを切り替えると、既存のベクトルは新しいモデルのベクトル空間と互換性がなくなります。memory_reembedツールを使用して新しいモデルですべての保存済みメモリを再埋め込みします:

json
{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "memory_reembed",
    "arguments": {}
  }
}

WARNING

再埋め込みはすべての保存済みメモリに対してAPI呼び出しが必要です。大規模なデータベースでは、これには相当な時間とAPIコストがかかる場合があります。使用量の少ない時間帯に再埋め込みを計画してください。

次のステップ

Released under the Apache-2.0 License.