Skip to content
このページは AI の支援により作成・翻訳されました。誤りがあれば、改善にご協力ください。 GitHub で編集

KNN ルーター

KNN(K 近傍法)ルーターは、セマンティック類似度を使用して、最適なモデル割り当てが判明している過去のクエリのデータベースと受信クエリを照合します。これにより、時間の経過とともに改善される学習型ルーティングが実現します。

仕組み

  1. クエリの埋め込み -- 受信クエリをベクトルエンベディングに変換
  2. KNN 検索 -- エンベディングストアで最も類似した K 個の過去のクエリを検索
  3. 投票 -- K 個の近傍のモデル割り当てを集計
  4. 選択 -- 最多票を獲得したモデルを選択(類似度で重み付け)

学習データ

KNN ルーターは以下からデータセットを構築します:

  • 品質評価付きのエージェントセッションログ
  • プロンプト進化からの A/B テスト結果
  • 手動フィードバックと修正

設定

toml
[router]
strategy = "knn"

[router.knn]
k = 5
embedding_provider = "ollama"
embedding_model = "nomic-embed-text"
min_similarity = 0.6
min_dataset_size = 100
fallback_strategy = "heuristic"

コールドスタート

学習データが不十分な場合(min_dataset_size 未満)、KNN ルーターはヒューリスティック戦略にフォールバックします。

関連ページ

Released under the Apache-2.0 License.