KNN ルーター
KNN(K 近傍法)ルーターは、セマンティック類似度を使用して、最適なモデル割り当てが判明している過去のクエリのデータベースと受信クエリを照合します。これにより、時間の経過とともに改善される学習型ルーティングが実現します。
仕組み
- クエリの埋め込み -- 受信クエリをベクトルエンベディングに変換
- KNN 検索 -- エンベディングストアで最も類似した K 個の過去のクエリを検索
- 投票 -- K 個の近傍のモデル割り当てを集計
- 選択 -- 最多票を獲得したモデルを選択(類似度で重み付け)
学習データ
KNN ルーターは以下からデータセットを構築します:
- 品質評価付きのエージェントセッションログ
- プロンプト進化からの A/B テスト結果
- 手動フィードバックと修正
設定
toml
[router]
strategy = "knn"
[router.knn]
k = 5
embedding_provider = "ollama"
embedding_model = "nomic-embed-text"
min_similarity = 0.6
min_dataset_size = 100
fallback_strategy = "heuristic"コールドスタート
学習データが不十分な場合(min_dataset_size 未満)、KNN ルーターはヒューリスティック戦略にフォールバックします。