Skip to content

自进化系统

PRX 包含一个三层自进化系统,使 Agent 能够随时间自主改善其行为。系统持续分析 Agent 性能并应用渐进式改进 -- 从记忆优化到提示词调优再到策略级策略变更。

概述

自进化分为三个层次,每个层次在不同的抽象级别上运作:

层级范围频率风险
L1: 记忆记忆压缩、主题聚类每次会话
L2: 提示词系统提示词优化、A/B 测试每天/每周
L3: 策略工具策略、路由规则、治理调优每周/每月

架构

┌───────────────────────────────────────┐
│           自进化引擎                    │
│                                        │
│  L3: 策略层    ← 低频率                 │
│    ├── 工具策略调优                     │
│    ├── 路由优化                         │
│    └── 治理参数调整                     │
│                                        │
│  L2: 提示词层  ← 中频率                 │
│    ├── 系统提示词精炼                   │
│    └── A/B 测试框架                     │
│                                        │
│  L1: 记忆层    ← 高频率                 │
│    ├── 记忆压缩                         │
│    └── 主题聚类                         │
└───────────────────────────────────────┘

安全优先

每个进化提案在执行前都会通过安全流水线。详见 安全 了解回滚保护和完整性检查。

配置

toml
[self_evolution]
enabled = false  # 仅 opt-in
auto_apply = false  # 默认需要手动批准

[self_evolution.l1]
enabled = true
schedule = "after_session"

[self_evolution.l2]
enabled = false
schedule = "weekly"

[self_evolution.l3]
enabled = false
schedule = "monthly"
require_approval = true

相关页面

Released under the Apache-2.0 License.