Архитектура среды выполнения агента

Среда выполнения агента PRX — это ядро движка выполнения, которое управляет всем автономным поведением агента. Она управляет жизненным циклом сессий агента, координирует диспетчеризацию инструментов, обрабатывает потоковые ответы и обеспечивает соблюдение ограничений ресурсов.

Обзор архитектуры

Среда выполнения построена на событийно-управляемой архитектуре, где каждая сессия агента работает в изолированном контексте выполнения. Основные компоненты:

Менеджер сессий — создаёт и отслеживает активные сессии агента
Цикл агента — центральный цикл диспетчеризации, обрабатывающий ответы LLM и выполняющий вызовы инструментов
Уровень памяти — обеспечивает извлечение контекста и компактизацию между ходами
Реестр инструментов — управляет доступными инструментами и их политиками разрешений

┌─────────────────────────────────────────┐
│              Менеджер сессий             │
│  ┌───────────┐  ┌───────────┐           │
│  │ Сессия A   │  │ Сессия B   │  ...     │
│  │ ┌───────┐  │  │ ┌───────┐  │         │
│  │ │ Цикл  │  │  │ │ Цикл  │  │         │
│  │ │ Память│  │  │ │ Память│  │         │
│  │ │ Инстр.│  │  │ │ Инстр.│  │         │
│  │ └───────┘  │  │ └───────┘  │         │
│  └───────────┘  └───────────┘           │
└─────────────────────────────────────────┘

Модель выполнения

Каждая сессия агента следует циклу запрос-ответ:

Получение пользовательского ввода — текстовое сообщение, результат инструмента или системное событие
Формирование контекста — сборка системного промпта, памяти и истории разговора
Инференс LLM — потоковая передача ответа от настроенного провайдера
Диспетчеризация инструментов — если LLM генерирует вызовы инструментов, выполнение их в песочнице
Продолжение или возврат — продолжение цикла, если инструменты были вызваны, или возврат финального ответа

Конфигурация

Поведение среды выполнения можно настроить в config.toml:

toml

[agent]
max_turns = 50
max_tool_calls_per_turn = 10
session_timeout_secs = 3600
stream_buffer_size = 64

[agent.limits]
max_concurrent_sessions = 8
max_memory_mb = 512

Изоляция процессов

Сессии агента могут опционально выполняться в отдельных процессах для изоляции сбоев. Подробности модели выполнения с изоляцией процессов — в разделе Рабочий процесс сессии.

Связанные страницы

Цикл агента — диспетчеризация инструментов, потоковая передача, извлечение памяти
Суб-агенты — порождение дочерних агентов с контролем параллельности
Рабочий процесс сессии — выполнение сессий с изоляцией процессов

Архитектура среды выполнения агента ​

Обзор архитектуры ​

Модель выполнения ​

Конфигурация ​

Изоляция процессов ​

Связанные страницы ​