Skip to content
Эта страница создана и переведена с помощью ИИ. Если вы заметили неточности, помогите нам улучшить её. Редактировать на GitHub

Архитектура среды выполнения агента

Среда выполнения агента PRX — это ядро движка выполнения, которое управляет всем автономным поведением агента. Она управляет жизненным циклом сессий агента, координирует диспетчеризацию инструментов, обрабатывает потоковые ответы и обеспечивает соблюдение ограничений ресурсов.

Обзор архитектуры

Среда выполнения построена на событийно-управляемой архитектуре, где каждая сессия агента работает в изолированном контексте выполнения. Основные компоненты:

  • Менеджер сессий — создаёт и отслеживает активные сессии агента
  • Цикл агента — центральный цикл диспетчеризации, обрабатывающий ответы LLM и выполняющий вызовы инструментов
  • Уровень памяти — обеспечивает извлечение контекста и компактизацию между ходами
  • Реестр инструментов — управляет доступными инструментами и их политиками разрешений
┌─────────────────────────────────────────┐
│              Менеджер сессий             │
│  ┌───────────┐  ┌───────────┐           │
│  │ Сессия A   │  │ Сессия B   │  ...     │
│  │ ┌───────┐  │  │ ┌───────┐  │         │
│  │ │ Цикл  │  │  │ │ Цикл  │  │         │
│  │ │ Память│  │  │ │ Память│  │         │
│  │ │ Инстр.│  │  │ │ Инстр.│  │         │
│  │ └───────┘  │  │ └───────┘  │         │
│  └───────────┘  └───────────┘           │
└─────────────────────────────────────────┘

Модель выполнения

Каждая сессия агента следует циклу запрос-ответ:

  1. Получение пользовательского ввода — текстовое сообщение, результат инструмента или системное событие
  2. Формирование контекста — сборка системного промпта, памяти и истории разговора
  3. Инференс LLM — потоковая передача ответа от настроенного провайдера
  4. Диспетчеризация инструментов — если LLM генерирует вызовы инструментов, выполнение их в песочнице
  5. Продолжение или возврат — продолжение цикла, если инструменты были вызваны, или возврат финального ответа

Конфигурация

Поведение среды выполнения можно настроить в config.toml:

toml
[agent]
max_turns = 50
max_tool_calls_per_turn = 10
session_timeout_secs = 3600
stream_buffer_size = 64

[agent.limits]
max_concurrent_sessions = 8
max_memory_mb = 512

Изоляция процессов

Сессии агента могут опционально выполняться в отдельных процессах для изоляции сбоев. Подробности модели выполнения с изоляцией процессов — в разделе Рабочий процесс сессии.

Связанные страницы

Released under the Apache-2.0 License.