Threat Model

This page documents the PRX threat model -- the set of threats we envisagez, our security assumptions, and the mitigations in place.

Threat Categories

Threat: Adversarial content in user input or retrieved data manipulates l'agent into performing unintended actions.

Mitigations:

Threat: L'agent uses tools in unintended ways (e.g., reading sensitive files, making unauthorized network requests).

Mitigations:

Threat: Sensitive data depuis le local system est envoye a external services via LLM context or appels d'outils.

Mitigations:

Threat: Malicious plugins or dependencies compromise l'agent.

Mitigations:

L'hote operating system is trusted
LLM fournisseurs handle API keys securely
L'utilisateur est responsable de reviewing agent actions when approval est requis

Si vous discover a security vulnerability, please report it to [email protected].