이 페이지는 AI의 도움으로 작성 및 번역되었습니다. 부정확한 내용이 있으면 개선에 참여해 주세요. GitHub에서 편집

위협 모델

이 페이지는 PRX 위협 모델 -- 고려하는 위협 세트, 보안 가정, 적용된 완화 조치를 문서화합니다.

위협 카테고리

1. 프롬프트 인젝션

위협: 사용자 입력 또는 검색된 데이터의 적대적 콘텐츠가 에이전트를 조종하여 의도하지 않은 작업을 수행하게 합니다.

완화 조치:

도구 호출 승인 워크플로우
정책 엔진이 사용 가능한 작업 제한
알려진 인젝션 패턴에 대한 입력 정제

2. 도구 남용

위협: 에이전트가 의도하지 않은 방식으로 도구를 사용합니다 (예: 민감한 파일 읽기, 무단 네트워크 요청).

완화 조치:

도구 실행을 위한 샌드박스 격리
기본 거부 규칙이 적용된 정책 엔진
도구별 레이트 리밋
모든 도구 호출의 감사 로깅

3. 데이터 유출

위협: 로컬 시스템의 민감한 데이터가 LLM 컨텍스트나 도구 호출을 통해 외부 서비스로 전송됩니다.

완화 조치:

샌드박스의 네트워크 허용 목록
민감한 패턴 (API 키, 비밀번호)에 대한 콘텐츠 필터링
데이터 흐름을 제한하는 정책 규칙

4. 공급망

위협: 악성 플러그인이나 의존성이 에이전트를 손상시킵니다.

완화 조치:

플러그인을 위한 WASM 샌드박스
플러그인 권한 매니페스트
의존성 감사 (cargo audit)

보안 가정

호스트 운영 체제는 신뢰됩니다
LLM 프로바이더가 API 키를 안전하게 처리합니다
사용자는 승인이 필요한 경우 에이전트 작업을 검토할 책임이 있습니다

취약점 보고

보안 취약점을 발견하시면 [email protected]로 보고해 주세요.

관련 페이지