위협 모델
이 페이지는 PRX 위협 모델 -- 고려하는 위협 세트, 보안 가정, 적용된 완화 조치를 문서화합니다.
위협 카테고리
1. 프롬프트 인젝션
위협: 사용자 입력 또는 검색된 데이터의 적대적 콘텐츠가 에이전트를 조종하여 의도하지 않은 작업을 수행하게 합니다.
완화 조치:
- 도구 호출 승인 워크플로우
- 정책 엔진이 사용 가능한 작업 제한
- 알려진 인젝션 패턴에 대한 입력 정제
2. 도구 남용
위협: 에이전트가 의도하지 않은 방식으로 도구를 사용합니다 (예: 민감한 파일 읽기, 무단 네트워크 요청).
완화 조치:
- 도구 실행을 위한 샌드박스 격리
- 기본 거부 규칙이 적용된 정책 엔진
- 도구별 레이트 리밋
- 모든 도구 호출의 감사 로깅
3. 데이터 유출
위협: 로컬 시스템의 민감한 데이터가 LLM 컨텍스트나 도구 호출을 통해 외부 서비스로 전송됩니다.
완화 조치:
- 샌드박스의 네트워크 허용 목록
- 민감한 패턴 (API 키, 비밀번호)에 대한 콘텐츠 필터링
- 데이터 흐름을 제한하는 정책 규칙
4. 공급망
위협: 악성 플러그인이나 의존성이 에이전트를 손상시킵니다.
완화 조치:
- 플러그인을 위한 WASM 샌드박스
- 플러그인 권한 매니페스트
- 의존성 감사 (cargo audit)
보안 가정
- 호스트 운영 체제는 신뢰됩니다
- LLM 프로바이더가 API 키를 안전하게 처리합니다
- 사용자는 승인이 필요한 경우 에이전트 작업을 검토할 책임이 있습니다
취약점 보고
보안 취약점을 발견하시면 [email protected]로 보고해 주세요.