Skip to content
이 페이지는 AI의 도움으로 작성 및 번역되었습니다. 부정확한 내용이 있으면 개선에 참여해 주세요. GitHub에서 편집

위협 모델

이 페이지는 PRX 위협 모델 -- 고려하는 위협 세트, 보안 가정, 적용된 완화 조치를 문서화합니다.

위협 카테고리

1. 프롬프트 인젝션

위협: 사용자 입력 또는 검색된 데이터의 적대적 콘텐츠가 에이전트를 조종하여 의도하지 않은 작업을 수행하게 합니다.

완화 조치:

  • 도구 호출 승인 워크플로우
  • 정책 엔진이 사용 가능한 작업 제한
  • 알려진 인젝션 패턴에 대한 입력 정제

2. 도구 남용

위협: 에이전트가 의도하지 않은 방식으로 도구를 사용합니다 (예: 민감한 파일 읽기, 무단 네트워크 요청).

완화 조치:

  • 도구 실행을 위한 샌드박스 격리
  • 기본 거부 규칙이 적용된 정책 엔진
  • 도구별 레이트 리밋
  • 모든 도구 호출의 감사 로깅

3. 데이터 유출

위협: 로컬 시스템의 민감한 데이터가 LLM 컨텍스트나 도구 호출을 통해 외부 서비스로 전송됩니다.

완화 조치:

  • 샌드박스의 네트워크 허용 목록
  • 민감한 패턴 (API 키, 비밀번호)에 대한 콘텐츠 필터링
  • 데이터 흐름을 제한하는 정책 규칙

4. 공급망

위협: 악성 플러그인이나 의존성이 에이전트를 손상시킵니다.

완화 조치:

  • 플러그인을 위한 WASM 샌드박스
  • 플러그인 권한 매니페스트
  • 의존성 감사 (cargo audit)

보안 가정

  • 호스트 운영 체제는 신뢰됩니다
  • LLM 프로바이더가 API 키를 안전하게 처리합니다
  • 사용자는 승인이 필요한 경우 에이전트 작업을 검토할 책임이 있습니다

취약점 보고

보안 취약점을 발견하시면 [email protected]로 보고해 주세요.

관련 페이지

Released under the Apache-2.0 License.