ბრაუზერის ინსტრუმენტი
ბრაუზერის ინსტრუმენტი PRX აგენტებს სრული ვებ ავტომატიზაციის შესაძლებლობებს აძლევს -- გვერდებზე ნავიგაცია, ფორმების შევსება, ელემენტებზე დაწკაპუნება, კონტენტის ამოღება და ეკრანის ანაბეჭდების გადაღება. იგი ჩანაცვლებადი ბექენდის არქიტექტურას იყენებს სამი ავტომატიზაციის ძრავის მხარდაჭერით და დომენის შეზღუდვებს აღასრულებს.
ბრაუზერის ინსტრუმენტები ფუნქციით გეითირებულია და მოითხოვს browser.enabled = true კონფიგურაციაში.
კონფიგურაცია
[browser]
enabled = true
backend = "agent_browser" # "agent_browser" | "rust_native" | "computer_use"
allowed_domains = ["github.com", "docs.rs", "*.openprx.dev", "stackoverflow.com"]
session_name = "default" # დასახელებული ბრაუზერის სესია მუდმივი მდგომარეობისთვისბექენდის ვარიანტები
| ბექენდი | აღწერა | დამოკიდებულებები | საუკეთესო |
|---|---|---|---|
agent_browser | გარე agent-browser CLI ინსტრუმენტის გამოძახება | agent-browser ბინარი PATH-ში | ზოგადი ვებ ავტომატიზაცია, JavaScript-ით მძიმე საიტები |
rust_native | ჩაშენებული Rust ბრაუზერის იმპლემენტაცია headless Chrome/Chromium-ით | Chromium დაყენებული | მსუბუქი ავტომატიზაცია, გარე დამოკიდებულებების გარეშე |
computer_use | Computer-use საიდქარი სრული დესკტოპის ინტერაქციისთვის | Anthropic computer-use საიდქარი | ოპერაციული სისტემის დონის ინტერაქციები |
დომენის შეზღუდვები
allowed_domains სია აკონტროლებს, რომელ დომენებზე შეუძლია ბრაუზერს წვდომა:
- ზუსტი შესაბამისობა:
"github.com"მხოლოდgithub.com-ს ემთხვევა - ქვედომენის ბადალი:
"*.openprx.dev"ემთხვევაdocs.openprx.dev,api.openprx.devდა სხვ.
გამოყენება
browser ინსტრუმენტი
ძირითადი browser ინსტრუმენტი მრავალ მოქმედებას უჭერს მხარს: navigate, fill, click, screenshot, content, scroll, wait, back, forward.
browser_open ინსტრუმენტი
გამარტივებული ინსტრუმენტი URL-ის გახსნისა და კონტენტის დასაბრუნებლად:
{
"name": "browser_open",
"arguments": {
"url": "https://docs.rs/tokio/latest/tokio/"
}
}უსაფრთხოება
დომენის ნებართვების სია
ბრაუზერის ინსტრუმენტი მკაცრ დომენის ნებართვების სიას აღასრულებს. ნებისმიერ URL-ზე ნავიგაციამდე ჰოსტის სახელი allowed_domains-თან მოწმდება.
სესიის იზოლაცია
ბრაუზერის სესიები სახელით იზოლირებულია. სხვადასხვა აგენტის სესიებს შეუძლია ცალკეული ბრაუზერის კონტექსტები გამოიყენოს მდგომარეობის გაჟონვის თავიდან ასაცილებლად.
პოლიტიკის ძრავი
[security.tool_policy.tools]
browser = "supervised"
browser_open = "allow"დაკავშირებული გვერდები
- ვებ ძიება -- ვებში ძიება ბრაუზერის ავტომატიზაციის გარეშე
- HTTP Request -- API-ებზე პროგრამული HTTP მოთხოვნები
- Shell-ის შესრულება -- ალტერნატივა CLI-ზე დაფუძნებული ვებ ინტერაქციებისთვის
- ინსტრუმენტების მიმოხილვა -- ყველა ინსტრუმენტი და რეესტრის სისტემა