მედია ინსტრუმენტები
PRX ხუთ მედიასთან დაკავშირებულ ინსტრუმენტს მოიცავს: სურათების დამუშავება, ეკრანის გადაღება, ტექსტი-მეტყველებაში სინთეზი და სტრუქტურირებული კონტენტის რენდერინგი. ეს ინსტრუმენტები აგენტებს ვიზუალურ და აუდიო კონტენტთან მუშაობის საშუალებას აძლევს.
ინსტრუმენტების მითითება
image
სურათების დამუშავება და ტრანსფორმაცია. უჭერს მხარს ზომის შეცვლას, ამოჭრასა და ფორმატის კონვერტაციას.
image_info
სურათის ფაილიდან მეტამონაცემებისა და განზომილებების ამოღება მისი შეცვლის გარეშე.
screenshot
ეკრანის ანაბეჭდების გადაღება მიმდინარე ეკრანის ან კონკრეტული ფანჯრების. სასარგებლოა ვიზუალური მსჯელობის ამოცანებისთვის.
tts
ტექსტი-მეტყველებაში სინთეზი. ტექსტს აუდიო ფაილად გარდაქმნის და ხმოვან შეტყობინებად აგზავნის მიმდინარე საუბარში.
{
"name": "tts",
"arguments": {
"text": "დილა მშვიდობისა! აი თქვენი დღიური მოკლე მიმოხილვა."
}
}canvas
სტრუქტურირებული კონტენტის რენდერინგი ვიზუალური გამოსავალისთვის. უჭერს მხარს ცხრილებს, დიაგრამებს და ფორმატირებულ განლაგებებს.
გამოყენების შაბლონები
ვიზუალური მსჯელობა
ეკრანის ანაბეჭდების გამოყენება ვიზუალის შესაძლებლობის მქონე LLM-ებთან UI-ის მდგომარეობის გასაგებად.
ანგარიშის გენერაცია
ვიზუალური ანგარიშების გენერაცია დიაგრამებითა და ცხრილებით.
ხმოვანი ინტერაქცია
აუდიო პასუხების მიწოდება ხელისგარეშე სცენარებისთვის.
უსაფრთხოება
პოლიტიკის ძრავი
მედია ინსტრუმენტების ინდივიდუალური კონტროლი შესაძლებელია:
[security.tool_policy.tools]
image = "allow"
screenshot = "supervised" # ეკრანის ანაბეჭდებისთვის თანხმობის მოთხოვნა
tts = "allow"
canvas = "allow"დაკავშირებული გვერდები
- ბრაუზერის ინსტრუმენტი -- ვებ ავტომატიზაცია ეკრანის ანაბეჭდების მხარდაჭერით
- შეტყობინებები -- მედიისა და ხმის მიწოდება არხებით
- ინსტრუმენტების მიმოხილვა -- ყველა ინსტრუმენტი და რეესტრის სისტემა