Skip to content
ეს გვერდი შეიქმნა და ითარგმნა ხელოვნური ინტელექტის დახმარებით. თუ შეამჩნევთ უზუსტობას, გთხოვთ, დაგვეხმარეთ გაუმჯობესებაში. GitHub-ზე რედაქტირება

მედია ინსტრუმენტები

PRX ხუთ მედიასთან დაკავშირებულ ინსტრუმენტს მოიცავს: სურათების დამუშავება, ეკრანის გადაღება, ტექსტი-მეტყველებაში სინთეზი და სტრუქტურირებული კონტენტის რენდერინგი. ეს ინსტრუმენტები აგენტებს ვიზუალურ და აუდიო კონტენტთან მუშაობის საშუალებას აძლევს.

ინსტრუმენტების მითითება

image

სურათების დამუშავება და ტრანსფორმაცია. უჭერს მხარს ზომის შეცვლას, ამოჭრასა და ფორმატის კონვერტაციას.

image_info

სურათის ფაილიდან მეტამონაცემებისა და განზომილებების ამოღება მისი შეცვლის გარეშე.

screenshot

ეკრანის ანაბეჭდების გადაღება მიმდინარე ეკრანის ან კონკრეტული ფანჯრების. სასარგებლოა ვიზუალური მსჯელობის ამოცანებისთვის.

tts

ტექსტი-მეტყველებაში სინთეზი. ტექსტს აუდიო ფაილად გარდაქმნის და ხმოვან შეტყობინებად აგზავნის მიმდინარე საუბარში.

json
{
  "name": "tts",
  "arguments": {
    "text": "დილა მშვიდობისა! აი თქვენი დღიური მოკლე მიმოხილვა."
  }
}

canvas

სტრუქტურირებული კონტენტის რენდერინგი ვიზუალური გამოსავალისთვის. უჭერს მხარს ცხრილებს, დიაგრამებს და ფორმატირებულ განლაგებებს.

გამოყენების შაბლონები

ვიზუალური მსჯელობა

ეკრანის ანაბეჭდების გამოყენება ვიზუალის შესაძლებლობის მქონე LLM-ებთან UI-ის მდგომარეობის გასაგებად.

ანგარიშის გენერაცია

ვიზუალური ანგარიშების გენერაცია დიაგრამებითა და ცხრილებით.

ხმოვანი ინტერაქცია

აუდიო პასუხების მიწოდება ხელისგარეშე სცენარებისთვის.

უსაფრთხოება

პოლიტიკის ძრავი

მედია ინსტრუმენტების ინდივიდუალური კონტროლი შესაძლებელია:

toml
[security.tool_policy.tools]
image = "allow"
screenshot = "supervised"    # ეკრანის ანაბეჭდებისთვის თანხმობის მოთხოვნა
tts = "allow"
canvas = "allow"

დაკავშირებული გვერდები

Released under the Apache-2.0 License.