Kartu su naujuoju „Veo 2“ vaizdo įrašų generavimo modeliu „Google“ ką tik pristatė „Whisk“ – dirbtinio intelekto (DI) vaizdų generavimo įrankį, kuriame vaizdai naudojami kaip užuominos arba naujo vaizdo pagrindas.
„Whisk“ apibūdinamas kaip ‚naujos rūšies kūrybinė priemonė‘ ir siūlo paprastą pradžios sąsają, kurioje galima pasirinkti vaizdo stilių ir temą. Šiuo metu siūlomi trys stiliai: lipdukas, emaliuotas smeigtukas ir pliušinis žaislas. „Whisk“ įrankyje taip pat yra redaktorius, kuriame naudotojai gali pridėti tekstą arba pradinį vaizdą trijose kategorijose: tema, scena ir stilius. Taip pat yra papildoma teksto įvesties juosta, kurioje galima sudėlioti galutinius taškus.
„Google“ aiškina, kad ‚Whisk‘ remiasi tik ‚keliomis pagrindinėmis savybėmis‘, esančiomis pradiniame arba raginamajame paveikslėlyje. Taigi įrankio sukurtame vaizde gali pasikeisti, pavyzdžiui, žmogaus ūgis, šukuosena ar odos atspalvis. Taip yra todėl, kad „Whisk“ naudoja „Gemini MI“ modelį, kuris pirmiausia aprašo įkeltą vaizdą. Tada šis aprašymas perduodamas „Imagen 3“ vaizdo generatoriui. Gautas atvaizdas yra pagrįstas „Gemini“ sukurtu tekstiniu aprašymu, o ne pačiu originaliu atvaizdu.
Šiuo metu „Whisk“ galima naudoti tik JAV, o kada ji bus prieinama kitose rinkose, nežinoma.
Parašyti komentarą