Pasak „Google“, „Gemini 2.0“ sudrebins dirbtinio intelekto rinką – „mažas vėlavimas ir didelis našumas“. Šių metų pabaigoje žengtas didelis žingsnis į priekį dirbtinio intelekto vystymo srityje. Ką gali „Gemini 2.0“?
Gemini 2.0 – multimodalumas aukštesniu lygiu
Gemini 2.0 yra pažangiausias „Google“ dirbtinio intelekto modelis, kuriame daugiausia naujovių yra multimodalumo srityje. Tai apima vietinio vaizdo ir garso generavimą, taip pat galimybę iškviesti „Google“ paieškos variklį, vykdyti kodą ir vykdyti vartotojo nurodytas išorines funkcijas.
Šiandien veikianti eksperimentinė „Gemini 2.0 Flash“ versija – kūrėjams prieinama kaip „Gemini“ API dalis „Google AI Studio“ ir „Vertex AI“ – pasižymės mažu vėlavimu ir geresniu našumu. Ją galima išbandyti naršyklės versijoje, pasirinkus ją iš išskleidžiamojo meniu ekrano viršuje kairėje pusėje – netrukus ji bus prieinama ir mobiliojoje programėlėje.
„Google“ AI ateitis atrodo dar įdomesnė. Teigiama, kad atsiras galimybė kurti naujus dirbtinio intelekto agentus, tokius kaip „Project Astra“, bandymas sukurti universalų įrankį – jis gali naudotis „Google“ paieškos sistema, „Lens“ ir „Maps“. Naudodama „Gemini 2.0“, „Google“ taip pat kuria „Project Mariner“ – ankstyvą prototipą, nagrinėjantį žmonių ir naršyklės ryšį. Jis gali suprasti ir analizuoti informaciją naršyklės ekrane, įskaitant pikselius ir žiniatinklio elementus, tokius kaip tekstas, kodas, vaizdai ir formos, todėl gali padėti greičiau atlikti kasdienes užduotis. „Jules“ projektas taip pat skamba įdomiai, t. y. eksperimentinis kodavimo agentas, galintis tiesiogiai integruotis su „GitHub“, o tai galiausiai padės kūrėjams lengviau spręsti problemas ir kurti planus.
„Šiandien džiaugiamės galėdami įžengti į kitą modelių, skirtų naujajai agentų erai, erą: pristatome Gemini 2.0, mūsų kol kas pažangiausią modelį. Atsižvelgdami į naujus multimodalumo pasiekimus, pvz., vaizdo ir garso generavimą bei vietinių įrankių naudojimą, galėsime sukurti naujus dirbtinio intelekto agentus, kurie padės įgyvendinti mūsų viziją sukurti universalų asistentą“ – Sundaras Pichai, „Google“ ir „Alphabet“ generalinis direktorius.
Gemini DI galite pasiekti čia: Gemini 2.0