Dirbtinis intelektas jau seniai nebėra vien mokslinės fantastikos prieskonis. Tačiau kas keletą metų technologijų pasaulis patiria lūžį – akimirką, kai tampa akivaizdu, jog esame žingsniu ar dviem arčiau tikro protingų sistemų amžiaus. „Google“ teigimu, būtent toks momentas atėjo dabar. Pristatytas „Gemini 3“ – ambicingiausias ir protingiausias jų kada nors sukurtas DI modelis, kuris ruošiasi įsitaisyti visur: paieškoje, telefonuose, darbo vietose ir net programinės įrangos kūrimo įrankiuose.
Įprastai nauji modeliai žada daugiau galios ir įspūdingesnius testų rezultatus, tačiau „Gemini 3“ tikslas kitoks. Jis kuriamas taip, kad gebėtų suprasti vartotojo ketinimą, planuoti kelis veiksmus į priekį ir tapti labiau bendradarbiaujančiu partneriu nei mechaniniu atsakymų generatoriumi. „DeepMind“ komanda, atsakinga už modelio architektūrą, siekė vieno – DI, kuris ne tik reaguoja, bet ir supranta.
Supratimo šuolis: daugiau konteksto, mažiau painiavos
„Gemini 3“ įveikė testus, kurie iki šiol buvo laikomi itin sunkiais net pažengusiems modeliams. Sudėtingi moksliniai uždaviniai, ilgos loginės grandinės, tikslaus faktų tikrinimo reikalaujantys klausimai – visa tai modelis įveikia sklandžiau nei ankstesnės kartos.
Čia ypač ryškus multimodalumas, tai yra gebėjimas suprasti kelis duomenų tipus vienu metu. Vienoje užklausoje galima pateikti tekstą, ekrano kopiją ir vaizdo įrašą – o „Gemini 3“ sujungia viską į vieną turiningą analizę. Tai reiškia daug paprastesnį sudėtingų situacijų paaiškinimą: nuo projekto dokumentacijos iki mechanikos problemos diagnozės pagal vaizdinę medžiagą.
Testai rodo, kad faktinių atsakymų kokybė pagerėjo, o tai yra DI eleksyras, nuolat keliaujantis tarp tikslumo ir klaidų. „SimpleQA Verified“ vertinimai čia iškalbingiausi – modelis geriau supranta niuansus ir nelinkęs improvizuoti nepatikimų atsakymų.
„Deep Think“: režimas tiems, kuriems reikia daugiau nei paviršinio sprendimo
Be pagrindinės versijos pristatytas ir „Gemini 3 Deep Think“ režimas – tarsi modelio „akademinė“ pusė. Vietoje greito atsakymo jis pasineria į ilgesnį loginį mąstymą, planuoja, analizuoja ir pateikia gilesnę argumentaciją. Ši funkcija pasieks tik „Google AI Ultra“ prenumeratorius, nes prieš tai laukia platesni saugumo bandymai.
Šis režimas orientuotas į problemas, kurios paprastai reikalauja specializuoto žmogaus: sudėtingi duomenų rinkiniai, pažangi fizika, procesų optimizavimas, gilus techninis projektavimas. Čia DI tampa ne konsultantu, o visaverčiu moksliniu padėjėju.

Agentai tampa gudresni: darbas, kuris atlieka save pats
Kartu pristatyta ir sustiprinta agentų sistema – tai DI, galintis atlikti ne tik vieną veiksmą, bet visą darbo eigą. Ne tik atsakyti į klausimą apie jūsų el. laiškus, bet ir juos sutvarkyti. Ne tik parašyti kelionės planą, bet ir užpildyti reikiamą formą ar surinkti duomenis keliose svetainėse.
Tai rodo, kur DI juda dabar: nuo pasyvaus įrankio prie aktyvaus proceso dalyvio.
Verslams, mokykloms ir universitetams, ypač ten, kur plačiai naudojami „Google Workspace“ įrankiai, tai suteikia naujų galimybių automatizuoti biuro rutiną ir organizuoti sudėtingas operacijas su mažesnėmis pastangomis.
Programuotojams – naujas žaislas: „Google Antigravity“
Kūrėjai taip pat neliko nuošalyje. „Antigravity“ – tai nauja aplinka, kurioje „Gemini 3“ gali rašyti kodą, testuoti jį, taisyti ir vykdyti terminalo komandas. Integruotas naršyklės valdymas leidžia DI sąveikauti su internetinėmis paslaugomis taip, tarsi dirbtų patyręs programuotojas.
Tai itin palanku startuoliams ir mažoms kūrėjų komandoms, kurioms svarbus greitis ir galimybė realizuoti idėjas be didelių investicijų.
Paieška taps nebe informacijos sąrašu, o interaktyvia patirtimi
Vartotojai didžiausią pokytį pajus „Google“ paieškoje. DI režimas su „Gemini 3“ gali pateikti interaktyvius paaiškinimus, simuliacijas ar vizualizacijas. Vietoje sausos informacijos – mokomasis turinys, pritaikytas konkrečiai užklausai.
Tai ypač naudinga nagrinėjant medicinos, technologijų ar ekonomikos temas, kurios dažnai reikalauja papildomo aiškinamojo sluoksnio.
Saugumas – vienas iš pagrindinių akcentų
„Google“ pabrėžia, kad ne tik rezultatų kokybė, bet ir atsparumas manipuliacijoms yra vienas didžiausių „Gemini 3“ atnaujinimų. Modelis testuotas ne tik viduje, bet ir išorėje – įtraukti tarptautiniai partneriai, atliekami stiprūs patikimumo ir piktnaudžiavimo prevencijos vertinimai.
Tai svarbu, nes kuo daugiau DI perima užduočių, tuo didesnė atsakomybė už jo veikimo tikslumą.
Pasiekiamas jau šiandien
„Gemini 3“ diegimas jau prasidėjo – nuo „Android“ iki „Chrome“ ir atskiros „Gemini“ programėlės. Per artimiausias dienas technologijų mėgėjai pajus pirmuosius pokyčius, o „Deep Think“ ir kiti submodeliai atsiras vėliau.
Šis pristatymas rodo, kad DI ateitis ne tik artėja – ji jau čia, įsitaisiusi naršyklėje, telefone ir darbo įrankiuose. Ir su „Gemini 3“ ši ateitis atrodo žymiai protingesnė nei vakar.
Šaltinis: https://blog.google/products/gemini/gemini-3/
