Didžiosios technologijų įmonės susiduria su nauja grėsme – „distiliavimo atakomis“. Tai sudėtingi bandymai nukopijuoti dirbtinio intelekto (DI) mąstymo modelius, kurie gali kelti pavojų ir vartotojų duomenims.
„Google“ ataskaitoje atskleidžiama, kad bendrovė užfiksavo masines atakas prieš savo pažangiausią DI modelį „Gemini“. Užpuolikai, naudodami daugiau nei 100 000 specifinių užklausų, bandė išgauti modelio „smegenis“ – jo vidinę logiką ir sprendimų priėmimo algoritmus.
Kas yra „distiliavimo ataka“?
Įsivaizduokite, kad turite geriausią šefą pasaulyje, kuris niekam neišduoda savo receptų. Konkurentai (šiuo atveju – programišiai ar kitos įmonės) siunčia tūkstančius klientų, kurie užsisako patiekalus ir tiksliai aprašo kiekvieną skonio niuansą. Surinkę milijonus duomenų taškų, jie bando atkurti tikslų receptą be šefo žinios.
DI pasaulyje tai vadinama modelio išgavimu (model extraction). Užpuolikai:
- Siunčia sudėtingus klausimus DI modeliui.
- Analizuoja gautus atsakymus.
- Naudoja šiuos duomenis savo, dažniausiai pigesnių ir mažesnių, DI modelių apmokymui, siekdami pasiekti „Gemini“ lygio kokybę be milijardinių investicijų.
Kodėl tai pavojinga?
Nors „Google“ teigia, kad tai daugiausia intelektinės nuosavybės vagystė, ekspertai įžvelgia ir platesnių rizikų:
- Saugumo spragos: Jei užpuolikai visiškai supras, kaip veikia „Gemini“ saugumo filtrai, jie galės lengviau juos apeiti (pvz., generuoti kenkėjišką kodą ar dezinformaciją).
- Privačių modelių pažeidžiamumas: Johnas Hultquistas, „Google“ grėsmių žvalgybos analitikas, įspėja, kad tai tik pradžia. Įmonės, kurios kuria savo vidinius DI įrankius darbui su jautriais duomenimis (teisė, medicina, finansai), taip pat gali tapti taikiniais.
„Mes esame kanarėlė anglies kasykloje. Jei atakuojami mes, netrukus tai patirs ir kiti,“ – teigia J. Hultquistas.

Rinkos karai: „OpenAI“ prieš „DeepSeek“
Tai nėra izoliuotas atvejis. Konkurencija DI rinkoje yra tokia aštri, kad ribos tarp tyrimų ir pramoninio šnipinėjimo trinamos. Pavyzdžiui, „ChatGPT“ kūrėja „OpenAI“ anksčiau apkaltino Kinijos bendrovę „DeepSeek“ naudojant panašias distiliavimo technikas, siekiant greičiau patobulinti savo modelius.
Ką daro „Google“?
Bendrovė pranešė, kad sėkmingai identifikavo ir blokavo minėtą atakų seriją, pakoreguodama savo gynybinius algoritmus. Tačiau vartotojams tai priminimas: DI modeliai yra sudėtingos sistemos, kurios nuolat atakuojamos, todėl jautrių asmeninių duomenų įvedimas į bet kokį viešą pokalbių robotą visada turi būti pasvertas.
Šaltinis: https://www.nbcnews.com/tech/security/google-gemini-hit-100000-prompts-cloning-attempt-rcna258657
