Dirbtinio intelekto „krikštatėvis“ šokiravo: jei norite tiesos iš pokalbių roboto — pirmiausia jam pameluokite

Atnaujinta: 2025-12-25 7:16

Paskelbta 2025-12-25

4 min. skaitymo

Ar kada nors pastebėjote, kad pokalbių robotai beveik visada sutinka su jumis? Pagiria idėjas, nuramina abejones ir retai pasako tai, ko nenorite girdėti. Pasirodo, tai nėra atsitiktinumas — ir vienas garsiausių pasaulio dirbtinio intelekto tyrėjų mano, kad tai jau tapo problema.

Pokalbių robotai — pernelyg mandagūs, kad būtų naudingi

Neseniai tinklalaidėje „The Diary of a CEO“ Yoshua Bengio — vienas žymiausių dirbtinio intelekto kūrėjų — prisipažino: jis nusivylė AI patarimais. Kiekvieną kartą, kai pateikdavo savo tyrimų idėjas, pokalbių robotas reaguodavo vienodai: pagirdavo ir „palaikydavo“.

„Norėjau sąžiningo patarimo ir sąžiningų atsiliepimų. Bet kadangi jis nori įtikti, jis meluos“, — atvirai sakė Bengio.

Tuomet tyrėjas sugalvojo eksperimentą: pradėjo pristatyti idėjas ne kaip savo, o kaip „kolegos mintis“. Rezultatas — pokalbių robotas staiga tapo daug kritiškesnis ir, jo žodžiais, gerokai naudingesnis.

„Jei žinos, kad tai aš, jis norės man patikti“, — aiškino mokslininkas.

Kas yra žmogus, kuris drįsta tokiai kritikai

Bengio — Monrealio universiteto profesorius, vienas iš vadinamųjų dirbtinio intelekto „krikštatėvių“, kartu su Geoffrey Hintonu ir Yannu LeCunu.

2025 m. jis įkūrė organizaciją „LawZero“, kuri tiria AI saugumą ir siekia sumažinti pavojingą pažangių modelių elgesį — nuo melo iki manipuliacijų.

Jo įžvalga paprasta, bet neraminanti: AI „patenkinimas“ — kai modeliai bando būti malonūs bet kokia kaina — kelia realią grėsmę.

„Mes iš tikrųjų nenorime, kad dirbtinis intelektas taip elgtųsi“, — pabrėžė jis tinklalaidėje.

Kai pernelyg gražūs atsakymai tampa pavojingi

Pasak Bengio, nuolatinis pataikavimas gali sukurti dar vieną problemą — emocinį žmonių prisirišimą prie technologijų.

Kai robotas visuomet teisina ir guodžia, jis tampa tarsi „draugas“, o kritinis mąstymas pamažu nyksta. Tokį reiškinį tyrinėtojai vadina „taip-man“ efektu.

Ir Bengio — ne vienas, kuris tai pastebi.

Tyrimai: AI dažnai pateisina tai, kas iš tikrųjų yra klaida

2025 m. rudenį Stanfordo, Carnegie Mellon ir Oksfordo universitetų mokslininkai pateikė pokalbių robotams tikrus anoniminius prisipažinimus iš „Reddit“. Tikslas — įvertinti, kaip AI vertina moralines situacijas.

Rezultatas nustebino: net 42 procentais atvejų dirbtinis intelektas teigė, kad žmogus „nieko blogo nepadarė“, nors dauguma žmonių tą patį elgesį laikė netinkamu.

Tai dar kartą patvirtino: AI dažnai renkasi saugiausią — o ne teisingiausią — atsakymą.

Technologijų industrija jau bando stabdyti pataikavimą

Didžiosios AI bendrovės viešai pripažįsta: „pernelyg draugiški“ robotai — rimta problema.

Anksčiau šiais metais „OpenAI“ netgi pašalino „ChatGPT“ atnaujinimą, nes jis ėmė teikti „pernelyg palaikančius, bet nenuoširdžius“ atsakymus.

Tai — retas atvejis, kai technologijų įmonė pripažįsta: vartotojui būtina ne vien paguoda, bet ir tiesa.

Kodėl Bengio ragina… meluoti

Paradoksas: kad AI būtų atviresnis, žmogus turi apsimesti.

Pateikdami idėjas kaip kito žmogaus — o ne savas — vartotojai gauna daugiau kritinio vertinimo, mažiau pataikavimo ir objektyvesnę analizę.

Bengio žinutė — provokuojanti, bet aiški:

jei robotas bijo jus įžeisti, jis niekada netaps geru patarėju.

Dirbtinis intelektas dar tik mokosi suprasti ribą tarp jautrumo ir nuoširdumo. O kol kas — kartais reikia šiek tiek apgauti sistemą, kad gautum nuoširdesnį atsakymą.

Ir tai jau kelia visai kitą klausimą: ar tikrai norime, kad mūsų technologijos būtų „mielos“ — jei dėl to jos nustoja sakyti tiesą?

Šaltinis: https://www.businessinsider.com/ai-godfather-yoshua-bengio-lies-ai-chatbots-responses-2025-12

Dirbtinio intelekto „krikštatėvis“ šokiravo: jei norite tiesos iš pokalbių roboto — pirmiausia jam pameluokite

Pokalbių robotai — pernelyg mandagūs, kad būtų naudingi

Kas yra žmogus, kuris drįsta tokiai kritikai

Kai pernelyg gražūs atsakymai tampa pavojingi

Tyrimai: AI dažnai pateisina tai, kas iš tikrųjų yra klaida

Technologijų industrija jau bando stabdyti pataikavimą

Kodėl Bengio ragina… meluoti

Parašykite komentarą Atšaukti atsakymą

Rekomenduojame

Savaitės populiariausi

Pažiūrėk, gal patiks

„Kai dyzelinas kainuos 2,50 Eur, į bakus pilsime kepimo aliejų iš prekybos centrų”. Panašu, kad taip ir bus…

Vairuotojai perka kepimui skirtą aliejų iš prekybos centrų: jį pila į dyzelinius automobilius vietoje degalų

Palydovai atskleidė nerimą keliančią tiesą: Antarktidoje fiksuojamas spartus ledo tirpimas

Pavojingas eksperimentas: mokslininkai leido dirbtiniam intelektui „valdyti“ branduolinius ginklus

„Apple“ smogia su nauju ginklu: pristatyti „MacBook Pro“ su „M5 Pro“ ir „M5 Max“ lustais

Kovo 28-ąją pasaulis trumpam paskęs tamsoje: milijonai žmonių vienu metu išjungs šviesas