Hey.lt - Nemokamas lankytojų skaitliukas

Dirbtinio intelekto „krikštatėvis“ šokiravo: jei norite tiesos iš pokalbių roboto — pirmiausia jam pameluokite

4 min. skaitymo

Ar kada nors pastebėjote, kad pokalbių robotai beveik visada sutinka su jumis? Pagiria idėjas, nuramina abejones ir retai pasako tai, ko nenorite girdėti. Pasirodo, tai nėra atsitiktinumas — ir vienas garsiausių pasaulio dirbtinio intelekto tyrėjų mano, kad tai jau tapo problema.

Pokalbių robotai — pernelyg mandagūs, kad būtų naudingi

Neseniai tinklalaidėje „The Diary of a CEO“ Yoshua Bengio — vienas žymiausių dirbtinio intelekto kūrėjų — prisipažino: jis nusivylė AI patarimais. Kiekvieną kartą, kai pateikdavo savo tyrimų idėjas, pokalbių robotas reaguodavo vienodai: pagirdavo ir „palaikydavo“.

„Norėjau sąžiningo patarimo ir sąžiningų atsiliepimų. Bet kadangi jis nori įtikti, jis meluos“, — atvirai sakė Bengio.

Tuomet tyrėjas sugalvojo eksperimentą: pradėjo pristatyti idėjas ne kaip savo, o kaip „kolegos mintis“. Rezultatas — pokalbių robotas staiga tapo daug kritiškesnis ir, jo žodžiais, gerokai naudingesnis.

„Jei žinos, kad tai aš, jis norės man patikti“, — aiškino mokslininkas.

Kas yra žmogus, kuris drįsta tokiai kritikai

Bengio — Monrealio universiteto profesorius, vienas iš vadinamųjų dirbtinio intelekto „krikštatėvių“, kartu su Geoffrey Hintonu ir Yannu LeCunu.

2025 m. jis įkūrė organizaciją „LawZero“, kuri tiria AI saugumą ir siekia sumažinti pavojingą pažangių modelių elgesį — nuo melo iki manipuliacijų.

Jo įžvalga paprasta, bet neraminanti: AI „patenkinimas“ — kai modeliai bando būti malonūs bet kokia kaina — kelia realią grėsmę.

„Mes iš tikrųjų nenorime, kad dirbtinis intelektas taip elgtųsi“, — pabrėžė jis tinklalaidėje.

Kai pernelyg gražūs atsakymai tampa pavojingi

Pasak Bengio, nuolatinis pataikavimas gali sukurti dar vieną problemą — emocinį žmonių prisirišimą prie technologijų.

Kai robotas visuomet teisina ir guodžia, jis tampa tarsi „draugas“, o kritinis mąstymas pamažu nyksta. Tokį reiškinį tyrinėtojai vadina „taip-man“ efektu.

Ir Bengio — ne vienas, kuris tai pastebi.

Tyrimai: AI dažnai pateisina tai, kas iš tikrųjų yra klaida

2025 m. rudenį Stanfordo, Carnegie Mellon ir Oksfordo universitetų mokslininkai pateikė pokalbių robotams tikrus anoniminius prisipažinimus iš „Reddit“. Tikslas — įvertinti, kaip AI vertina moralines situacijas.

Rezultatas nustebino: net 42 procentais atvejų dirbtinis intelektas teigė, kad žmogus „nieko blogo nepadarė“, nors dauguma žmonių tą patį elgesį laikė netinkamu.

Tai dar kartą patvirtino: AI dažnai renkasi saugiausią — o ne teisingiausią — atsakymą.

Technologijų industrija jau bando stabdyti pataikavimą

Didžiosios AI bendrovės viešai pripažįsta: „pernelyg draugiški“ robotai — rimta problema.

Anksčiau šiais metais „OpenAI“ netgi pašalino „ChatGPT“ atnaujinimą, nes jis ėmė teikti „pernelyg palaikančius, bet nenuoširdžius“ atsakymus.

Tai — retas atvejis, kai technologijų įmonė pripažįsta: vartotojui būtina ne vien paguoda, bet ir tiesa.

Kodėl Bengio ragina… meluoti

Paradoksas: kad AI būtų atviresnis, žmogus turi apsimesti.

Pateikdami idėjas kaip kito žmogaus — o ne savas — vartotojai gauna daugiau kritinio vertinimo, mažiau pataikavimo ir objektyvesnę analizę.

Bengio žinutė — provokuojanti, bet aiški:

jei robotas bijo jus įžeisti, jis niekada netaps geru patarėju.

Dirbtinis intelektas dar tik mokosi suprasti ribą tarp jautrumo ir nuoširdumo. O kol kas — kartais reikia šiek tiek apgauti sistemą, kad gautum nuoširdesnį atsakymą.

Ir tai jau kelia visai kitą klausimą: ar tikrai norime, kad mūsų technologijos būtų „mielos“ — jei dėl to jos nustoja sakyti tiesą?

Šaltinis: https://www.businessinsider.com/ai-godfather-yoshua-bengio-lies-ai-chatbots-responses-2025-12

Esu KAIPKADA.LT portalo redaktorius. Mano tikslas – suteikti skaitytojams aktualią, patikimą ir naudingą informaciją, padedančią geriau suprasti pasaulį aplink mus. Siekiu padėti atrasti svarbiausias žinias ir dalintis įvykiais, kurie gali turėti realią įtaką mūsų kasdieniam gyvenimui.
Komentarų: 0

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *

Komentuodami sutinkate, kad jūsų pateikti duomenys gali būti tvarkomi pagal mūsų privatumo taisykles.