Pradžia Straipsniai Internetas / WEB „OpenAI” pritrūko duomenų GPT-5 mokymui: neuroninių tinklų plėtra gali sulėtėti

Internetas / WEB

„OpenAI” pritrūko duomenų GPT-5 mokymui: neuroninių tinklų plėtra gali sulėtėti

Donatas VarnasAtnaujinta 2024-04-04 08:551 min. skaitymoĮtraukti į skaitymo sąrašą14

Dirbtiniui intelektui nebeužtenka duomenų

Dalintis

Yra tikimybė, kad sparti neuroninių tinklų plėtra netrukus gali sulėtėti. Kaip rašoma „The Wall Street Journal” pranešime, tokioms bendrovėms kaip „OpenAI” ar „Google” reikia didžiulių duomenų kiekių, kad galėtų mokyti ir tobulinti savo didelės apimties kalbos modelius (GPTM), tačiau problema ta, kad kokybiškų duomenų internete paprasčiausiai nepakanka.

Straipsnio „The Wall Street Journal” autoriai remiasi dirbtinio intelekto specialisto Pablo Villaloboso iš Epoch Research Institute teiginiais. Pasak jo, GPT-4 kalbos modelis buvo apmokytas naudojant 12 trilijonų duomenų žetonų, o jei vadovausimės Šinšilio masteliavimo dėsniais, kitai versijai reikės apie 60-100 trilijonų žetonų. Tačiau viešojoje erdvėje trūksta bent 10-20 trilijonų tinkamos kokybės teksto ir vaizdo duomenų žetonų. Beje, prieš kelerius metus Villalobosas teigė, kad iki 2024 m. vidurio neuroniniams tinklams pritrūks duomenų tolesniam mokymui su 50 % tikimybe. Tuo metu jis prognozavo, kad iki 2026 m. ši tikimybė bus 90 %.

Tyrime teigiama, kad didžioji dalis internete prieinamų duomenų tiesiog netinka dirbtiniam intelektui mokyti, nes juose yra netvarkingas tekstas arba juose nėra naujos informacijos neuroniniams tinklams. Problemą dar labiau apsunkina tai, kad didelės platformos, įskaitant naujienų agentūras ir socialinius tinklus, uždaro prieigą prie savo duomenų ir neleidžia tokioms bendrovėms kaip „OpenAI” jais naudotis.

Pasak „OpenAI” generalinio direktoriaus Semo Altmano, jie kuria naujus neuroninių tinklų mokymo būdus. Yra informacijos, kad bendrovė svarsto galimybę sukurti duomenų vertės vertinimo sistemą, pagal kurią būtų galima mokėti platformoms už juos. Dienraščio „The Wall Street Journal” duomenimis, panašų metodą svarsto ir „Google”. Tuo tarpu „OpenAI” ketina naudoti kalbos atpažinimo įrankį „Whisper” informacijai „išgauti” iš garso ir vaizdo įrašų, kurie yra laisvai prieinami internete.

Bendrovės viduje „OpenAI” svarsto dar vieną būdą apeiti duomenų trūkumą – aukštos kokybės sintetinių duomenų, kurie būtų naudojami tolesniam neuroninių tinklų mokymui, generavimą.

Įvertinkite šį straipsnį:

😡

😕

😐

🙂

😍

Kraunami duomenys...

Autorius

Donatas Varnas

Donatas Varnas – KAIPKADA.LT portalo straipsnių autorius, besidomintis naujausiomis technologijomis, žiniatinklio tendencijomis ir dirbtinio intelekto pasauliu. Mano straipsniai padeda skaitytojams suprasti sudėtingas technologines naujoves, atrasti sprendimus ir neatsilikti nuo sparčiai besikeičiančio skaitmeninio pasaulio.

Buvęs straipsnis ECB praneša, kad palūkanų sumažinimas tikėtinas jau birželio mėnesį

Kitas straipsnis Tapo žinoma, kiek Lietuvos gyventojų rūšiuoja atliekas

Parašyti komentarą

0 Komentarai(ų)

Naujausi

Seniausi Daugiausiai balsavo

Įterpti atsiliepimai

Žiūrėti visus komentarus

Panašūs straipsniai

„OpenAI” pritrūko duomenų GPT-5 mokymui: neuroninių tinklų plėtra gali sulėtėti

Įvertinkite šį straipsnį:

Parašyti komentarą

Populiariausi straipsniai

„Swedbank“ klientai masiškai gauna šią SMS žinutę: paspaudę nuorodą, prarasite visus pinigus

„Meta AI“ apnuogina vartotojų privatumą. Vienas mygtukas – ir jūsų paslaptys atsiduria internete

Įveskite šiuos žodžius į paieškos sistemą. Nustebsite ir sutaupysite!

Nauja pasimatymų era? Dirbtinis intelektas suporuoja poras pagal jų internetinę istoriją

„OpenAI” pritrūko duomenų GPT-5 mokymui: neuroninių tinklų plėtra gali sulėtėti

Įvertinkite šį straipsnį:

Parašyti komentarą

Populiariausi straipsniai

Kodėl verta registruotis?

Kodėl verta registruotis?