Po kelerių metų, kai dirbtinio intelekto (DI) lenktynės vyko dėl vis didesnių modelių kūrimo ir milžiniškų investicijų į duomenų centrus, kitas didysis proveržis gali būti susijęs su kai kuo visiškai kitu – efektyvumu. Naujos technologijos žada kardinaliai sumažinti dirbtinio intelekto kainą, o būsima konkurencija rinkoje greičiausiai vyks ne dėl to, kieno modelis didesnis, o kas sugebės pateikti atsakymus greičiausiai ir pigiausiai.
„Microsoft“ remiamas startuolis purto rinką
Rinką sudrebino naujiena apie „Microsoft“ remiamo startuolio „d-Matrix“ sukurtą naują lustą. Teigiama, kad ši technologija gali sumažinti dirbtinio intelekto paslaugų teikimo išlaidas net iki 90 procentų.
Nors lustų rinkoje jau vyksta arši konkurencija, o senieji rinkos žaidėjai investuoja milijardus, kad išlaikytų savo pozicijas DI bumo metu, šis startuolis gali įgyti netikėtą pranašumą. Jei „d-Matrix“ pavyks užtikrinti DI valdymą už dešimtadalį dabartinės kainos, tai suteiks bendrovei neįprastai stiprią poziciją pramonėje, kurioje įprastai dominuoja tik technologijų gigantai.
Problema: kodėl dabartinis DI toks brangus?
Šiandien galingi grafikos procesoriai (GPU) daugiausia naudojami dideliems kalbos modeliams apmokyti. Tačiau, kai modeliai jau yra sukurti, didžioji darbo dalis tenka atsakymams į vartotojų klausimus generuoti – šis procesas techniškai vadinamas „išvadų darymu“ (angl. inference).
„d-Matrix“ generalinis direktorius Sidas Shethas problemą apibūdina paprastai:
„Mokymai yra susiję su rezultatais, o išvados – su efektyvumu“.
Pasak bendrovės atstovų, dabartiniai sprendimai yra neefektyvūs dėl kelių priežasčių:
- Pramonė nuolatinėms operacijoms (atsakymams generuoti) vis dar naudoja tuos pačius lustus, kurie skirti mokymams.
- Dėl to sunaudojama neproporcingai daug energijos.
- Tai lemia dideles išlaidas, ypač kai milijonai vartotojų vienu metu siunčia užklausas.
Technologijų įmonėms, kurios šiuo metu kovoja su sparčiai augančiomis energijos kainomis ir didėjančia DI paklausa, šios problemos sprendimas yra gyvybiškai svarbus.

Sprendimas: nauja architektūra
„d-Matrix“ sukūrė visiškai naują architektūrą, kurioje skaičiavimo procesai ir atmintis yra susieti glaudžiau nei įprastai. Pagrindinis šios technologijos tikslas – sumažinti delsą (atsakymo laiką) ir padidinti dirbtinio intelekto atsakymų skaičių, tenkantį vienam energijos vatui.
- Shethas teigia, kad bendrovės sprendimas jau dabar gali užtikrinti apie 90 procentų mažesnes „išvadų darymo“ sąnaudas, palyginti su tradiciniais GPU sprendimais. „Taip yra šiandien. Bus tik geriau“, – užtikrintai sako vadovas.
Ką tai reiškia ateičiai?
Jei ši technologija pateisins lūkesčius, ji gali pakeisti visos dirbtinio intelekto rinkos ekonomiką, rašo „Forbes“.
Galimi pokyčiai rinkoje:
- Strateginis pranašumas: Kadangi spaudimas infrastruktūrai didėja, o įmonės priverstos investuoti į nuosavą energijos gamybą, efektyvesnė techninė įranga tampa strateginiu klausimu.
- Nauja konkurencija: Modeliams tampant standartizuotiems, konkurencija persikels į eksploatavimo sąnaudas, reagavimo greitį ir energijos vartojimo efektyvumą.
- Pigesnis DI: Jei išlaidas pavyks taip drastiškai sumažinti, dirbtinis intelektas taps gerokai pigesnis naudoti dideliu mastu, o tai atvers kelią daugiau komercinių pritaikymų.
Šiuo metu naujieji lustai gaminami ribotais kiekiais, tačiau „d-Matrix“ planuoja per ateinančius metus ženkliai padidinti gamybos apimtis. Tai rodo, kad dirbtinio intelekto verslo pelningumą ateityje vis labiau lems ne tik patys algoritmai, bet ir paslaugų infrastruktūros efektyvumas.
Šaltinis: https://www.forbes.com/sites/johnkoetsier/2026/02/13/90-cheaper-ai-microsoft-backed-chip-startup-says-its-possible-today/
