„Google“ meta iššūkį „Nvidia“: pristatė naujus lustus DI, žada šuolį greičiui ir kainai

„Google“ pristatė aštuntos kartos tensorinių procesorių (TPU) šeimą, skirtą dirbtinio intelekto modelių mokymui ir jų paleidimui, vadinamajai išvadai. Esminis pokytis tas, kad bendrovė šias užduotis pirmą kartą aiškiai atskiria į du specializuotus lustus, taip tikėdamasi efektyviau konkuruoti su „Nvidia“ DI aparatinės įrangos rinkoje.

Naujieji TPU lustai turėtų tapti prieinami vėliau šiais metais per „Google Cloud“. Bendrovės teigimu, toks išskaidymas leidžia geriau optimizuoti sąnaudas ir našumą skirtingiems poreikiams, nes mokymas reikalauja maksimalios skaičiavimo galios, o išvada svarbi maža delsos trukmė ir stabilus pralaidumas.

„Kylant DI agentų bangai nusprendėme, kad bendruomenei bus naudingiau turėti lustus, atskirai pritaikytus mokymui ir modelių pateikimui“, – sakė „Google“ vyresnysis viceprezidentas ir vyriausiasis DI bei infrastruktūros technologas Aminas Vahdatas.

„Google“ skelbia, kad mokymui skirtas lustas už tą pačią kainą pasiekia 2,8 karto didesnį našumą nei ankstesnės kartos „Ironwood“ TPU. Tuo metu išvadai skirtas procesorius, bendrovės vertinimu, užtikrina apie 80 proc. geresnį našumą, lyginant su ankstesne karta.

Vis dėlto „Google“ viešai nepateikė tiesioginių palyginimų su „Nvidia“ sprendimais, kurie šiuo metu laikomi rinkos etalonu. Toks atsargumas būdingas rinkai, kurioje našumas, energijos sąnaudos ir prieinamumas dažnai priklauso ne tik nuo paties lusto, bet ir nuo programinės aplinkos, tinklų, atminties architektūros bei konkrečių DI modelių.

Atmintis ir delsos mažinimas

Naujasis išvadai skirtas TPU 8i, kaip skelbiama, remiasi statine operatyviąja atmintimi SRAM, kuri ypač svarbi siekiant mažesnės delsos. „Google“ teigimu, kiekviename tokiame luste yra 384 megabaitai SRAM, tai yra tris kartus daugiau nei „Ironwood“ kartoje.

Toks pasirinkimas atspindi platesnę tendenciją: didelių kalbos modelių ir DI agentų panaudojimuose vis labiau vertinama ne vien „žalia“ skaičiavimo galia, bet ir gebėjimas greitai „pamaitinti“ procesorius duomenimis. Būtent atminties pralaidumas ir architektūra tampa viena dažniausių našumo „siaurų vietų“ realiuose produktuose.

„Ši architektūra sukurta tam, kad užtikrintų didžiulį pralaidumą ir mažą delsą, reikalingą vienu metu ekonomiškai vykdyti milijonus agentų“, – rašė „Alphabet“ vadovas Sundaras Pichai.

Lenktynės dėl nuosavų DI lustų

„Google“ žingsnis vyksta platesniame technologijų milžinų kontekste, kai vis daugiau bendrovių kuria savo specializuotus procesorius, siekdamos mažinti priklausomybę nuo išorinių tiekėjų ir geriau valdyti kaštus. „Apple“ jau seniai integruoja neuroninius blokelius į savo išmaniesiems įrenginiams skirtus lustus, „Microsoft“ pranešė apie naują vidiniam naudojimui skirtą DI lusto kartą, o „Meta“ vysto kelias DI procesorių versijas kartu su „Broadcom“.

„Google“ šiame kelyje yra viena ankstyviausių: bendrovė TPU naudoja nuo 2015 metų, o debesijos klientams juos nuomoja nuo 2018 metų. Tuo pat metu „Amazon“ debesijos padalinys vysto atskiras lustų linijas mokymui ir išvadai, stiprindamas konkurenciją debesijos infrastruktūros rinkoje.

Kas naudosis ir kodėl tai svarbu

„Google“ teigimu, TPU panaudojimas auga: finansų rinkų dalyviai kuria kvantitatyvinių tyrimų programinę įrangą, paremtą TPU, o JAV Energetikos departamento nacionalinės laboratorijos naudoja ant šių lustų sukurtus DI įrankius. Tokie pavyzdžiai rodo, kad kova dėl DI infrastruktūros persikelia iš demonstracijų į kasdienę praktiką, kur lemia kaina, tiekimas ir integracija.

Rinkai tai svarbu dar ir dėl to, kad DI skaičiavimo pajėgumų paklausa išlieka didžiulė, o didieji debesijos tiekėjai stengiasi pasiūlyti alternatyvas „Nvidia“ produktams. Kuo daugiau realių pasirinkimų atsiranda klientams, tuo didesnė tikimybė, kad ilgainiui mažės vieno tiekėjo dominavimas ir stabilizuosis paslaugų kainodara.

Šaltiniai:

– https://blog.google/innovation-and-ai/infrastructure-and-cloud/google-cloud/eighth-generation-tpu-agentic-era/

– https://www.cnbc.com/2025/11/06/google-unveils-ironwood-seventh-generation-tpu-competing-with-nvidia.html

– https://www.cnbc.com/2018/11/28/aws-launches-inferentia-ai-chip.html

– https://www.cnbc.com/2023/11/28/amazon-reveals-trainium2-ai-chip-while-deepening-nvidia-relationship.html

„Google“ meta iššūkį „Nvidia“: pristatė naujus lustus DI, žada šuolį greičiui ir kainai

Atmintis ir delsos mažinimas

Lenktynės dėl nuosavų DI lustų

Kas naudosis ir kodėl tai svarbu

Comments

Leave a Reply Cancel reply