JAV dirbtinio intelekto bendrovė „Anthropic“ derasi su Londone įsikūrusiu puslaidininkių startuoliu „Fractile“ dėl didelio našumo lustų tiekimo. Skelbiama, kad tikslas – mažinti priklausomybę nuo „Nvidia“ ir atpiginti modelių paleidimą bei aptarnavimą.
Rinkoje generatyviojo DI skaičiavimo pajėgumų paklausa auga greičiau nei spėja plėstis duomenų centrų infrastruktūra. Dėl to „Nvidia“ H100 ir panašūs sprendimai išlieka brangūs, o jų prieinamumas tampa verslo planus ribojančiu veiksniu net didžiausiems žaidėjams.
„Anthropic“, kurianti „Claude“ modelių šeimą, šiandien remiasi „Nvidia“ greitintuvais ir debesijos partnerių siūlomais individualizuotais procesoriais. Įmonė yra sulaukusi kelių milijardų investicijų iš „Amazon“ ir „Google“, o tai leidžia agresyviai plėsti skaičiavimo resursus, tačiau kartu didina spaudimą efektyvumui.
Analitikai pabrėžia, kad perėjimas nuo universalių lustų prie labiau specializuotų sprendimų tampa platesne tendencija. Panašia kryptimi juda ir kitos technologijų bendrovės, siekiančios geriau kontroliuoti infrastruktūros kainą, energijos sąnaudas ir tiekimo grandinės rizikas.
Kas išskiria „Fractile“ architektūrą?
„Fractile“ įkurta 2022 metais, o vienas ryškiausių startuolio vardų siejamas su Oksforde daktaro laipsnį įgijusiu Walteriu Goodwinu. Įmonė siūlo vadinamąją atminties ir skaičiavimo sujungimo kryptį, kai duomenys laikomi kuo arčiau skaičiavimo branduolių.
Startuolio teigimu, ši koncepcija remiasi statine operatyviąja atmintimi SRAM, kuri, skirtingai nei DRAM, nereikalauja nuolatinio atnaujinimo. Tai teoriškai gali sumažinti duomenų judėjimo kaštus, kurie dideliuose kalbos modeliuose dažnai tampa našumo „butelio kakleliu“.
„Fractile“ viešai mini, kad tam tikrais scenarijais didelių kalbos modelių vykdymas galėtų būti iki 100 kartų spartesnis, o eksploatacinės sąnaudos – mažesnės iki 90 proc. Vis dėlto šiuos skaičius rinka vertina atsargiai, nes masinei duomenų centrų eksploatacijai svarbūs ne tik testų rezultatai, bet ir patikimumas, programinės įrangos ekosistema bei gamybos apimtys.
Kada lustai galėtų pasiekti duomenų centrus?
Šiuo metu „Fractile“ technologija dar vystoma, o komercinis produktas nėra plačiai prieinamas. Skelbiama, kad pilno masto diegimas duomenų centruose galėtų būti realistiškesnis tik apie 2027 metus, todėl bet koks susitarimas su „Anthropic“ būtų labiau strateginis nei greitas sprendimas „čia ir dabar“.
Taip pat pranešama, kad „Fractile“ derasi dėl maždaug 170 500 000 eurų investicijos, o įmonės vertė galėtų viršyti 853 000 000 eurų. Tokie skaičiai atspindi investuotojų lūkestį, kad naujos architektūros gali pakeisti DI skaičiavimo ekonomiką, ypač modelių vykdymo, o ne mokymo etape.
Derybos su „Anthropic“, kaip teigiama, kol kas yra ankstyvoje stadijoje ir įpareigojantis kontraktas nėra pasirašytas. Vis dėlto pats didelės rinkos dalyvės dėmesys rodo, kad kova dėl greitesnio ir pigesnio skaičiavimo pajėgumo tampa vienu svarbiausių veiksnių, lemsiančių, kas laimės DI lenktynes.

Leave a Reply