Tag: Didieji kalbos modeliai

  • Skambučių centrai pereina į DI balso erą: kaip keičiasi klientų aptarnavimas ir ką tai reiškia

    Kai Airijoje DI balso agentė „Rachel“ telefonu apklausė daugiau nei 3 000 barų ir surinko per 1 000 patikrintų „Guinness“ bokalo kainų, istorija greitai išplito internete. Dauguma pašnekovų net neįtarė, kad kalba ne su žmogumi, o tai aiškiai parodė, kiek pažengė balso technologijos.

    Tačiau šis eksperimentas atskleidžia platesnę kryptį: skambučių centrai vis sparčiau pereina nuo standžių automatinių meniu prie pokalbio principu veikiančių sistemų. Vietoj ilgo mygtukų spaudinėjimo klientai gali tiesiog pasakyti, ko nori, o DI bando išspręsti užduotį arba nukreipia pas specialistą.

    Kas keičiasi vietoj įprasto IVR

    Tradiciniai IVR meniu, kuriuose girdime prašymus pasirinkti skyrių paspaudžiant skaičių, palaipsniui keičiami natūralesnėmis balso sąsajomis. Skambinantysis gali pasakyti, kad nori perkelti vizitą, pasiteirauti dėl sąskaitos ar pranešti apie gedimą, o sistema atpažįsta intenciją ir veda pokalbį.

    Toks modelis ypač patrauklus ten, kur skambučių srautai dideli ir užklausos pasikartoja: sveikatos priežiūroje, telekomunikacijose, komunalinių paslaugų įmonėse, pardavimų kvalifikavime ar viešajame sektoriuje. Praktinė nauda dažnai matuojama sekundėmis vienam skambučiui, bet dideliuose centruose tai virsta valandomis ir mažesnėmis eilėmis.

    „Synthflow AI“ ir nauja infrastruktūra

    Vienas ryškesnių šios bangos pavyzdžių Europoje yra Berlyne įsikūręs startuolis „Synthflow AI“, įkurtas 2023 metais. Bendrovė kuria platformą, skirtą automatizuoti didelės apimties telefono sąveikas, kad DI balso agentai galėtų priimti skambučius, atsakyti į dažniausius klausimus, registruoti vizitus, kvalifikuoti užklausas ir prireikus perduoti skambutį žmogui.

    Įmonė skelbia, kad platforma jau apdoroja daugiau nei 5 milijonus skambučių per mėnesį ir dirba su daugiau nei 100 verslo klientų įvairiose rinkose. Po apie 18 milijonų eurų A serijos investicijų, kurias vedė „Accel“, bendras finansavimas išaugo iki maždaug 27 milijonų eurų.

    Greitis, patogumas ir skaidrumas

    Įmonės vadovas Hakobas Astabatsyanas pabrėžia, kad esminis lūžis įvyko dėl didžiųjų kalbos modelių, kurie leido dialogą padaryti dinamišką. Tai reiškia, kad skambinantysis gali pertraukti, pakeisti temą ir kalbėti įprastais sakiniais, o sistema išlaiko pokalbio logiką.

    „Atsiradus didiesiems kalbos modeliams, atsivėrė galimybė šiuos pokalbius paversti dinamiškais: galite pertraukti DI, natūraliai pakeisti kryptį ir pokalbis teka labiau kaip su žmogumi“, – sakė Hakobas Astabatsyanas.

    Kartu jis akcentuoja, kad tikslas nėra apgauti, jog tai žmogus, o suteikti greitesnę paslaugą ir aiškiai atskleisti, kad kalbama su DI. Praktikoje tokios sistemos dažnai veikia kaip pirmoji linija: jos surenka informaciją, išfiltruoja neteisingai nukreiptus skambučius ir tik tada, kai reikia, perduoda operatoriui.

    „Žmonės užimti, jie nenori laukti ir klausytis begalinių meniu. Technologija jau pakankamai išmani, kad suplanuotų vizitą ar atsakytų į tipinius klausimus, bet ji nėra skirta gyvenimo patarimams“, – sakė Hakobas Astabatsyanas.

    Kas vyksta po skambučio

    Didelė dalis vertės slypi ne vien pačiame pokalbyje, bet ir automatiniuose veiksmuose po jo. Sistema gali įrašyti pokalbio metu gautus duomenis, atnaujinti kliento kortelę, pakeisti būsenas CRM sistemoje ir suaktyvinti vidinius procesus, kurie anksčiau buvo atliekami rankomis.

    „Aš tai vadinu RPA 2.0: DI gali paimti informaciją iš pokalbio, atnaujinti „HubSpot“ ar „Salesforce“, pakeisti CRM laukus ir automatizuoti tūkstančius pasikartojančių užduočių“, – sakė Hakobas Astabatsyanas.

    Tokios integracijos daro skambučių centrus mažiau priklausomus nuo rutinos, tačiau iškelia ir naujus reikalavimus kokybei. Jei DI neteisingai supranta kontekstą ar netiksliai suformuoja įrašus sistemose, klaidos gali greitai išplisti per procesų grandinę, todėl įmonės vis dažniau investuoja į testavimą, stebėseną ir aiškias eskalavimo taisykles.

    Saugumas, atitiktis ir balsų klonavimo rizika

    Augant DI balso įrankių prieinamumui, daugėja ir piktnaudžiavimo scenarijų, ypač susijusių su apsimetinėjimu ir balsų klonavimu. Pasak H. Astabatsyano, ankstyvuoju etapu teko susidurti su bandymais imituoti tapatybę, todėl kuriami aptikimo ir blokavimo mechanizmai, o rinka sparčiai profesionalėja.

    „Iš pradžių matėme apsimetinėjimo bandymus, todėl sukūrėme algoritmus jiems aptikti ir blokuoti. Dabar sektorius profesionalėja“, – sakė Hakobas Astabatsyanas.

    Reguliacinė aplinka taip pat griežtėja: auga dėmesys nepageidaujamiems skambučiams, numerių patikroms, asmens duomenų apsaugai ir sektoriniams reikalavimams, pavyzdžiui, sveikatos priežiūroje. Tokiems sprendimams tampa svarbios ne tik technologijos, bet ir atitikties procesai, saugumo testai bei aiškios vartotojo teisės pasirinkti žmogaus konsultantą.

    Kodėl tai svarbu visam verslui

    Skambučių centrai daugelį metų buvo laikomi kaštų centru, kuriame optimizuojamas darbuotojų skaičius ir skambučių trukmė. DI balso agentai keičia patį modelį: vis daugiau užklausų išsprendžiama pirmuoju kontaktu, o operatoriai perima sudėtingesnius atvejus, kai reikia sprendimo, empatijos ar nestandartinių veiksmų.

    „Balsas nėra rinka, tai komunikacijos terpė. Nė viena įmonė jos nevaldys. Klausimas, kam tu tarnauji, o mes norime keisti kontaktų centrus ir išlaisvinti žmones prasmingesniam darbui“, – sakė Hakobas Astabatsyanas.

    Artimiausiais metais lemiami veiksniai bus skaidrumas, kokybės kontrolė ir vartotojo patirtis. Jei DI iš tiesų sutrumpina laukimą, tiksliai suveda duomenis ir greitai perduoda skambutį žmogui, kai to reikia, tokia technologija gali tapti naujuoju įmonių „registratūros“ standartu.

  • Pigus DI spaudžia „OpenAI“ ir „Anthropic“: investuotojai baiminasi, kad IPO istorija subliūkš

    Pigus DI spaudžia „OpenAI“ ir „Anthropic“: investuotojai baiminasi, kad IPO istorija subliūkš

    Didžiųjų technologijų bendrovių finansinėse ataskaitose vis dažniau išryškėja iki šiol nutylėta dirbtinio intelekto sąskaita: DI modelių naudojimas ir vadinamoji išvada tampa apčiuopiama našta maržoms. Tai signalas rinkai, kad DI plėtra ne tik generuoja pajamas, bet ir sparčiai didina veiklos kaštus.

    Toks fonas ypač nepalankus „OpenAI“ ir „Anthropic“, kurios, investuotojų lūkesčiais, siekia viešo akcijų siūlymo su itin aukštomis vertinimo kartelėmis. Esminė šių vertinimų prielaida paprasta: įmonės išlaikys rinkos dalį ir galės už savo pažangiausius modelius taikyti aukštesnes kainas, nes alternatyvų bus mažai.

    Vis dėlto naujausi rinkos duomenys rodo priešingą kryptį: pažangūs DI modeliai sparčiai pinga, o pasirinkimas plečiasi. Kinijos laboratorijos už panašaus lygio užduotis dažnai prašo gerokai mažesnių įkainių, o Vakaruose atsiranda vis daugiau konkurentų, kuriančių mažesnius ir efektyvesnius sprendimus.

    Įmonės mokosi taupyti

    DI biudžetai versle per pastaruosius metus ryškiai išaugo, tačiau dabar vis dažniau klausiama, kur dingsta pinigai ir kaip mažinti sąnaudas. Praktikoje įmonės pereina nuo eksperimentų prie griežtesnio kaštų valdymo ir renkasi modelius pagal kainos ir naudos santykį.

    Viena populiarėjančių strategijų vadinama patariamojo modelio principu: kasdienes užduotis atlieka pigesnis, dažnai atvirojo kodo modelis, o į brangesnį, pažangiausią sprendimą kreipiamasi tik tada, kai to tikrai reikia. Taip sumažinamas brangių užklausų kiekis, bet išlaikoma kokybė sudėtingiausiais atvejais.

    „Tokiu būdu galima labai efektyviai suvaldyti išlaidas“, – sakė „Databricks“ vadovas Ali Ghodsi.

    Kainų karas ir pasitikėjimo faktorius

    Skirtumus tarp JAV ir Kinijos iš dalies lemia infrastruktūra: amerikietiškos laboratorijos remiasi milžiniškomis investicijomis į skaičiavimo galią, brangiausius lustus ir energiją, o tai neišvengiamai atsispindi kainodaroje. Kinijos kūrėjai, veikdami eksporto ribojimų sąlygomis, agresyviai optimizuoja modelius ir dažnai pasiekia panašius rezultatus su mažesniais resursais.

    Vis dėlto vien kaina ne visada nulemia pasirinkimą. Reguliuojamuose sektoriuose, pavyzdžiui, bankininkystėje ar gynyboje, pirkėjai dažnai prioritetą teikia tiekėjų reputacijai, atitikties standartams užtikrinimui ir duomenų saugumui, todėl pigesni sprendimai ne visada priimtini.

    Šį vakuumą Vakaruose bando užpildyti ir nauji pasiūlymai: didėja atvirojo kodo bei įmonių infrastruktūroje diegiamų DI sprendimų pasiūla. Tai didina konkurenciją ir mažina tikimybę, kad keli rinkos lyderiai ilgai išlaikys išskirtinę kainodaros galią.

    Ką tai reiškia IPO planams?

    Jei iki prospektų pateikimo rinkoje įsitvirtins nuostata, kad DI tampa preke, o ne prabanga, investuotojai gali skeptiškiau vertinti milijardines prognozes. Viešai listinguojamoms bendrovėms neužtenka demonstruoti technologinį pranašumą, joms reikia įrodyti, kad šis pranašumas paverčiamas ilgalaikiu pelnu.

    Didžiausia rizika „OpenAI“ ir „Anthropic“ atveju ta, kad brangiausių modelių paklausa gali augti, bet didelė dalis apimčių bus nukreipta į pigesnius sprendimus, o tai slopins vidutinę kainą ir maržas. Kuo daugiau įmonių išmoks derinti pigesnius ir pažangiausius modelius, tuo sunkiau bus pagrįsti itin aukštus vertinimus.

  • „Anthropic“ susigriebė „OpenAI“ bendraįkūrėją Karpathy: kas iš tiesų vyksta DI talentų kare

    „Anthropic“ susigriebė „OpenAI“ bendraįkūrėją Karpathy: kas iš tiesų vyksta DI talentų kare

    DI tyrėjas Andrej Karpathy, vienas iš „OpenAI“ bendraįkūrėjų ir buvęs „Tesla“ DI vadovas, prisijungė prie „Anthropic“. Bendrovė pranešė, kad jis darbą pradeda šią savaitę ir telksis į tyrimus, susijusius su „Claude“ modelių mokymu.

    „Anthropic“ teigimu, Karpathy kurs komandą, kuri sieks paspartinti vadinamuosius išankstinio apmokymo tyrimus. Tai viena svarbiausių sričių kuriant didžiuosius kalbos modelius, nes čia formuojamos bazinės žinios, gebėjimai ir vėliau atsirandantys praktiniai pritaikymai.

    „Manau, kad artimiausi keleri metai didžiųjų kalbos modelių priešakyje bus ypač lemiami. Labai džiaugiuosi galėdamas prisijungti prie komandos ir grįžti į mokslinius tyrimus bei plėtrą“, – sakė A. Karpathy.

    Šis ėjimas laikomas dar vienu ženklu, kad konkurencija dėl aukščiausio lygio DI specialistų pasiekė naują etapą. „Anthropic“ pastaruoju metu aktyviai stiprina komandą ir siekia išlikti tarp pagrindinių rinkos žaidėjų, konkuruodama su „OpenAI“ ir kitais didžiuosius modelius kuriančiais projektais.

    A. Karpathy karjeroje yra keli ypač ryškūs etapai: po darbo „OpenAI“ jis 2017 metais perėjo į „Tesla“, kur vadovavo kompiuterinės regos komandai ir dirbo su „Autopilot“ sprendimais. 2022 metais jis pasitraukė iš „Tesla“, vėliau trumpam grįžo į „OpenAI“, o pastaruoju metu dirbo su edukacine iniciatyva „Eureka Labs“.

    Konteksto šiai naujienai suteikia ir pastarųjų metų įtampa tarp didžiųjų DI ekosistemos centrų, kai buvę bendražygiai ir partneriai vis dažniau atsiduria skirtingose barikadų pusėse. Dėl to kiekvienas aukšto profilio perėjimas tampa ne tik personalo, bet ir strategijos signalu: kokius tyrimus bendrovė laiko kritiniais ir kur ketina investuoti artimiausiais metais.

    Rinka vis labiau koncentruojasi į du kertinius klausimus: kaip efektyviau apmokyti naujos kartos modelius ir kaip užtikrinti jų saugą bei patikimumą realiose situacijose. „Anthropic“, pastaraisiais metais akcentuojanti atsakingo DI kryptį, šiuo samdymu aiškiai parodo, kad nori stiprinti fundamentinių tyrimų grandį, nuo kurios priklauso ir praktiniai produktų atnaujinimai.

  • New research explains why human language resists code-like efficiency and what it means for AI

    New research explains why human language resists code-like efficiency and what it means for AI

    Human language can seem inefficient compared with computer code, but researchers argue that its structure is optimized for the brain rather than for maximum compression. A new modeling study suggests people rely on familiar patterns to reduce mental effort during real-time conversation.

    The work, by linguist Michael Hahn and cognitive scientist Richard Futrell, was published in Nature Human Behaviour. Using information-theory-based modeling, they examined why languages worldwide tend to favor predictable word patterns instead of highly compact encodings.

    Efficiency for brains, not bits

    In principle, the same message could be transmitted with fewer symbols, similar to how computers use binary strings. The researchers contend that such a system would be harder for humans to learn and process because it would not align with how people store knowledge and anticipate meaning.

    Natural language, they argue, is tightly linked to shared experience, letting listeners map words onto familiar concepts quickly. That connection helps speakers avoid creating arbitrary, maximally compressed labels that would be information-dense but difficult to interpret.

    Predictability lowers cognitive load

    The model emphasizes that comprehension is incremental: listeners use each word to narrow down likely meanings before a sentence ends. This predictive processing makes everyday communication feel almost automatic, even if it is not mathematically optimal in terms of compression.

    As an illustration, the authors point to how grammatical order guides expectations in languages such as German. When familiar cues arrive in the expected sequence, the brain can prune unlikely interpretations early, whereas scrambled word orders force more effortful processing.

    What the findings suggest for AI

    The researchers say the results help explain why languages converge on structures that are learnable and robust under noisy, fast conditions like speech. Rather than chasing minimal code length, languages appear to balance expressiveness with the constraints of memory, attention, and prediction.

    The same logic could inform how developers evaluate and design large language models, which already rely heavily on predicting likely next words. The study suggests that systems built to communicate smoothly with people may benefit from prioritizing human-friendly predictability over pure information compression.