Lenkijoje pristatyti 11 atvirų DI modelių PLLuM: tikslas – paprastesnė biurokratų kalba

Lenkijoje pristatyta 11 naujų atvirų didžiųjų kalbos modelių (LLM) šeima PLLuM, skirta viešajam sektoriui, verslui ir gyventojams. Projektą vystantis HIVE konsorciumas pabrėžia, kad modeliai pritaikyti darbui su administracine kalba ir procedūromis, o dalis versijų turi papildomus saugumo filtrus.

Modeliai pateikiami trimis kryptimis: bazine, instrukcine ir dialogine. Bazinė labiau skirta bandymams ir pritaikymui konkrečioms užduotims, instrukcinė – darbui su aiškiomis užduotimis ir dokumentais, o dialoginė sureguliuota taip, kad būtų saugiau naudoti galutiniams vartotojams.

Kam skirti modeliai?

Pasak projekto atstovų, PLLuM orientuojamas į praktiškas situacijas, su kuriomis kasdien susiduria institucijos: nuo prašymų ir atsakymų rengimo iki informacijos paieškos teisės aktuose ar vidinėse taisyklėse. Modeliai taip pat apmokyti generuoti ir suprasti daugiau nei 20 administracinių tekstų tipų, todėl gali padėti vienodinti ir supaprastinti rašytinę komunikaciją.

Svarbi kryptis – biurokratinės kalbos aiškinimas paprastesniais žodžiais. Tokia funkcija aktuali ne tik gyventojams, bet ir pačioms įstaigoms, nes aiškesni dokumentai mažina klaidų riziką ir trumpina konsultacijų laiką.

„Dėjome daug pastangų, kad modeliai gebėtų paaiškinti sudėtingas administracines procedūras ir supaprastinti urėdišką kalbą“, – sakė NASK Dirbtinio intelekto saugumo tyrimų centro vadovas Szymonas Łukasikas.

Diegimai ir darbas su dokumentais

Kūrėjai teigia, kad PLLuM geriau pritaikytas darbui su RAG principu, kai atsakymai formuojami remiantis pateiktais šaltiniais, pavyzdžiui, teisės aktais, gairėmis ar vidiniais dokumentais. Tokia architektūra mažina tikimybę, kad modelis atsakys „iš nuojautos“, ir padeda aiškiau pagrįsti pateikiamą informaciją.

Lenkijos skaitmeninimo ministerijos atstovai nurodė, kad artimiausi diegimai numatomi birželį Skaitmeninimo ministerijoje ir Ministro Pirmininko kanceliarijoje. Tikimasi, kad DI įrankiai pagreitins pasikartojančias užduotis ir sumažins administracinį krūvį, ypač rengiant standartinius tekstus.

„Norime, kad tai liktų atvira visiems, be ribojimų, kurie galėtų sulėtinti diegimus“, – sakė Lenkijos skaitmeninimo viceministras Dariusz Standerski.

Dydžiai, saugumas ir kas toliau

PLLuM modeliai pateikiami keliais dydžiais – nuo mažesnių, tinkamesnių ribotiems skaičiavimo resursams, iki didžiausio varianto, skirto sudėtingesnėms užduotims. Mažesni ir vidutiniai modeliai turi bazines, instrukcines ir dialogines versijas, o didžiausias modelis siūlomas instrukcine ir dialogine formomis.

Dialoginėse versijose įdiegtos papildomos apsaugos, ribojančios žalingo turinio generavimą ir atsakymus į pavojingas užklausas. Tai atitinka bendrą ES kryptį, kur DI sistemoms keliami didesni skaidrumo, saugumo ir atsakomybės reikalavimai, ypač kai jos taikomos viešajame sektoriuje.

Kūrėjai taip pat akcentuoja, kad vien sukurti modelį neužtenka: būtina nuolat atnaujinti jo žinias ir pritaikymą, kad atsakymai neatsiliktų nuo teisės aktų bei praktikos pokyčių. Kitas planuojamas žingsnis – nacionalinis vaizdinis modelis, kurio prototipai, pasak komandos, jau testuojami.

PLLuM šeima buvo treniruota su maždaug 7 milijonais tekstų lenkų kalba, įskaitant viešus valstybės leidinius ir licencijuotus šaltinius. Projektą koordinuoja NASK, o konsorciume taip pat dalyvauja kelios valstybės IT ir mokslo institucijos bei universitetai.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *