Wikimedia Commons, viena didžiausių atvirų multimedijos saugyklų pasaulyje, pastaruoju metu vis dažniau minima informacinio karo kontekste. Dezinformacijos ekspertai atkreipia dėmesį, kad platformoje gausėja iš Rusijos valstybinės ekosistemos kilusių vaizdų ir vaizdo įrašų, susijusių su Krymo aneksija ir karu prieš Ukrainą.
Problemos esmė ta, kad šia duomenų baze aktyviai naudojasi ne tik žmonės, bet ir automatizuotos sistemos. DI modeliai bei jų kūrėjų naudojami duomenų rinkimo įrankiai dažnai traktuoja Wikimedia projektus kaip patikimą, lengvai pasiekiamą šaltinį, todėl ten įkeltas turinys gali daryti įtaką tam, kaip vėliau formuluojami atsakymai vartotojams.
Kaip turinys pasiekia DI
Wikimedia Commons veikia panašiais bendruomeniniais principais kaip ir Wikipedia, todėl failus gali įkelti įvairūs naudotojai. Saugykloje sukaupta daugiau nei 140 milijonų failų, o didelė jų dalis platinama laisvomis licencijomis, kurios leidžia turinį teisėtai kopijuoti ir naudoti pakartotinai.
Wikimedia Foundation yra viešai nurodžiusi, kad nuo 2024 metų duomenų srautas, susijęs su multimedijos atsisiuntimu, išaugo apie 50 proc. Organizacija akcentavo, kad augimą reikšmingai skatina automatizuotos programos, kurios masiškai renka atviro licencijavimo vaizdus ir perkelia juos į DI mokymo ar testavimo procesus.
Ieškant su Krymo aneksija susijusių sąvokų, vartotojui gali būti pateikiamas turinys, kuriame dominuoja Kremliaus naratyvą palaikantys šaltiniai. Dezinformacijos tyrėjai pabrėžia, kad tokia disproporcija gali ilgainiui iškreipti kontekstą, jeigu algoritmai dažniau mato ir išmoksta vienos pusės vizualinę bei aprašomąją medžiagą.
Rizika slypi ne tik vaizduose
Ekspertai pabrėžia, kad šiuolaikiniai DI modeliai yra multimodaliniai, todėl gali apdoroti ne tik tekstą, bet ir vaizdus, vaizdo įrašus bei garsą. Tai reiškia, kad informacinė įtaka gali būti daroma per pačius vaizdus, jų kontekstą ir su failais susijusius aprašus.
Ypatingas dėmesys skiriamas metaduomenims, kurie Wikimedia Commons dažnai pateikiami kartu su failu. Trumpas aprašas, raktiniai žodžiai ar kategorijos gali būti suformuluoti taip, kad nukreiptų interpretaciją norima kryptimi ir darytų įtaką tam, kaip turinį supranta tiek žmogus, tiek DI.
Taip pat įvardijamos ir sudėtingesnės grėsmės, pavyzdžiui, steganografija, kai papildomos žinutės paslepiamos pačiame vaizde. Žmogui jos gali būti nepastebimos, tačiau kompiuterinės sistemos, priklausomai nuo analizės metodų, gali jas aptikti ir panaudoti kaip papildomą signalą.
Ką sako Wikimedia bendruomenė
Wikimedia Polska, reaguodama į viešus vertinimus, yra nurodžiusi, kad, remiantis pateiktais pavyzdžiais ir konsultacijomis su aktyviais savanoriais, nėra pakankamo pagrindo teigti apie dokumentuotą, koordinuotą Rusijos operaciją pačioje platformoje. Organizacija pabrėžė, kad kai kurių temų paieškose turinys iš rusiškų šaltinių gali dominuoti dėl licencijų prieinamumo.
Praktikoje tai reiškia, kad valstybinės Rusijos institucijos ar su jomis susiję kanalai neretai platina medžiagą laisvesnėmis licencijomis, todėl ją lengviau teisėtai perkelti į Wikimedia Commons. Tuo metu daugelio Vakarų ar Ukrainos naujienų agentūrų nuotraukos ir vaizdo įrašai dažniau saugomi griežtesnių autorinių teisių, todėl į atviras saugyklas patenka rečiau.
Ekspertai perspėja, kad toks teisinių ir techninių aplinkybių derinys gali turėti realių pasekmių viešajai erdvei. Jei DI sistemoms dažniau pasiekiamas vienos pusės vizualinis pasakojimas, didėja rizika, kad bus silpninamas aukų kontekstas, o konfliktas pateikiamas per agresoriaus suformuotą rėmą.
Specialistų teigimu, vienas svarbiausių atsakų į šią problemą yra skaidresnės turinio kilmės žymėjimo praktikos, aktyvesnė bendruomenės moderacija jautriomis temomis ir didesnis dėmesys tam, kaip atviri duomenys naudojami DI mokymui. Kartu pabrėžiama, kad informacinės operacijos vis dažniau taikosi į infrastruktūrą, kuria remiasi skaitmeniniai atsakymų varikliai, o ne tik į tradicinę žiniasklaidą.

Leave a Reply