Tag: Vaizdų generavimas

  • „Google“ pristatė naują DI vaizdų modelį: žada geresnę kokybę ir mažesnes išlaidas

    „Google“ pristatė naują DI vaizdų modelį: žada geresnę kokybę ir mažesnes išlaidas

    Dirbtinis intelektas vis sparčiau keičia vaizdų ir vaizdo įrašų kūrimą, o „Google“ plečia savo „Gemini“ ekosistemą naujais įrankiais kūrėjams ir verslui. Bendrovė paskelbė apie naują vaizdams skirtą modelį „Nano Banana 2 Lite“ ir išplečia bandomąją „Gemini Omni Flash“ prieigą, kuri orientuota į vaizdo generavimą.

    „Google“ „Nano Banana 2 Lite“ pristato kaip greitą ir ekonomišką „Gemini Image“ šeimos sprendimą, skirtą darbui beveik realiuoju laiku. Jis taikomas scenarijams, kur svarbus mažas vėlavimas ir didelės užklausų apimtys, pavyzdžiui, masinei grafikos generacijai ar automatizuotai produktų vizualizacijai.

    Naujasis modelis siūlomas kaip alternatyva ankstesniam „Nano Banana“ variantui, o atnaujinimas turėtų reikšti geresnę vaizdo kokybę ir greitesnį generavimą. „Google“ taip pat akcentuoja mažesnes eksploatacines sąnaudas, kas aktualu įmonėms, kurios DI turinį generuoja dideliais kiekiais.

    Kur jis jau pasiekiamas?

    „Nano Banana 2 Lite“ jau integruojamas į „Google AI Studio“, „Gemini“ API ir „Gemini Enterprise Agent Platform“. Bendrovė nurodo, kad sprendimas numatytas ir platesniam „Gemini“ produktų rinkiniui, kuriame DI pasitelkiamas kūrybiniam turiniui kurti bei redaguoti.

    Toks plėtimas atspindi bendrą rinkos kryptį: DI generuojamas turinys vis dažniau keliasi iš eksperimentinių įrankių į kasdienius produktus. Verslui tai reiškia spartesnį kūrybinį ciklą, o kūrėjams – galimybę automatizuoti dalį rutininės grafikos gamybos, nors kokybės kontrolė ir autorinių teisių klausimai išlieka aktualūs.

    „Gemini Omni Flash“: vaizdas iki 10 sekundžių

    Antra naujiena – bandomoji „Gemini Omni Flash“ versija, pristatyta „Google I/O“ konferencijos kontekste. Šis sprendimas sujungia multimodalinį „Gemini“ supratimą su natyviu vaizdo įrašų generavimu ir redagavimu, kai įvestimi gali būti tekstas, vaizdai ar vaizdo duomenys.

    Bandomojoje versijoje taikomi ribojimai: generuojami klipai negali viršyti 10 sekundžių, taip pat nurodomi apribojimai darbui su garso nuorodomis ir tam tikromis API funkcijomis. Tokie ribojimai įprasti bandomiesiems leidimams, kai funkcijos palaipsniui plečiamos, o infrastruktūra testuojama realiomis apkrovomis.

    Kainodara pateikiama pagal sugeneruotą trukmę: 10 JAV centų už sekundę, tai yra apie 0,09 euro už sekundę. Praktikoje tai reikštų, kad 10 sekundžių klipas kainuotų maždaug 0,90 euro, tačiau galutinė kaina gali priklausyti nuo planų, naudojimo apimties ir papildomų paslaugų.

    Turinio žymėjimas ir patikimumas

    „Google“ taip pat pabrėžia suderinamumą su „SynthID“ – technologija, skirta DI sugeneruoto turinio žymėjimui. Tokie sprendimai vis dažniau minimi kaip atsakas į augančią dezinformacijos, klastočių ir autorystės nustatymo problemą, ypač plintant realistiškiems vaizdams ir trumpiems vaizdo klipams.

    Bendrovė nurodo, kad „Gemini Omni Flash“ galima derinti su „Nano Banana 2 Lite“, kad būtų sklandesni darbo srautai tarp vaizdo ir vaizdų generavimo. Tai atitinka tendenciją kurti vieną ekosistemą, kurioje skirtingi DI modeliai papildo vienas kitą ir leidžia greičiau pereiti nuo idėjos prie paruošto turinio.