Umelá inteligencia od Googlu vytvorí z textového zadania HD video

Technológie

7.10.2022

Google oznámil, že pracuje na vývoji Imagen Video, režimu umelej inteligencie na prevod textu na video, ktorý dokáže produkovať videá s rozlíšením 1280 × 768 pri 24 snímkach za sekundu na základe textového zadania. Oznámenie prišlo necelý týždeň po tom, čo spoločnosť Meta predstavila svoj nástroj umelej inteligencie na prevod textu na video Make-A-Video. Podľa dokumentu Googlu má Imagen Video niekoľko pozoruhodných schopností, dokáže napríklad vytvárať videá na základe diel slávnych maliarov (napríklad obrazov Vincenta van Gogha), vytvárať 3D rotujúce objekty pri zachovaní štruktúry objektu a vykresľovať zadaný textu v animáciách rôznych štýlov. Kľúčom k schopnostiam Imagen Video je „kaskáda“ siedmich difúznych modelov, ktoré transformujú počiatočný textový opis (napríklad „medveď umýva riad“) na video s nízkym rozlíšením (16 snímok, 24 × 48 pixelov, 3 snímky za sekundu). {{BANNER|SIMPLE_BANNER_HOMEPAGE_4}} Následne ho s každým krokom upscalujú na čoraz vyššie rozlíšenia s vyššou ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU

Prihlásiť pomocou členstva NEXTECH

Zobrazit Galériu