MagicAnimate a Animate Anyone dokážu roztancovať kohokoľvej iba zo statickej fotky

Výskum a vývoj

12.12.2023

Generatívna AI dokáže vytvárať fotorealistické obrázky, no objavili sa už aj modely, ktoré dokážu generovať videá. Čínske spoločnosti Bytedance a Alibaba teraz ukázali modely, ktoré vytvárajú fotorealistické videoklipy animovaných ľudí. Hoci spoločnosti používajú mierne odlišné architektúry, obe v podstate využívajú difúzne modely prispôsobujúce obrázky modelu, ktorý určuje polohy napríklad tanečnej sekvencie. MagicAnimate od spoločnosti Bytedance a Show Lab na Národnej univerzite v Singapure a Animate Anyone od spoločnosti Alibaba a Inštitútu pre inteligentné výpočty generujú krátke videoklipy tancujúcich ľudí alebo kreslených postavičiek z referenčného obrázka a tanečnej sekvencie. Pomocou metód, ako je ControlNet a technika časovej stability, dosahujú videá oveľa vyššiu konzistenciu ako iné modely na prevod textu na video alebo obrazu na video, pričom prekonávajú súčasný najlepší benchmark takmer o 40 percent. Obe metódy vyžadujú na generovanie videí iba jeden obrázok a jednu pohy ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU

Prihlásiť pomocou členstva NEXTECH

MagicAnimate a Animate Anyone dokážu roztancovať kohokoľvej iba zo statickej fotky

Mohlo by vás zaujímať

Mohlo by vás zaujímať

AI pomohla navrhnúť “neviditeľné plášte” odkláňajúce magnetické polia

AI vytvorila robotický organizmus schopný samostatne sa opraviť

Zázračný materiál drasticky znižuje energetické nároky dátových centier pre využívanie AI