SAMSUNG_022024C Advertisement SAMSUNG_022024C Advertisement SAMSUNG_022024C Advertisement

Pozrite sa aký pokrok dosiahla OpenAI Sora v tvorbe hyperrealistických videí

Výskum a vývoj
0

Spoločnosť OpenAI pred pár dňami ohlásila svoj nový model AI Sora, ktorý premieňa opisný text na video a nazvať ho masívnym skokom vpred je príliš slabé vyjadrenie. Sora vytvára „hyper realistické scény“ z textových zadaní, čo znamená, že môžete opísať scénu so všetkými detailmi, na ktorých vám záleží, a ona vytvorí zodpovedajúce video s vysokým rozlíšením.

V tomto smere je podobná mnohým predchádzajúcim generátorom videa, s ktorými sme sa stretli približne za posledný rok ale v neporovnateľne vyššej kvalite. Pozrite sa, aký pokrok dosiahlo OpenAI so svojím novým systémom Sora. Tu je niekoľko príkladov aj so zadaniami, ktoré k nim viedli.

Zadanie: Samojed a pes zlatý retríver sa hravo potulujú nočným futuristickým neónovým mestom. Neónové svetlá vyžarujúce z okolitých budov sa lesknú na ich srsti.

Zadanie: Kamera sleduje biele historické SUV s čiernym strešným nosičom, ako sa rúti po prašnej ceste obklopenej borovicami na strmom horskom svahu, z pneumatík sa dvíha prach, slnečné svetlo svieti na SUV, ako sa rúti po poľnej ceste, a vrhá na scénu teplú žiaru. Cesta sa mierne stáča do diaľky, v dohľade nie sú žiadne iné autá ani vozidlá. Stromy po oboch stranách cesty sú sekvoje, po ktorých sú roztrúsené kúsky zelene. Auto vidieť zozadu, ako s ľahkosťou kopíruje zákrutu, takže sa zdá, akoby bolo na drsnej jazde členitým terénom. Samotná poľná cesta je obklopená strmými kopcami a horami, nad ktorými je jasná modrá obloha s mračnami.

Zadanie: Štýlová žena kráča po tokijskej ulici plnej teplých žiariacich neónov a animovaných mestských nápisov. Na sebe má čiernu koženú bundu, dlhé červené šaty, čierne čižmy a v ruke nesie čiernu kabelku. Na očiach má slnečné okuliare a má červený rúž. Kráča sebavedomo a ležérne. Ulica je vlhká a leskne sa, čo vytvára zrkadlový efekt farebných svetiel. Prechádza sa po nej veľa chodcov.

Fyzika týchto scén funguje neskutočne dobre. Detaily a pohyb sú tak realistické, že by ste si mnohé ľahko pomýlili so skutočnými zábermi, keby ste nehľadali chyby alebo si nevšimli, že ide o realistické zábery niečoho, čo v skutočnosti neexistuje.

Zadanie: Po zasneženej lúke sa blíži niekoľko obrovských srstnatých mamutov, ich dlhá vlnitá srsť pri chôdzi zľahka povieva vo vetre, v diaľke sú zasnežené stromy a dramatické snehom posypané hory, popoludňajšie svetlo s mračnami a slnko vysoko v diaľke vytvárajú teplú žiaru, pohľad z nízkej kamery je ohromujúci, zachytáva veľké chlpaté cicavce na krásnej fotografii s hĺbkou ostrosti.

Podľa OpenAI môže Sora aj ukladať postavy, miesta a štýly, aby sa dali použiť vo viacerých scénach, čo ukazuje, že to nakoniec smeruje: k schopnosti generovať celé príbehy, relácie alebo filmy. 

Zadanie: Príbeh o živote robota v kyberpunkovom prostredí.

Na druhej strane je tu stále veľa priestoru na zlepšenie a ako pri všetkých kreatívnych systémoch AI aj tu môžu byť výsledky zvláštne, najmä ak požadujete niečo obzvlášť absurdné.

Zadanie: Archeológovia objavia v púšti bežnú plastovú stoličku, s veľkou starostlivosťou ju vykopú a oprášia.

A niekedy môže prísť s nečakane umeleckým prekvapením alebo aj s dvoma.

Zadanie: Nádherné domáce video zobrazujúce obyvateľov Lagosu v Nigérii v roku 2056. Nakrútené kamerou mobilného telefónu.

OpenAI hovorí, že teraz je Sora vo fáze red teamingu (termín z oblasti kybernetickej bezpečnosti označujúci techniku útoku používanú na testovanie toho, ako by organizácia reagovala na skutočný kybernetický útok). To znamená, že dostáva neprístojné zadania a tím sa ju snaží prinútiť robiť veci, ktoré nie sú povolené, aby bolo možné zablokovať všetky známe spôsoby, ako to dosiahnuť. Vďaka tomu bude Sora možno trochu pokrivená, ale viac v súlade s autorskými právami a bude menej pravdepodobné, že bude generovať „nebezpečný“ obsah.

Zadanie: Letecký pohľad na Santorini počas modrej hodiny (pozn: čas svitania alebo súmraku), ktorý ukazuje úžasnú architektúru bielych kykladských budov s modrými kupolami. Výhľad na kalderu je úchvatný a osvetlenie vytvára krásnu, pokojnú atmosféru.

Zdroj: newatlas.com.

Redakcia

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať