
Genie 3 vytvori komplexné interaktívne 3D virtuálne svety na základe jediného promptu
Spoločnosť Google DeepMind predstavila technológiu, ktorá nie je len ďalším chatbotom alebo generátorom obrázkov, ale niečím zásadne novým: „modelom sveta“ s názvom Genie 3. Jeho základnou schopnosťou je generovať celé, interaktívne 3D virtuálne svety na základe jednoduchého textového príkazu, ako napríklad „bojovník v zasneženej krajine“. Nejde pritom o vopred pripravené video, ale o simuláciu v reálnom čase.
Zdroj Foto: GOOGLE DEEPMIND
Technologický zázrak spočíva v tom, že Genie 3 generuje tieto svety pri 24 snímkach za sekundu v rozlíšení 720p a dokáže udržať vizuálnu a fyzikálnu konzistenciu po dobu niekoľkých minút interakcie. To je obrovský skok v porovnaní s jeho predchodcom, Genie 2, ktorý dokázal udržať konzistenciu len 10 až 20 sekúnd.
Kľúčovým prelomom je takzvaná „emergentná vizuálna pamäť“: ak používateľ opustí nejaké miesto a neskôr sa naň vráti, objekty zostanú na svojom mieste, čím sa vytvára uveriteľný a perzistentný svet bez nutnosti explicitného prograovania 3D dát. Používateľský zážitok je fascinujúci, pretože v týchto svetoch sa dá nielen pohybovať, ale aj ich meniť za chodu pomocou textových príkazov, ako napríklad „spusti dážď“ alebo „pridaj stádo jeleňov“.
Zdroj Foto: GOOGLE DEEPMIND
Všestrannosť Genie 3 je ohromujúca; dokáže vytvoriť všetko od realistických krajín a historických rekonštrukcií (napríklad staroveký Knossos) až po fantastické scenérie s lietajúcimi ostrovmi a animovanými bytosťami. Technológia má však stále svoje obmedzenia: interakcie sú časovo limitované, fyzika môže byť nepresná, simulácie s viacerými postavami sú nespoľahlivé a model zatiaľ nie je verejne dostupný, ale len pre vybranú skupinu výskumníkov.
Google DeepMind považuje tieto modely za „kľúčový krok na ceste k všeobecnej umelej inteligencii“ (AGI). Dôvodom je, že AGI si vyžaduje autonómne systémy, ktoré sa učia zo skúseností, a modely ako Genie 3 im môžu poskytnúť „neobmedzené učebné osnovy v bohatých simulačných prostrediach“, od tréningu robotov vo virtuálnych skladoch až po riešenie zložitých scenárov typu „čo ak“.
Zdroj Foto: GOOGLE DEEPMIND
Genie 3 tak predstavuje zásadný posun od umelej inteligencie ako nástroja na napodobňovanie vzorov (ako ChatGPT či Midjourney) k umelej inteligencii ako simulátoru kauzálnej, interaktívnej reality, čo je základný predpoklad pre vytvorenie skutočne autonómnych systémov.
Zdroj: techcrunch.com.
Zdroj Foto: depositphotos.com.
Zobrazit Galériu