Umelá inteligencia dokáže vizualizovať to, na čo myslíte

Výskum a vývoj

8.3.2023

Výskumníci Yu Takagi a Shinji Nishimoto z Graduate School of Frontier Biosciences na univerzite v Osake nedávno napísali článok, v ktorom načrtli, ako možno rekonštruovať obrázky s vysokým rozlíšením (hovoríme o 512 × 512 pixeloch) pomocou modelov latentnej difúzie čítaním aktivity ľudského mozgu, získanej z funkčného zobrazovania magnetickou rezonanciou (fMRI). Predchádzajúce štúdie zahŕňali „tréning a prípadne jemné ladenie generatívnych modelov, ako sú GAN, s rovnakým súborom údajov, aký sa používa v experimentoch fMRI“, vysvetľujú výskumníci. Je to náročné, pretože práca s generatívnymi modelmi je nielen ťažká, ale aj školiaci materiál je mimoriadne obmedzený. Zdá sa, že vedci z Osaky dokázali obísť tieto obmedzenia pomocou stabilnej difúzie a výsledky vyzerajú skutočne pôsobivo. Predstavme si praktické použitie. Jedného dňa by nehovoriaci alebo ochrnutí ľudia, ktorí nedokážu niečo odfotiť, mohli byť schopní ukázať nám presne to, na čo myslia, a to pomocou umelej inteligencie. ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU

Prihlásiť pomocou členstva NEXTECH

Zobrazit Galériu