Umelá inteligencia dokáže vytvoriť portrét iba z hlasového záznamu danej osoby

Výskum a vývoj

20.4.2022

Výskumníci v oblasti umelej inteligencie pracovali na rekonštrukcii tváre človeka len pomocou krátkej zvukovej nahrávky jeho rozprávania a výsledky sú veľmi pôsobivé. Prvé informácie o algoritme AI názvom Speech2Face publikovali výskumníci z Laboratória počítačovej vedy a umelej inteligencie na MIT v článku z roku 2019. Tím najprv navrhol a vycvičil hlbokú neurónovú sieť pomocou miliónov videí z YouTube a internetu, na ktorých sú zachytení hovoriaci ľudia. Počas tohto tréningu sa umelá inteligencia naučila korelácie medzi zvukom hlasu a tým, ako hovoriaci vyzerá. Tieto korelácie jej umožnili čo najlepšie odhadnúť vek, pohlavie a etnický pôvod hovoriaceho. Po vyškolení bola umelá inteligencia pozoruhodne dobrá pri vytváraní portrétov len podľa hlasových záznamov, ktoré sa podobali na to, ako hovoriaci skutočne vyzeral. Na ďalšiu analýzu presnosti rekonštrukcií tváre výskumníci vytvorili „dekodér tváre“, ktorý robí štandardizovanú rekonštrukciu tváre osoby zo statického záberu, pričom i ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU

Prihlásiť pomocou členstva NEXTECH

Zobrazit Galériu