Umelá inteligencia generuje z textu hudbu so zvukom v CD kvalite

Výskum a vývoj

20.9.2023

Predstavte si, že napíšete zadanie „dramatická úvodná hudba“ a môžete si vypočuť vzletnú symfóniu, prípadne napíšete „strašidelné kroky“ a dostanete vysokokvalitné zvukové efekty. To sľubuje Stable Audio, model umelej inteligencie na prevod textu na zvuk, ktorý nedávno oznámila spoločnosť Stability AI a ktorý dokáže syntetizovať stereo hudbu alebo zvuky podľa textových opisov. Stability AI je spoločnosť, ktorá pomohla financovať vytvorenie modelu Stable Diffusion, modelu syntézy obrazu technikou latentnej difúzie, ktorý bol vydaný v auguste 2022. Teraz sa rozvetvila do oblasti zvuku tým, že podporila laboratórium AI Harmonai, ktoré v septembri spustilo generátor hudby Dance Diffusion. V súčasnosti chcú spoločnosti Stability a Harmonai so svojím nástrojom Stable Audio preraziť v oblasti komerčnej produkcie zvuku pomocou umelej inteligencie. Súdiac podľa produkčných vzoriek sa zdá, že ide o výrazné zlepšenie kvality zvuku oproti predchádzajúcim generátorom zvuku s umelou inteligenciou. ...

Článok je uzamknutý

Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU

Prihlásiť pomocou členstva NEXTECH

Zobrazit Galériu