Google Lyria 3 naraz vygeneruje hudbu, spev aj texty
KĽÚČOVÉ ZISTENIA:
-
Model Lyria 3 generuje hudbu, spev a texty priamo v chate Gemini.
-
Systém dokáže vytvoriť soundtrack k videu alebo obrázku.
-
Nahrávky obsahujú nepočuteľný vodoznak SynthID na ochranu autorských práv.
Google razantne vstupuje na pole generatívnej hudby integráciou svojho najnovšieho modelu Lyria 3 priamo do chatbota Gemini. Táto aktualizácia umožňuje používateľom vytvárať kompletné hudobné skladby vrátane spevu a inštrumentálneho sprievodu len na základe textového zadania. Systém je navrhnutý tak, aby konkuroval špecializovaným službám ako Suno a Udio, pričom ťaží z obrovskej výpočtovej sily Google.
Model Lyria 3, vyvinutý divíziou DeepMind, dokáže spracovať nielen textové, ale aj vizuálne vstupy, čo je jeho kľúčová výhoda. Používateľ môže nahrať video alebo fotografiu a požiadať umelú inteligenciu, aby k nej skomponovala adekvátny soundtrack. Systém analyzuje náladu, obsah a dynamiku obrazu a transformuje ich do 30-sekundovej hudobnej ukážky.
Dôležitou súčasťou technológie je bezpečnostný systém SynthID, ktorý do každej vygenerovanej nahrávky vkladá digitálny vodoznak. Tento vodoznak je pre ľudské ucho nepočuteľný, no zostáva detekovateľný aj po kompresii alebo úprave zvuku. Google týmto krokom reaguje na obavy hudobného priemyslu z nekontrolovaného šírenia syntetického obsahu a porušovania autorských práv.
Služba je dostupná bezplatne pre používateľov starších ako 18 rokov v ôsmich svetových jazykoch. Predplatitelia verzií Advanced majú prístup k vyšším limitom generovania a pokročilejším funkciám. Hoci je dĺžka skladieb momentálne obmedzená na 30 sekúnd, kvalita výstupu a schopnosť generovať texty v rôznych štýloch naznačujú obrovský potenciál pre tvorcov obsahu.
V porovnaní s konkurenciou, ktorá umožňuje generovať dlhšie skladby, sa Google zameriava skôr na integráciu a multimodalitu. Cieľom je poskytnúť nástroj pre rýchlu tvorbu hudobných nápadov a podkladov pre sociálne siete. Lyria 3 vyniká najmä v schopnosti porozumieť kontextu a prepojiť vizuálny vnem so sluchovým v jednom kroku.
Diskusia okolo trénovacích dát zostáva horúcou témou, keďže umelci sa obávajú zneužitia svojej tvorby. Google sa snaží o transparentnosť a zavádza nástroje na ochranu duševného vlastníctva, no právny rámec pre AI hudbu je stále nejasný. Napriek tomu je zrejmé, že generatívna hudba sa stáva novým štandardom v tvorbe digitálneho obsahu pre masy.
Funkcia remixovania umožňuje používateľom upraviť existujúce predvoľby podľa vlastného vkusu, ak im chýba inšpirácia. Systém ponúka širokú paletu žánrov od latinského popu až po folkové balady. Táto interaktivita mení pasívneho poslucháča na aktívneho spolutvorcu, ktorý môže ovplyvniť výslednú podobu diela.
Integrácia do Gemini znamená, že používatelia nemusia prepínať medzi rôznymi aplikáciami na text, obraz a zvuk. Všetko sa deje v jednom konverzačnom vlákne, čo zjednodušuje kreatívny proces. Google tak buduje komplexný ekosystém, kde AI slúži ako univerzálny asistent pre všetky formy vyjadrenia.
Budúcnosť hudobnej produkcie sa s príchodom Lyria 3 nenávratne mení, hoci nenahrádza ľudských umelcov. Stáva sa skôr nástrojom pre rýchle prototypovanie a demokratizáciu hudobnej tvorby. Otázkou zostáva, ako sa s týmto prílevom syntetickej hudby vyrovná trh a poslucháči, ktorí si cenia autenticitu.
PREČO JE TO DÔLEŽITÉ: Zjednocuje tvorbu textu, obrazu a hudby do jednej platformy, čím radikálne zjednodušuje tvorbu multimediálneho obsahu.
Zdroj: lifehacker.com foto: depositphotos.com