Nová verzia AI pre Gemini generuje profesionálne skladby len na základe textových promptov
KĽÚČOVÉ ZISTENIA:
-
Nový model Lyria 3 Pro generuje dlhé hudobné diela.
-
Systém reaguje aj na zložité požiadavky a špecifickú hudobnú terminológiu.
-
Výstupy obsahujú neviditeľný vodoznak a rešpektujú autorské práva umelcov.
Nástroje umelej inteligencie zamerané na tvorbu multimediálneho obsahu prechádzajú neustálym vývojom. Spoločnosť Google prináša pre predplatiteľov aplikácie Gemini upravený model na generovanie hudby s názvom Lyria 3 Pro. Táto technológia rozširuje možnosti toho, čo dokážu používatelia vytvoriť iba pomocou textových príkazov.
Kým predchádzajúca verzia Lyria 3 umožňovala generovať iba krátke hudobné ukážky s dĺžkou 30 s, novinka prináša výrazný posun. Používatelia môžu vytvárať ucelené skladby, ktoré dosahujú dĺžku až 3 min. Tento rozdiel znamená, že model dokáže vygenerovať výstup, ktorý je 6-násobne dlhší v porovnaní s predchodcom.
Lyria 3 Pro sa vyznačuje hlbším porozumením hudobnej kompozície a zvládne spracovať textové zadania s odbornou terminológiou. Používatelia môžu špecifikovať, ako majú znieť jednotlivé časti piesne, vrátane úvodov, slôh, refrénov a premostení. Systém tieto požiadavky zohľadní pri tvorbe konkrétnych pasáží, čo umožňuje pracovať s rôznymi hudobnými témami.
Tieto funkcie robia z modelu užitočný nástroj pre tvorcov digitálneho obsahu, ktorí potrebujú hudbu na pozadí projektov. Vygenerované skladby nájdu uplatnenie v prostredí vlogov, podcastov alebo inštruktážnych videí. Autori získavajú prístup k originálnej hudbe prispôsobenej ich požiadavkám a nálade konkrétneho videa.
Tréning tohto modelu prebiehal na materiáloch, na ktoré majú platformy YouTube a Google riadne udelené práva. Umelá inteligencia nebude priamo napodobňovať konkrétnych interpretov, a to ani v prípade spomenutia ich mena v zadaní. Zadaný umelec v takomto prípade poslúži pre model iba ako všeobecná inšpirácia pre celkový štýl piesne.
Všetky výstupy vytvorené pomocou tohto nástroja obsahujú ochranný prvok vo forme technológie SynthID. Ide o proprietárny vodoznak spoločnosti Google, ktorý identifikuje obsah vygenerovaný umelou inteligenciou. Rovnaký systém označovania používajú aj iné modely spoločnosti, ako napríklad Nano Banana na fotografie a Veo na videá.
Dostupnosť funkcie je rozdelená podľa úrovne predplatného, pričom používatelia balíka Google AI Plus majú denný limit 10 skladieb. Predplatitelia verzie Pro môžu vytvoriť 20 skladieb denne a používatelia s plánom Ultra majú k dispozícii limit 50 skladieb za deň. Okrem aplikácie Gemini sa modely z rodiny Lyria 3 dostávajú aj do nástrojov Vertex AI, Google AI Studio, Gemini API, Google Vids a ProducerAI.
PREČO JE TO DÔLEŽITÉ: Zvýšená kapacita a presnosť hudobných modelov zjednodušuje prácu tvorcom obsahu a prináša nové možnosti.
Zdroj: androidauthority.com foto: ChatGPT