SAMSUNG_10 FOLD Advertisement SAMSUNG_10 FOLD Advertisement SAMSUNG_10 FOLD Advertisement

Nová verzia AI generátora obrázkov od Google konečne zachováva konzistentnosť

Výskum a vývoj
0

Google predstavil vylepšenú verziu generovania a editovania obrázkov v modeli Gemini 2.5 Flash, známej pod interným menom „nano banana“. Novinka už vystrelila na špičku rebríčka LMArena a cieli na achillovu pätu dnešných nástrojov, ktorou je konzistentnosť naprieč úpravami.

Používateľ vie vziať jeden základný záber a zmeniť scény bez znetvorenia tvárí či objektov, pričom postava zostáva „tá istá“. Rovnako funguje viacnásobné dolaďovanie, keď krok za krokom pridávate detaily a systém drží štýl aj proporcie.

Model je dostupný v aplikácii Gemini a pre vývojárov cez Gemini API, Google AI Studio aj platformu Vertex AI. Google popisuje príklady, v ktorých meníte oblečenie, účes či obdobie bez rozpadnutia identity osoby na zábere.

Zaujímavá je aj možnosti „miešania dizajnov“, kde prenesiete vzor z jedného obrázka na objekt v inom bez straty realizmu. Kreatívne scenáre zahŕňajú rýchly návrh produktov, storyboardy či konzistentné marketingové vizuály. Google zároveň zachováva prítomnosť vodotlače pre väčšiu transparentnosť.

Viditeľná značka v rohu a neviditeľná SynthID stopa umožnia rozpoznať pôvod aj po úpravách. V praxi to rieši známu frustráciu, keď kvôli malej zmene vznikne úplne iný obrázok.

Nano banana sa snaží zachovať „postavy“ a meniť pozadie, rekvizity, náladu či štýl až do bodu, kedy je výsledok použiteľný bez manuálneho retušovania. V tvorivom boji aplikácií ide o ďalšie kolo pretekov s Grokom, ChatGPT a ďalšími hráčmi. 

Silná konzistentnosť zrýchľuje pracovný tok a skracuje vzdialenosť od nápadu po sériu výstupov. Pre štúdiá, značky aj sólo tvorcov tak môže byť hlavným dôvodom, prečo ostať v ekosystéme Gemini.

Zdroj: techspot.com.

Zdroj Foto: depositphotos.com.

Redakcia

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať