Koniec ručného retušovania obrázkov. AI Gemini upraví akúkoľvek fotku textovým promptom

Výskum a vývoj

5.5.2025

Ešte nedávno vyvolal rozruch ChatGPT so schopnosťou generovať a editovať obrázky na požiadanie. Výsledky boli tak realistické, že internet zaplavilo množstvo zavádzajúcich fotomontáží. Google však nezaostáva – jeho vlastný AI chatbot Gemini už nejaký čas ponúka podobné funkcie a najnovšie dostal zásadné vylepšenie. Spoločnosť Google totiž do aplikácie Gemini pridala možnosť priamo upravovať fotografie pomocou textových pokynov. Používateľ tak môže nahrať ľubovoľnú fotku a jednoduchým slovným opisom dosiahnuť požadovanú zmenu.

Ide to dokonca ľahšie než cez pokročilé funkcie v aplikácii Fotky Google – Gemini dokáže kompletne „prepísať“ realitu na zábere podľa želania. Vytvorenie falošnej scény či úprava fotky tak už nevyžaduje žiadne grafické schopnosti, stačí bežný jazyk. Napríklad Google zverejnil sériu snímok dalmatínskeho psa: na prvej sedí pes na tráve, na druhej mu pribudla žltá šiltovka a na tretej zostal pes s čiapkou, ale pozadie sa zmenilo na úplne iné prostredie. Vznikla tak úplne nová, umelo vytvorená spomienka. Podľa Googlu možno takto meniť pozadie, nahrádzať objekty alebo pridávať nové prvky. Môžete napríklad nahrať svoju vlastnú fotku a nechať Gemini vygenerovať obrázok, ako by ste vyzerali s inou farbou vlasov.

Ďalšou ukážkou bolo využitie Gemini na tvorbu ilustrovaného príbehu – AI vytvorila obrázky drakov k textu rozprávky na dobrú noc. V praxi môžete cez Gemini urobiť s fotkou takmer čokoľvek, pričom netreba vôbec ovládať Photoshop. Stačí nahrať záber, slovne opísať požadované zmeny a nechať AI pracovať. Výsledok sa zobrazí v priebehu pár sekúnd. Ak nie je podľa predstáv, požiadavku upresníte ďalším promptom a Gemini obrázok doupravuje. Samozrejme, aj tu existujú hranice a zabudované obmedzenia.

Pravdepodobne narazíte na prípady, keď Gemini určitú úpravu odmietne vykonať – napríklad ak by bola v rozpore s pravidlami o bezpečnosti a etike. Google si ponechal isté poistky, aby znemožnil zneužitie nástroja na škodlivé účely. Aj tak však mnohých odborníkov znepokojuje, aké ľahké je dnes vytvárať dokonale vyzerajúce falošné zábery. Google preto popri nových funkciách experimentuje s novým bezpečnostným prvkom – viditeľným vodoznakom priamo v obrázku, ktorý vytvorí umelá inteligencia.

Doteraz sa firma spoliehala len na neviditeľnú digitálnu značku (technológia SynthID) vloženú do dát súboru, ktorú bežný človek nepostrehne. Po novom však Google skúša do každého AI obrázka doplniť aj viditeľné logo, ktoré na prvý pohľad prezradí, že ide o syntetický výtvor. Na zverejnených ukážkach fotiek upravených cez Gemini je skutočne vidno malé označenie v rohu. Takýto vodoznak by mal pomôcť zabrániť zneužívaniu falošných záberov, hoci samozrejme nie je všemocný – jednoduchým orezaním obrázka by sa dal odstrániť. Napriek tomu ide o krok správnym smerom.

Google v oficiálnom oznámení uviedol: „V súlade s doterajšími praktikami budú všetky obrázky vytvorené alebo upravené Geminim obsahovať neviditeľný digitálny vodoznak SynthID. Zároveň momentálne experimentujeme s pridávaním viditeľného vodoznaku na všetky obrázky generované Geminim.“ Je to síce oneskorené opatrenie, ale aspoň niečo. Nová funkcia natívnej úpravy fotiek v Gemini začala používateľom pribúdať vo štvrtok koncom apríla. Dostupná bude väčšine majiteľov Google účtov po celom svete (s výnimkou firemných a školských účtov Workspace).

Nasadenie prebieha postupne – ak ju už máte aktívnu, využijete ju cez webové rozhranie Gemini alebo v mobilnej aplikácii. Google tak ďalej vylepšuje schopnosti svojho AI asistenta Gemini a snaží sa zároveň reagovať na obavy, ktoré takéto pokročilé nástroje vyvolávajú. Upravovať fotografie jednoduchým príkazom je obrovský pokrok pre kreatívcov aj bežných používateľov – zároveň však Google prvýkrát testuje viditeľné označovanie AI obrázkov, aby pomohol odlíšiť realitu od fikcie.

Zdroj: BGR

^{Zdroj Foto: Google}