TCL 2022 TCL 2022 TCL 2022

Vytvorila si umelá inteligencia vlastný „tajný jazyk“?

Technológie
3

Nová generácia modelov umelej inteligencie (AI) ako Imagen, MidJourney a DALL-E 2 dokáže vytvárať „kreatívne“ obrázky na požiadanie na základe textových podkladov. Vedci v USA prišli so zaujímavým tvrdením, že model DALL-E 2 mohol vynájsť vlastný tajný jazyk na definovanie objektov. Po vyzvaní DALL-E 2, aby vytvoril obrázky obsahujúce textové titulky, a následnom vložení výsledných titulkov (hlúpostí) späť do systému vedci dospeli k záveru, že DALL-E 2 si myslí, že Vicootes znamená „zelenina“, zatiaľ čo Wa ch zod rea odkazuje na „morské tvory, ktoré by mohla zjesť veľryba“.

Má teda DALL-E 2 tajný jazyk? Pravdepodobne nie, nejde o „tajný jazyk“, skôr by sa dalo povedať, že má vlastný slovník, ale ani to nemôžeme vedieť s istotou. V tejto fáze je veľmi ťažké overiť akékoľvek tvrdenia o DALL-E 2 a iných veľkých modeloch AI, pretože k nim má prístup len hŕstka výskumníkov. Všetky publikované obrázky by sme mali brať s veľkou rezervou, pretože ide o „čerešničky“, ktoré vybrali ľudia spomedzi mnohých výstupných obrázkov generovaných AI. Čo sa teda deje? Jedna z možností je, že „hlúpe“ frázy súvisia so slovami z neanglických jazykov.

Napríklad slovo Apoploe, ktoré, ako sa zdá, súvisí s obrázkami vtákov, je podobný latinskému Apodidae, čo je názov čeľade vtáčích druhov. Toto by mohlo byť prijateľné vysvetlenie. Napríklad DALL-E 2 bol trénovaný na veľmi širokej škále údajov zozbieraných z internetu, ktoré obsahovali veľa neanglických slov. Podobné veci sa už stali: veľké modely umelej inteligencie zamerané na prirodzený jazyk sa akoby náhodou naučili písať počítačový kód bez zámerného školenia. Túto teóriu podporuje aj skutočnosť, že jazykové modely AI nečítajú text tak ako my ľudia.

Vstupný text si pred jeho spracovaním rozdelia na „tokeny“. Pritom rôzne prístupy k „tokenizácii“ majú rôzne výsledky. Vyzerá to ako intuitívny prístup, ale môžu vzniknúť problémy, ak rovnaké tokeny (slová) majú viac rozličných významov. Na druhej strane zaobchádzanie s každým slovom ako tokenom vytvára menší počet možných tokenov, ale každý z nich poskytuje oveľa menej zmysluplné informácie. DALL-E 2 používa prístup nazývaný kódovanie párov bajtov (byte-pair encoding – BPE). Kontrola reprezentácií BPE pre niektoré nezmyselné slová naznačuje, že by to mohol byť dôležitý faktor pri pochopení „tajného jazyka“.

No „tajný jazyk“ by mohol byť aj dôsledkom toho, že DALL-E 2 nedokáže povedať „neviem, o čom hovoríš“, a tak z daného vstupného textu vždy vygeneruje nejaký obrázok. Nič z toho však nevysvetľuje úplne to, čo sa deje. Zdá sa napríklad, že odstraňovanie jednotlivých znakov z nezmyselných slov poškodzuje generované obrázky veľmi špecifickými spôsobmi. A takisto sa zdá, že jednotlivé nezmyselné slová sa nemusia nevyhnutne skombinovať, aby sa vytvorili súvislé zložené obrázky.

Možno sa pýtate, či je toto všetko naozaj dôležité. Odpoveď je áno. „Tajný jazyk“ DALL-E je príkladom „kontradiktórneho útoku“ proti systému strojového učenia, čo je spôsob, ako prelomiť zamýšľané správanie systému zámerným výberom vstupov, ktoré AI nezvláda dobre. Jeden z dôvodov, prečo sú kontradiktórne útoky znepokojujúce, je to, že spochybňujú našu dôveru v model. Ak AI interpretuje nezmyselné slová nezamýšľaným spôsobom, môže interpretovať aj zmysluplné slová nezamýšľaným spôsobom.

Takisto vznikajú obavy o bezpečnosť. DALL-E 2 filtruje vstupný text, aby používateľom zabránil vo vytváraní škodlivého alebo urážlivého obsahu, ale „tajný jazyk“ z nezmyselných slov môže používateľom umožniť obísť tieto filtre. Nedávny výskum objavil kontradiktórne „spúšťacie frázy“ pre niektoré jazykové modely umelej inteligencie – krátke nezmyselné frázy, ako napríklad „zónové odpočúvanie fiennes“ ("zoning tapping fiennes"), ktoré môžu spoľahlivo spustiť modely, aby chrlili rasistický, škodlivý alebo neobjektívny obsah.

Napokon javy ako „tajný jazyk“ DALL-E 2 vyvolávajú obavy z interpretovateľnosti. Chceme, aby sa tieto modely správali tak, ako ľudia očakávajú, ale ak vidíme štruktúrovaný výstup v reakcii na nezmysel, sme zmätení. Kým tieto systémy nebudú širšie dostupné (najmä kým ich nebudú môcť používať používatelia zo širšej skupiny neanglických kultúrnych prostredí), nebudeme môcť skutočne vedieť, čo sa deje.

Zdroj: sciencealert.com.

Zobrazit Galériu

Redakcia

Všetky autorove články

3 komentáre

mne reakcia na: Vytvorila si umelá inteligencia vlastný „tajný jazyk“?

9.6.2022 14:06
mne sa zda ze aj za jednoduchymi algoritmi vidia ludia uz AI a inteligenciu

i ked budu zlozite stale je to daleko za clovekom v rozmyslani

programy ktore sa budu schopne uz ucit z predchadzajucich krokov
a vylepsovat same budu o nieco blizsie k AI

Reagovať

Vytvorila si... reakcia na: Vytvorila si umelá inteligencia vlastný „tajný jazyk“?

9.6.2022 11:06
... zdá sa, že to je ako s pokusmi v genetike - netušíme, do čoho vlastne šliapeme... ako sloni v porceláne.
Reagovať

RE: Vytvorila si... reakcia na: Vytvorila si...

9.6.2022 20:06
Ziadny slon v porcelane, to len ludia co tomu prd rozumeju pisu o AI clanky a neskutocne zmotavaju
Reagovať

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať