
Fraktály pomôžu umelej inteligencii lepšie rozpoznávať fotografie
Veľké súbory údajov, ako je ImageNet, pomáhajú zdokonaľovať počítačové videnie. Rozpoznávanie obrázkov sa trénuje pomocou rozsiahlych databáz, ktoré obsahujú milióny fotografií, ale tie je ťažké zhotoviť a zabrániť pri tom výskytu zaujatosti. Alternatívou by mohli byť dátové súbory generované počítačom. Vedci v Japonsku teraz preukázali, že systémy umelej inteligencie (UI) sa môžu učiť rozpoznávať každodenné predmety tak, že budú namiesto veľkých databáz trénované na fraktáloch generovaných počítačom. Automatické generovanie tréningových údajov je vzrušujúci trend v oblasti strojového učenia.
Použitím nekonečného množstva syntetických obrázkov namiesto fotografií z internetu sa vyhnete mnohým problémom, ktoré sa vyskytujú pri ručne vytvorených súboroch údajov. Modely UI sa najprv predtrénujú na niektoré základné zručnosti a potom sa môžu prispôsobiť podľa existujúcich potrieb. Napríklad systém na diagnostiku lekárskych skenov by sa mohol najskôr naučiť identifikovať základné vizuálne prvky, ako sú tvar a obrys, a to tak, že bude predcvičený na databáze predmetov každodennej potreby, napríklad ImageNet, ktorá obsahuje viac ako 14 miliónov fotografií.
Potom sa bude dolaďovať na menšej databáze lekárskych snímok, kým nerozpozná jemné príznaky choroby. No ručne zostavený súbor dát si vyžaduje veľa času a úsilia, navyše môže obsahovať aj sexistické alebo rasistické označenia, ktoré skresľujú model. Tieto predsudky sa môžu do modelu vkradnúť aj pri predtrénovaní. Fraktály nájdete vo všetkom – od stromov a kvetov až po mraky a vlny. Japonskí vedci premýšľali, či možno tieto vzory použiť pri výcviku automatizovaného systému na osvojenie základov rozpoznávania obrazu namiesto použitia fotografií skutočných predmetov.
Výskumníci preto vytvorili FractalDB, nekonečné množstvo fraktálov generovaných počítačom. Niektoré vyzerajú ako listy, iné ako snehové vločky alebo ulity slimákov. Každá skupina podobných vzorov bola automaticky označená štítkom. Potom sa FractalDB využil na predtrénovanie konvolučnej neurónovej siete (typ modelu hlbokého učenia bežne používaný v systémoch rozpoznávania obrázkov).
Zistilo sa, že sieť fungovala takmer rovnako dobre ako modely trénované na najmodernejších súboroch údajov. Niektorí odborníci sa domnievajú, že abstraktné vzory môžu zmiasť systémy rozpoznávania obrázkov. No japonskí vedci si myslia, že po zlepšení ich prístupu by mohli súbory údajov generovaných počítačom, ako je FractalDB, nahradiť existujúce databázy.
Zdroj: technologyreview.com.