SAMSUNG_092021 Advertisement SAMSUNG_092021 Advertisement SAMSUNG_092021 Advertisement

Môže sa umelá inteligencia naučiť „sedliackemu“ rozumu?

Výskum a vývoj
0

Pokročilé modely hlbokého učenia môžu vykonávať zložité úlohy, napríklad rozpoznávať ľudí a objekty na obrázkoch, niekedy dokonca lepšie ako ľudia. Majú však problém prekročiť vizuálnu stránku obrazov a vyvodzovať závery o tom, čo iní robia alebo chcú dosiahnuť.  Vyplniť túto medzeru sa snažia vedci z IBM, Massachusettskej technickej univerzity a Harvardovej univerzity sériou testov, ktoré umožnia vyhodnotiť, do akej miery sú modely umelej inteligencie schopné učiť sa podobne ako deti, a to pozorovaním sveta a nachádzaním zmyslu v dianí. Využili pri tom súbor údajov s názvom AGENT (Action, Goal, Efficiency, coNstraint, uTility).

V oblasti testovania zdravého rozumu a uvažovania v systémoch AI sa vykonalo už veľa práce. Veľká časť bola zameraná na porozumenie prirodzenému jazyku, no projekt AGENT sa sústreďuje na schopnosti uvažovania, ktoré si ľudia osvoja predtým, ako sa naučia hovoriť. Ako deti sa učíme rozpoznávať rozdiel medzi objektmi a agentmi pozorovaním nášho prostredia. Pri sledovaní vývoja udalostí rozvíjame intuitívne psychologické schopnosti, predpovedáme ciele ostatných ľudí pozorovaním ich činov.

Myšlienkou testu AGENT je zhodnotiť, ako dobre môžu systémy umelej inteligencie napodobňovať túto základnú zručnosť a či môžu to, čo sa naučia, zovšeobecniť na nové situácie. Sekvencie pre test AGENT boli vytvorené v ThreeDWorld, virtuálnom 3D prostredí navrhnutom na výcvik agentov AI. Test AGENT sa uskutočňuje v dvoch fázach. Najprv sa umelej inteligencii prezentuje jedna alebo dve sekvencie, ktoré zobrazujú správanie agenta. Tieto príklady by mali umelú inteligenciu oboznámiť s preferenciami virtuálneho agenta.

Môže si napríklad vždy vybrať jeden typ objektu bez ohľadu na prekážky, ktoré mu stoja v ceste, alebo si môže vybrať najbližší a najdostupnejší objekt bez ohľadu na jeho typ. Potom je umelej inteligencii predstavená testovacia sekvencia, aby určila, či agent koná očakávaným alebo prekvapivým spôsobom. Testy siahajú od jednoduchého správania (agent uprednostňuje jeden typ objektu bez ohľadu na prostredie) až po komplikovanejšie výzvy (agent odhaduje náklady a výnosy a zvažuje náročnosť dosiahnutia úspechu oproti odmene, ktorú za to dostane).

Vedci najprv vyskúšali testy s ľudskými dobrovoľníkmi. Zistili, že ľudia môžu v priemere 91 percent problémov vyriešiť pozorovaním sekvencií na oboznámenie a posúdením testovacích príkladov. Ľudia teda používajú svoje predchádzajúce znalosti o svete a správaní ľudí/zvierat, aby pochopili, ako sa agenti rozhodujú. Pre umelú inteligenciu výskumníci zámerne obmedzili veľkosť dátových súborov, aby zabránili neinteligentným skratkám pri riešení problémov.

SWAN_042021

Na veľmi veľkej množine údajov sa model strojového učenia môže naučiť robiť správne predpovede bez získania základných znalostí o správaní agenta. Vytvorený obmedzený súbor údajov nefungoval na učenie od nuly. Na absolvovanie testov bolo potrebné získať ďalšie znalosti, napr. z výcviku na iných údajoch. Výskumníci vyskúšali test AGENT na dvoch základných modeloch AI. Prvý z nich bol generatívny model BIPaCK (Bayesian Inverse Planning and Core Knowledge), ktorý integruje simuláciu a plánovanie fyziky.

Ten používa úplné informácie poskytnuté súborom údajov a vkladá ich do svojho fyzikálneho a plánovacieho enginu na predpovedanie trajektórie agenta. Ukázalo sa, že BIPaCK je schopný fungovať na rovnakej úrovni alebo dokonca lepšie ako ľudia, keď má k dispozícii úplné informácie o scéne.

Druhý testovaný model s kódovým označením ToMnet-G je rozšírenou verziou modelu ToMnet (Theory of Mind Neural Network), ktorý navrhli vedci z DeepMind v roku 2018. Na kódovanie stavu scén vrátane predmetov, prekážok a polohy agenta používa grafické neurónové siete. Model využíva reprezentácie, ktoré extrahuje z oboznamovacích videí, na predpovedanie správania agenta v testovacích videách a hodnotenie, či je očakávané alebo prekvapivé. Výhoda ToMnet-G je v tom, že nevyžaduje vopred pripravené znalosti ako BIPaCK.

Naučí sa všetko z videí a predchádzajúceho výcviku na iných súboroch údajov. Na druhej strane ToMnet-G sa často naučí nesprávne reprezentácie a nemôže zovšeobecniť svoje znalosti na nové scenáre. Dosahuje však sľubné výsledky, keď je vyškolený a testovaný na podobných scenároch. Ľudia sú schopní veľmi rýchlo analyzovať zložité scény, kde je súčasne zahrnutých mnoho aspektov zdravého rozumu týkajúcich sa fyziky, psychológie, jazyka a pod., no modely AI sú ešte ďaleko od toho, aby dokázali robiť niečo podobné.

Vedci sa domnievajú, že zahrnutie zdravého rozumu a úsudkov by vyriešilo mnohé z problémov, s ktorými sa súčasné systémy AI stretávajú, napríklad potrebu veľkého objemu tréningových dát, ich boj s kauzalitou a slabiny pri riešení nových situácií. Riešenie testu AGENT môže byť malý, ale dôležitý krok k vytvoreniu agentov AI, ktorí si poradia v nepredvídateľnom svete ľudí.

Zdroj: venturebeat.com.

Zobrazit Galériu

Redakcia

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať