Čínsky DeepSeek prekvapil konkurenciu
Keď čínska spoločnosť DeepSeek 27. 1. 2025 uvoľnila svoj model R1, spôsobila tým výrazný prepad akcií firiem, ktoré sa etablovali ako lídri v oblasti AI, a to vrátane NVIDIE, ktorá týmto firmám dodáva hardvér na trénovanie modelov neurónových sietí.
{{BANNER|SIMPLE_BANNER_HOMEPAGE_2}}
Po preskúmaní možností tohto modelu v kontexte informácie, že bol vytrénovaný za necelých 6 miliónov dolárov, čo je zlomok ceny trénovania modelov od spoločností OpenAI, Meta (prevádzkovateľ Facebooku), Alphabet (materská spoločnosť Googlu) či Anthropic poklesla dôvera investorov ohľadne projektov AI týchto a ďalších firiem. Akcie spoločnosti NVIDIA klesli o 15 percent. Model R1 má open source architektúru. Je to paradox, pretože OpenAI má síce slovo „open“ v názve, ale architektúru ani ďalšie podrobnosti svojich modelov nezverejňuje.
V DeepSeek využili inovatívny postup trénovania, pri ktorom sa v jednotlivých tréningových epochách zamerali len na relevantné časti modelu. Model R1 bol trénovaný s vyu ...
Článok je uzamknutý
Prihlásiť pomocou členstva NEXTECH
Článok je uzamknutý
Pokračovanie článku patrí k prémiovému obsahu pre predplatiteľov. S digitálnym predplatným už od 10 € získate neobmedzený prístup k uzamknutému obsahu na celý rok. Objednať si ho môžete TU. Ak ho už máte prihláste sa TU
Prihlásiť pomocou členstva NEXTECH