Nový model AI DeepSeek je extrémne výkonný a o polovicu lacnejší ako konkurencia

Výskum a vývoj

3.10.2025

Súboj technologických gigantov v oblasti umelej inteligencie dospel do bodu, keď sa zdalo, že jediná cesta vpred je budovanie stále väčších a nákladnejších modelov. Spoločnosť DeepSeek však nedávno predstavila svoj nový experimentálny model DeepSeek-V3.2-Exp, ktorý naznačuje strategický obrat od tohto trendu. Namiesto hrubej sily prichádza s inteligentnou efektivitou.

Kľúčovou inováciou tohto modelu je technológia nazvaná DeepSeek Sparse Attention (DSA). V zjednodušenom prirovnaní, zatiaľ čo staršie modely museli na pochopenie jednej strany prečítať každé slovo v knihe (hustá pozornosť), DSA si inteligentne vyberá a zameriava sa len na tie najdôležitejšie a najrelevantnejšie slová a vety (riedka pozornosť).

Táto zmena v architektúre prináša obrovské zvýšenie efektivity pri spracovaní dlhých textov bez toho, aby utrpela kvalita výstupu. Výsledok je pre trh s umelou inteligenciou prelomový. Podľa porovnávacích testov dosahuje V3.2-Exp výkon, ktorý je plne porovnateľný s jeho výkonným predchodcom V3.1-Terminus, pričom počet parametrov modelu zostal rovnaký na úrovni 671 miliárd.

Najdramatickejším dôsledkom tejto efektivity je však ekonomický šok: úspora nákladov pri niektorých úlohách môže dosiahnuť až 80 %. Tento krok signalizuje zásadný posun v odvetví umelej inteligencie. Inovácie sa už nesústreďujú len na zväčšovanie modelov, ale na zásadné architektonické vylepšenia, ktoré optimalizujú efektivitu.

Vďaka tomu sa špičková umelá inteligencia stáva udržateľnejšou, dostupnejšou a ekonomicky životaschopnejšou pre oveľa širší okruh aplikácií a vývojárov. Spoločnosť DeepSeek označila tento model za „experimentálny“ a za „medzistupeň“ k ďalšej generácii svojej architektúry.

Zároveň ho však uvoľnila ako open-source pod voľnou licenciou MIT na platformách ako Hugging Face. Označenie „experimentálny“ je v tomto kontexte strategickým ťahom, ktorý firme umožňuje získať spätnú väzbu od globálnej komunity vývojárov a zároveň agresívnou cenou okamžite konkurovať zavedeným hráčom ako OpenAI a Anthropic.

Existuje však aj druhá, menej oslnivá stránka. Hodnotenie predchádzajúcich modelov od DeepSeek (R1 a V3.1), ktoré uskutočnil americký Národný inštitút pre štandardy a technológie (NIST), odhalilo isté nedostatky. Tieto staršie modely boli podľa správy výrazne náchylnejšie na bezpečnostné útoky typu „jailbreaking“ (prelomenie bezpečnostných obmedzení) a „agent hijacking“ (prevzatie kontroly nad agentom).

Najzávažnejším zistením správy NIST bolo, že modely DeepSeek štyrikrát častejšie opakovali naratívy spojené s Komunistickou stranou Číny v porovnaní s americkými modelmi. Je dôležité zdôrazniť, že táto správa sa týka modelov, ktoré predchádzali verzii V3.2-Exp.

Napriek tomu tieto zistenia vnášajú do rozhodovania vývojárov novú, geopolitickú rovinu. Voľba jazykového modelu už teda nie je len technickým či ekonomickým rozhodnutím. Stáva sa aj strategickou otázkou, kde je potrebné zvážiť výhody nízkej ceny a vysokého výkonu voči potenciálnym bezpečnostným rizikám a ideologickému zafarbeniu.

Zdroj: cnbc.com.

^{Zdroj Foto: depositphotos.com.}