Čínsky DeepSeek otriasa trhom AI: Výkon ako GPT-5, ale s radikálne nižšími nákladmi

Výskum a vývoj

4.12.2025

KĽÚČOVÉ ZISTENIA:

Model DeepSeek-V3.2-Speciale dosahuje výkon porovnateľný s GPT-5 a Gemini 3.0 Pro.
Architektúra Sparse Attention znižuje náklady na inferenciu v dlhom kontexte až o 70 percent.
Modely so 685 miliardami parametrov sú vydané pod otvorenou MIT licenciou.

Vstup čínskej technologickej firmy DeepSeek na globálnu scénu s dvoma novými masívnymi jazykovými modelmi, DeepSeek-V3.2 a jeho vysokovýkonným variantom DeepSeek-V3.2-Speciale, predstavuje zásadný zlom v celosvetovom preteku umelej inteligencie.

Spoločnosť, ktorá sídli v Hangzhou, tvrdí, že ich najnovšie verzie dosahujú výkon porovnateľný s vlajkovými loďami amerických gigantov, ako sú OpenAI GPT-5 a Google Gemini 3.0 Pro. Tieto modely sú nielen silné, ale vďaka architektonickej inovácii aj radikálne efektívnejšie z hľadiska nákladov.

Oba modely disponujú 685 miliardami parametrov, čo ich zaraďuje do kategórie najväčších modelov na svete, a podporujú rozsiahle kontextové okno 128,000 tokenov. Ich vydanie pod otvorenou licenciou MIT s plne dostupnými váhami, má strategický význam, pretože priamo ohrozuje obchodný model spoločností, ktoré účtujú prémiové ceny za uzavreté API prístupy.

Práve sprístupnenie takto výkonnej technológie širokej verejnosti demokratizuje prístup k špičkovým AI riešeniam. Kľúčovou technickou inováciou, ktorá stojí za úspechom a nízkymi nákladmi modelov, je mechanizmus DeepSeek Sparse Attention, alebo DSA.

DSA mení tradičnú kvadratickú komplexnosť štandardných modelov na takmer lineárnu komplexnosť, čo je kritické pre efektívne spracovanie extrémne dlhých sekvencií. Použitie tohto riedkeho mechanizmu, ktorý napodobňuje spôsob, akým ľudia skenujú dokumenty a zameriavajú sa len na kľúčové informácie, prináša obrovské výpočtové úspory.

Vďaka tejto zmene je možné znížiť náklady na inferenciu, čiže na spustenie modelu pri spracovaní dlhých kontextových úloh, takmer o polovicu. Podľa technickej správy sa náklady na dekódovanie sekvencie s 128,000 tokenmi znížili až o 70 percent.

Náklady na milión dekódovaných tokenov klesli z 2.40 USD pri predchádzajúcom modeli V3.1-Terminus na iba 0.70 USD.

Táto drastická redukcia nákladov zásadne mení ekonomickú škálovateľnosť pre komplexné agentné systémy, ktoré vyžadujú dlhý kontext a rozsiahle spracovanie dát. Znižuje bariéru pre inovátorov a umožňuje startupom, univerzitám a iným subjektom budovať produkty a služby, ktoré boli predtým doménou len dobre financovaných korporácií.

DeepSeek-V3.2-Speciale, navrhnutý výhradne pre hlboké uvažovanie, sa ukázal ako extrémne výkonný na rozsiahlych testoch zameraných na logiku, kódovanie a matematiku. Vo vysoko náročnej matematickej súťaži AIME 2025 dosiahol špeciálny variant úspešnosť 96.0 percent, čím mierne prekonal výsledok GPT-5-High 94.6 percent a Gemini-3.0-Pro 95.0 percent.

V podobne prestížnom turnaji Harvard-MIT Mathematics Tournament, HMMT, dosiahol DeepSeek-V3.2-Speciale 99.2 percent, čo bolo viac ako 97.5 percent u modelu Gemini.

Tieto výsledky, ako aj výkon porovnateľný so zlatou medailou na Medzinárodnej matematickej olympiáde a Medzinárodnej olympiáde v informatike, boli dosiahnuté bez prístupu na internet a za prísneho dodržania súťažných pravidiel. V kódovacích úlohách si model taktiež viedol vynikajúco.

Na benchmarku Terminal Bench 2.0, ktorý testuje komplexné pracovné postupy kódovania, dosiahol 46.4 percent, čím výrazne prekonal GPT-5-High s 35.2 percentami. DeepSeek-V3.2 slúži ako asistent pre každodenné uvažovanie a integruje schopnosť „myslieť v používaní nástrojov“, čo mu umožňuje vykonávať kód, manipulovať so súbormi a vyhľadávať na webe.

Hoci má model určité obmedzenia, napríklad v šírke „svetových vedomostí“ zaostáva za poprednými proprietárnymi modelmi. Celý balík technických inovácií a otvorená dostupnosť potvrdzujú, že DeepSeek skutočne mení dynamiku konkurenčného prostredia.

PREČO JE TO DÔLEŽITÉ: DeepSeek dokázal, že otvorený model môže konkurovať proprietárnej špičke, pričom jeho Sparse Attention radikálne znižuje náklady na pokročilé aplikácie AI, čím mení ekonomiku vývoja agentných systémov.

^{Zdroj: venturebeat.com foto: depositphotos.com}