SAMSUNG_0126_W8 Advertisement SAMSUNG_0126_W8 Advertisement SAMSUNG_0126_W8 Advertisement

Čínska AI model DeepSeek zamotal hlavu americkej konkurencii OpenAI a Google

Výskum a vývoj
0

Spoločnosť DeepSeek, pomerne neznámy čínsky startup v oblasti umelej inteligencie, vyvolala v Silicon Valley šok svojím nedávnym vydaním špičkových modelov umelej inteligencie. Tieto modely, vyvinuté s pozoruhodnou účinnosťou a ponúkané ako open source zdroje, spochybňujú dominanciu zavedených hráčov, ako sú OpenAI, Google a Meta.

DeepSeek, ktorý v máji 2023 založil Liang Wenfeng, významná osobnosť v odvetví hedžových fondov aj AI, funguje nezávisle, ale je financovaný výlučne High-Flyer, kvantitatívnym hedžovým fondom, ktorý takisto založil Wenfeng. Tím DeepSeek pozostáva predovšetkým z mladých, talentovaných absolventov špičkových čínskych univerzít, ktorí podporujú kultúru inovácií. Je pozoruhodné, že náborové postupy spoločnosti uprednostňujú technické schopnosti pred tradičnými pracovnými skúsenosťami, výsledkom čoho je tím vysoko kvalifikovaných jednotlivcov s novým pohľadom na vývoj AI.

Cesta spoločnosti DeepSeek sa začala v novembri 2023 vydaním aplikácie DeepSeek Coder, modelu s otvoreným zdrojovým kódom určeného na programovacie úlohy. Po ňom nasledoval DeepSeek LLM, model s 67 miliardami parametrov, ktorého cieľom je konkurovať iným veľkým jazykovým modelom. DeepSeek-V2, uvedený na trh v máji 2024, si získal značnú pozornosť pre svoj vysoký výkon a nízke náklady. Jeho cenová stratégia prinútila ďalšie veľké čínske technologické giganty, ako sú ByteDance, Tencent, Baidu a Alibaba, znížiť ceny svojich modelov AI, aby zostali konkurencieschopnými.

DeepSeek-V2 bol nahradený modelom DeepSeek-Coder-V2, čo je pokročilejší model s 236 miliardami parametrov, zameraný na riešenie zložitých programovacích úloh. Tento model podporuje veľkú dĺžku kontextu až do 128K tokenov a je k dispozícii prostredníctvom nákladovo efektívneho API, pričom cena je stanovená na 0,14 USD za milión vstupných tokenov a 0,28 USD za milión výstupných tokenov.

K PREDPLATNÉMU DOSTANEŠ DARČEK!

Najnovšie modely spoločnosti, DeepSeek-V3 a DeepSeek-R1, ďalej upevňujú jej vplyv na oblasť umelej inteligencie. DeepSeek-V3 obsahuje 671 miliárd parametrov, pričom vykazuje vysoký výkon na rôznych benchmarkoch a zároveň potrebuje menej zdrojov ako podobné modely. DeepSeek-R1, uvedený na trh v januári 2025, kladie dôraz na úlohy uvažovania a predvádzaním pokročilých funkcií konkuruje modelu o1 spoločnosti OpenAI.

DeepSeek má aj tzv. destilované modely, známe ako DeepSeek-R1-Distill, ktoré vychádzajú z populárnych modelov open-weight a sú doladené na syntetických údajoch z R1. Tieto modely ponúkajú rôzne úrovne výkonu, ktoré vyhovujú rôznym výpočtovým potrebám.

Napriek rýchlemu úspechu sa DeepSeek zameriava najmä na výskum a nemá bezprostredné plány na rozsiahlu komercializáciu. Spoločnosť ťaží zo strategických partnerstiev, najmä so spoločnosťou AMD, ktorá poskytuje vysokovýkonný výpočtový hardvér a softvér na vývoj modelov. Táto spolupráca umožňuje spoločnosti DeepSeek zvýšiť výkon a škálovateľnosť.

Úspechy spoločnosti DeepSeek vyplývajú z kľúčových inovácií, medzi ktoré patria:

1. Učenie s posilňovaním (Reinforcement Learning – RL): Táto metóda umožňuje modelom učiť sa na základe interakcií, a nie výlučne na základe dolaďovania pod dohľadom. Tento prístup zlepšil schopnosti uvažovania DeepSeek-R1.

2. Architektúra Mixture-of-Experts (MoE): Táto architektúra umožňuje aktivovať pre každú úlohu len špecifické parametre, čím sa zvyšuje efektívnosť a výrazne znižujú náklady.

3. Multi-Head Latent Attention (MLA): Táto funkcia pomáha modelu efektívnejšie spracovať údaje tým, že mu umožňuje zamerať sa na viacero aspektov vstupných údajov súčasne.

4. Techniky destilácie: Tieto techniky umožňujú väčším modelom odovzdávať svoje znalosti menším, efektívnejším modelom, čím sa výkonná umelá inteligencia sprístupňuje širšiemu publiku.

012026 Q7B7 Run Advertisement

Nákladovo efektívne stratégie spoločnosti DeepSeek sú zvýraznené zníženými nákladmi na školenie a dostupnými cenami API, vďaka čomu sú nástroje AI dostupné aj menším podnikom. Prístup modelu open source navyše minimalizuje finančné prekážky a podporuje širšie využívanie pokročilých technológií AI.

DeepSeek vytvoril významnú konkurenciu pre zavedené spoločnosti, ako sú OpenAI a Google, a podnietil ich k prehodnoteniu svojich cien a ponúk. Záväzok spoločnosti k open source modelom demokratizuje prístup k nástrojom AI, čím podporuje inovácie v rôznych skupinách používateľov.

Zdroj: forbes.com.

Zdroj Foto: depositphotos.com.

Redakcia

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať