S_022025_S25 Advertisement S_022025_S25 Advertisement>						
												</a>
			
<script>
	$(function(){
		$.get( S_022025_S25 Advertisement

Základnú verziu DeepSeek zreplikovali iba za 30 dolárov

Výskum a vývoj
0

Skupina výskumníkov z Kalifornskej univerzity v Berkeley tvrdí, že sa im podarilo zreplikovať základnú technológiu čínskej umelej inteligencie DeepSeek len za 30 dolárov. Tím replikoval schopnosti učenia sa posilňovaním (reinforcement learning) DeepSeek R1-Zero pomocou malého jazykového modelu iba s 3 miliardami parametrov. Napriek svojej relatívne skromnej veľkosti AI preukázala samooverovacie a vyhľadávacie schopnosti, čo sú kľúčové funkcie, ktoré jej umožňujú iteratívne zdokonaľovať vlastné odpovede.

Na otestovanie svojej rekonštrukcie DeepSeek použil tím z Berkeley hru Countdown, číselnú hádanku, v ktorej musia hráči použiť aritmetiku na dosiahnutie cieľového čísla. Spočiatku model vytváral náhodné odhady, ale prostredníctvom posilňovacieho učenia vyvinul techniky na samoopravu a iteračné riešenie problémov. Nakoniec sa naučil svoje odpovede revidovať, kým nedospel k správnemu riešeniu.

Obzvlášť pôsobivé je, že celá replikácia ich stála len 30 dolárov. Výskumníci testovali viacero veľkostí modelov, počnúc modelom s 500 miliónmi parametrov, ktorý mohol len hádať. Po zväčšení na 1,5 miliardy parametrov začala rekonštrukcia DeepSeek zahŕňať revízne techniky. Modely medzi 3 a 7 miliardami parametrov ukázali výrazné zlepšenie, riešili problémy v menšom počte krokov s vyššou presnosťou.

K PREDPLATNÉMU DOSTANEŠ DARČEKY!

Zatiaľ čo OpenAI účtuje 15 USD za milión tokenov prostredníctvom svojho API, DeepSeek ponúka oveľa nižšie náklady vo výške 0,55 USD za milión tokenov. Zistenia tímu z Berkeley naznačujú, že modely AI s veľkými schopnosťami možno vyvinúť za zlomok nákladov, ktoré v súčasnosti investujú popredné spoločnosti zaoberajúce sa AI.

Výskumník v oblasti umelej inteligencie Nathan Lambert sa však vyjadril, že uvádzané náklady spoločnosti DeepSeek na výcvik jej modelu so 671 miliardami parametrov vo výške 5 miliónov dolárov neposkytujú úplný obraz. Lambert odhaduje, že ročné prevádzkové náklady na umelú inteligenciu DeepSeek by sa v skutočnosti mohli pohybovať od 500 miliónov do viac ako 1 miliardy dolárov, pričom sa berie do úvahy všetko od infraštruktúry cez spotrebu energie až po náklady na výskumný personál.  

Spoločnosť OpenAI tvrdí, že existujú dôkazy o tom, že DeepSeek bol vycvičený pomocou ChatGPT, čo by mohlo čiastočne vysvetliť nízke náklady. Napriek tomu práca tímu z Berkeley dokazuje, že špičkový výcvik v oblasti posilňovacieho učenia možno dosiahnuť bez enormných rozpočtov, ktoré naň v súčasnosti vyčleňujú priemyselné giganty ako OpenAI, Google a Microsoft.

Zdroj: bgr.com.

Zdroj Foto: https://depositphotos.com.

Redakcia

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať