Open source verzia modelu o1 od OpenAI stála menej ako 50 dolárov

Technológie

11.2.2025

Výskumníci v oblasti umelej inteligencie zo Stanfordovej a Washingtonskej univerzity dokázali podľa novej výskumnej práce, ktorá bola zverejnená na predtlačovom serveri ArXiv, vytrénovať „uvažujúci“ model umelej inteligencie za menej ako 50 dolárov v kreditoch na cloudové výpočty. Model známy ako s1 dosahuje v testoch merajúcich matematické a programovacie schopnosti podobné výsledky ako špičkové modely uvažovania, napríklad o1 od OpenAI a R1 od DeepSeek. Model s1 je k dispozícii na GitHube spolu s údajmi a kódom použitým na jeho trénovanie.

Tím stojaci za s1 uviedol, že začal s bežným základným modelom, potom ho doladil destiláciou, procesom na extrahovanie „uvažovacích“ schopností z iného modelu AI trénovaním na jeho odpovediach. Výskumníci uviedli, že s1 je destilovaný z Gemini 2.0 Flash Thinking Experimental, jedného z uvažovacích modelov Googlu. Je prekvapujúce, ako môže skupinka pár výskumníkov, ktorí nemajú k dispozícii milióny dolárov, inovovať v oblasti umelej inteligencie.

Model s1 však vyvoláva skutočné otázky týkajúce sa komoditizácie modelov AI. Ako je možné, že niekto dokáže v podstate za vreckové presne replikovať model za niekoľko miliónov dolárov? Je jasné, že veľké AI laboratóriá z toho nie sú šťastné. OpenAI obvinil DeepSeek z neoprávneného zberu údajov zo svojho API na účely destilácie modelu. Výskumníci za s1 sa snažili nájsť najjednoduchší prístup k dosiahnutiu výkonu uvažovania a „škálovania testovacieho času“ alebo umožnenia modelu AI viac premýšľať pred tým, ako odpovie na otázku.

Podľa dokumentu o s1 modely uvažovania možno destilovať s relatívne malým súborom údajov pomocou procesu nazývaného doladenie pod dohľadom (supervised fine-tuning – SFT), v ktorom je model AI výslovne inštruovaný, aby napodobňoval určité správanie v súbore údajov. SFT môže byť lacnejší ako rozsiahla metóda učenia posilňovaním (reinforcement learning), ktorú DeepSeek použil na výcvik svojho modelu R1, konkurenta OpenAI o1.

Google ponúka bezplatný prístup k Gemini 2.0 Flash Thinking Experimental, aj keď s dennými limitmi, prostredníctvom svojej platformy Google AI Studio. Podmienky spoločnosti Google však zakazujú reverzné inžinierstvo jej modelov na vývoj služieb. S1 je založený na malom hotovom modeli AI od čínskeho laboratória AI Qwen vlastneného spoločnosťou Alibaba, ktorý je k dispozícii na stiahnutie zadarmo.

Na trénovanie s1 výskumníci vytvorili súbor údajov pozostávajúci len z 1000 starostlivo vybraných otázok, spárovaných s odpoveďami na tieto otázky, ako aj s procesom „myslenia“, ktorý stojí za každou odpoveďou, z experimentálneho systému Gemini 2.0 Flash Thinking od spoločnosti Google. Po tréningu modelu, ktorý s použitím 16 GPU NVIDIA H100 trval menej ako 30 minút, dosiahol s1 podľa výskumníkov v niektorých benchmarkoch AI slušný výkon. Výskumníci použili šikovný trik, aby prinútili systém s1 dvakrát skontrolovať svoju prácu a predĺžiť čas jeho „premýšľania“. Povedali mu, aby počkal.

Pridanie slova „počkaj“ počas uvažovania s1 pomohlo modelu dospieť k trochu presnejším odpovediam. V roku 2025 plánujú Meta, Google a Microsoft investovať stovky miliárd dolárov do infraštruktúry umelej inteligencie, čo čiastočne pôjde na trénovanie modelov AI novej generácie. Takéto investície môžu byť stále potrebné na posunutie hranice inovácií v oblasti AI. Destilácia sa ukázala ako dobrá metóda na lacné replikovanie možností modelu AI, ale nevytvára nové modely AI, ktoré by boli oveľa lepšie ako tie, ktoré sú k dispozícii dnes.

Zdroj: techcrunch.com.

^{Zdroj Foto: depositphotos.com.}

1 komentár