DeepSeek pridáva do svojho arzenálu AI generátor obrázkov

Technológie

4.2.2025

Čínsky startup DeepSeek nadviazal na spustenie nového modelu AI, ktorý otriasol celým odvetvím, a uviedol AI generátor obrázkov, o ktorom tvrdí, že poskytuje „výrazný pokrok v multimodálnom porozumení aj v schopnosti pochopiť inštrukcie na zmenu textu na obrázok“.

Nový model na vytváranie obrázkov sa nazýva Janus-Pro a jeho cieľom je konkurovať americkým rivalom, ako sú DALL-E 3 a Stable Diffusion. Spoločnosť tvrdí, že prekonáva konkurenciu v oblastiach, ako je kvalita obrazu a presnosť.

Vydanie Janus-Pro prišlo len niekoľko dní po uvedení modelu DeepSeek R1, ktorý sa postaral o rozruch svojimi bleskurýchlymi, veľmi logickými reakciami a tým, že bol vycvičený rýchlejšie a za zlomok nákladov amerických modelov.

Na stránke na stiahnutie spoločnosť DeepSeek uvádza: „Janus-Pro prekonáva predchádzajúci unifikovaný model a dosahuje alebo prevyšuje výkon modelov na jednotlivé úlohy. Jednoduchosť, vysoká flexibilita a efektívnosť modelu Janus-Pro z neho robia silného kandidáta na jednotný multimodálny model novej generácie.“

Model má veľkosť od 1 miliardy do 7 miliárd parametrov, čo je kľúčový faktor jeho schopnosti riešiť problémy. Spoločnosť nazýva Janus-Pro „novým autoregresným rámcom“, ktorý rieši predchádzajúce výzvy tým, že oddeľuje kroky analýzy a generovania obrazov, pričom na spracovanie všetkého sa stále používa jeden jednotný systém.

Janus-Pro je momentálne k dispozícii na stiahnutie na platforme vývojárov AI Hugging Face. Video youtubera s prezývkou EJacka Yao porovnáva výkon AI generátorov obrázkov ChatGPT 4o, Qwen 2.5 a Janus-Pro.