SAMSUNG_112022 Advertisement SAMSUNG_112022 Advertisement SAMSUNG_112022 Advertisement

Nové grafické karty NVIDIA GeForce RTX 40

0

Informácie o tom, že nová produktová rodina grafických kariet bude komerčne uvedená na jeseň 2022, presakovali už niekoľko mesiacov, takže veľa hráčov aj tvorcov odkladalo nákup novej grafickej karty, aby si potom buď kúpili horúcu novinku, alebo kalkulovali s prípadným zlacnením najvýkonnejších grafických kariet súčasnej generácie, teda GeForce RTX3090 Ti, prípadne 3080 Ti.

SAMSUNG_112022_M Advertisement

Prvé informácie z predstavenia novej produktovej rodiny ukazujú, že čakanie sa vyplatilo. Priaznivci hier, ale aj grafici, dizajnéri, editori videa, konštruktéri a ďalšie povolania budú mať pri práci k dispozícii podstatne vyšší grafický výkon. Produktová rodina NVIDIA GeForce RTX 40 je založená na novej architektúre NVIDIA Ada Lovelace, ktorá prináša veľký generačný skok vo výkone a efektivite. Navyše architektonické zlepšenia tesne späté s výrobným procesom TSMC 4N umožňujú dosiahnuť až dvojnásobnú energetickú účinnosť.


NVIDIA DLSS 3 – zvýšenie výkonu v hrách

DLSS 3

Čoraz viac hráčov aj tvorcov využíva monitory so 4K rozlíšením, ale generovanie obrazu trojrozmerného virtuálneho sveta hernej scény v takomto rozlíšení v reálnom čase pri vysokých obnovovacích frekvenciách je pre grafický čip obrovská výzva.

Najnovšia tretia generácia Deep Learning Super Sampling DLSS využíva pri vykresľovaní grafiky v hrách aj kreatívnych apliká­ciách neurónové siete. Dokáže oveľa rýchlejšie generovať obraz, čo ocenia predovšetkým hráči. Inak povedané, DLSS 3 dokáže v hrách prekonať obmedzenia dané výkonom CPU tým, že umožňuje GPU generovať obraz nezávisle. Ada Optical Flow Accelerator s dvakrát vyšším výkonom poskytuje DLSS 3 možnosť predvídať pohyb v scéne, čo umožňuje neurónovej sieti zvýšiť snímkovú frekvenciu pri zachovaní kvality obrazu. Táto technológia dokáže generovať úplne nové snímky, nie iba jednotlivé pixely, čo prináša významné zvýšenie výkonu. Ada Optical Flow Accelerator analyzuje dve sekvenčné snímky v hre a vypočítava dáta pohybových vektorov pre objekty a prvky, ktoré sa v snímke objavujú, ale nie sú modelované tradičnými pohybovými vektormi herného enginu. To výrazne znižuje vizuálne anomálie pri vykresľovaní niektorých prvkov, ako sú napr. častice, odrazy, tiene alebo osvetlenie, pomocou AI. Dvojica snímok z hry v superrozlíšení spolu s pohybovými vektormi enginu aj optického toku sú potom zadané do konvolučnej neurónovej siete, ktorá analyzuje dáta a automaticky generuje ďalšiu snímku pre každý frame vykreslený priamo v hre. Kombinácia snímok generovaných DLSS so snímkami pre DLSS v superrozlíšení umožňuje systému DLSS 3 rekonštruovať sedem osmín zobrazených pixelov pomocou AI. Vďaka tomu možno počet FPS zvýšiť až štyrikrát oproti vykresľovaniu bez DLSS. Integrácia DLSS 3 zahŕňa aj technológiu NVIDIA Reflex, ktorá synchronizuje prácu GPU a CPU, čím zaisťuje optimálnu reakciu a nízku latenciu systému. Pretože ku generovaniu snímok pomocou DLSS dochádza v rámci postprocesu na GPU, možno snímkovú frekvenciu zvýšiť aj v prípade, že hru limituje výkon CPU. Ide napr. o hry s náročnou fyzikou alebo rozsiahlymi svetmi. DLSS 3 tu umožní GPU GeForce radu RTX 40 vykresľovať hru až s dvojnásobnou snímkovou frekvenciou, než zvládajú CPU.

Princíp fungovania DLSS 3

Z DLSS 3 budú profitovať aj najobľúbenejšie herné enginy, ako sú Unity a Unreal Engine, takže už onedlho bude podporovať viac než 35 hier a aplikácií.

Nová produktová rodina prináša aj ďalšie významné technologické inovácie. Streamingové multiprocesory majú výkon shaderov až 83 teraflops, čo je dvakrát viac ako pri predchádzajúcej generácii. RT jadrá tretej generácie majú výkon až 191 efektívnych teraflops pre ray tracing, čo je v porovnaní s produktovou rodinou RTX 30 až 2,8-násobok. Päťkrát sa zvýšil výkon jadier Tensor štvrtej generácie s výkonom až 1,32 Tensor petaflops. Funkcia Shader Execution Reordering (SER) zlepšuje efektivitu GPU tým, že počas chodu mení plánovanie záťaže pri tieňovaní, aby boli lepšie využité zdroje GPU. Zvyšuje výkon ray tracingu až trikrát a snímkovú frekvenciu v hrách až o 25 %.

Pri práci s videom a živom streamovaní prinášajú nové GPU nielen vyšší výkon, ale aj integráciu nových duálnych enkodérov AV1 ôsmej generácie. Duálne enkodéry NVIDIA (NVENC) skracujú čas exportu až o polovicu a sú vybavené podporou AV1. Kódovanie NVENC AV1 bude dostupné v nástrojoch ako OBS, Blackmagic Design DaVinci Resolve, Discord a ďalších.

Ray tracing

Jedna z najnáročnejších úloh grafickej karty je vykresľovanie scén s fyzikálne správnym osvetlením pomocou ray tracingu v reálnom čase. Geometrická zložitosť prostredia a objektov sa zároveň neustále zvyšuje, pretože 3D hry a grafika sa snažia poskytovať čo najpresnejší odraz skutočného sveta. Dosiahnutie fyzikálne presného vyobrazenia grafiky vyžaduje obrovský výpočtový výkon. Moderné hry s technológiou ray tracingu, ako je Cyberpunk 2077, vykonávajú pre každý pixel viac ako 600 výpočtov len na určenie osvetlenia, čo je 16-násobný nárast oproti prvým hrám využívajúcim túto technológiu spred štyroch rokov. Nové RT jadrá tretej generácie poskytujú dvakrát rýchlejšie testovanie priesečníkov lúčov s trojuholníkmi a obsahujú dve nové dôležité hardvérové jednotky. Opacity Micromap Engine dvojnásobne zrýchľuje ray tracing geometrie alfa testov a Micro-Mesh Engine za chodu generuje mikrosiete a vytvára tak ďalšiu geometriu. Micro-Mesh Engine poskytuje výhody zložitejšej geometrie bez tradičných nárokov na výkon a uloženie komplexných geometrií.

GeForce RTX 4090 a 4080

V rámci novej produktovej rodiny budú na trh uvádzané najskôr najvyššie modely, teda vlajková loď RTX 4090 až so štvornásobným výkonom oproti svojmu predchodcovi a aj RTX 4080. RTX 4090 je podľa tvrdenia Nvidie najrýchlejšia herná GPU na svete, ponúkajúca nielen extrémny výkon, ale aj veľmi účinné a tiché chladenie. V hrách s plným ray tracingom je RTX 4090 pri zapnutí DLSS 3 až 4-krát rýchlejší v porovnaní s RTX 3090 Ti predchádzajúcej generácie s DLSS 2. Je takisto až dvakrát rýchlejší v súčasných hrách pri zachovaní rovnakej spotreby 450 W. Grafický čip disponuje 76 miliardami tranzistorov, 16 384 jadrami CUDA a 24 GB vysokorýchlostnej pamäte Micron GDDR6X. Pri hraní hier v 4K rozlíšení trvalo poskytuje viac ako 100 snímok za sekundu. 


Verné zobrazovanie tieňov a odrazov svetla na lesklých plochách 

Cenovo dostupnejší model RTX 4080 príde na trh v dvoch konfiguráciách. RTX 4080 16 GB má 9728 jadier CUDA a 16 GB vysokorýchlostnej pamäte Micron GDDR6X a vďaka DLSS 3 bude v aktuálnych hrách dvakrát rýchlejší ako GeForce RTX 3080 Ti a prekoná aj GeForce RTX 3090 Ti pri nižšej spotrebe. RTX 4080 12 GB má 7680 jadier CUDA, 12 GB pamäte Micron GDDR6X a DLSS 3 a vlajkovú loď GPU predchádzajúcej generácie RTX 3090 Ti prekoná vo všetkých ohľadoch.

Na trhu budú k dispozícii jednak karty so základnými, ako aj z výroby zvýšenými taktovacími frekvenciami od popredných dodávateľov, ako sú ASUS, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY a Zotac, a takisto karty vyrábané priamo spoločnosťou NVIDIA v limitovaných edíciách Founders Edition pre fanúšikov, ktorí preferujú dizajn NVIDIA.  

 

Zobrazit Galériu

Ľuboslav Lacko

Všetky autorove články

Pridať komentár

Mohlo by vás zaujímať

Mohlo by vás zaujímať