Az NVIDIA köztudottan kétévente kiad egy új generációs grafikus kártya architektúrát. 2018-ban kiadta a Turing chipet a GTX 16-sorozatú és az RTX 20-as GPU-khoz. Aztán 2020-ban bemutatta az Ampere chipeket az RTX 3000 GPU-hoz.
És ahogy az várható volt, az NVIDIA GPU technológiai konferencián 2022 szeptemberében Jensen, az NVIDIA vezérigazgatója Huang végre bejelentette az Ada Lovelace mikroarchitektúrát, amely az RTX 3. generációját fogja működtetni GPU-k.
Tehát milyen fejlesztéseket hoz az Ada Lovelace mikroarchitektúra az RTX 4000 GPU-ban?
1. Egy teljesen új folyamatcsomópont
Az Ada Lovelace mikroarchitektúrája a TSMC 4 nm-es N4 technológiáján alapul, így fele olyan kicsi, mint a Samsung 8 nm-es eljárásán alapuló előző generációs Ampere chip. Ez kisebb nm, amelyet a csomóponti folyamat javulása hozott lehetővé teszi az RTX 4000 sorozat számára, hogy hatékonyabban biztosítsa a teljesítményt.
Ez azt jelenti, hogy még az NVIDIA által a jövőben kiadott középkategóriás változatok is versenyezhetnek az olyan csúcskategóriás 30-as sorozatú chipekkel, mint a 3090 Ti.
2. Shader végrehajtás átrendezése
Párhuzamos felépítése miatt a GPU kiválóan alkalmas arra, hogy több processzormagot használjon ugyanazon feladat kezelésére. A sugárkövetés azonban teljesen más, mint a jelenetek megjelenítése. Ennek az az oka, hogy a fénysugarak mindenütt visszaverődnek, és különböző számításokat igényelnek minden egyes felületre, amelyet elér, és minden irányban, ahol elhalad. Ez azt jelenti, hogy a GPU-k kevésbé hatékonyak, ha sok különböző shadert dolgoznak fel.
De a Shader Execution Reordering (SER) segítségével a Lovelace chip átütemezheti a munkaterhelését, biztosítva, hogy a hasonló shadereket együtt dolgozzák fel. Ez lehetővé teszi a streaming multiprocesszorok hatékonyabb működését, mivel egyszerre dolgoznak ugyanazon az adatokon.
3. DLSS 3.0
Az RTX erőforrás-igényes feladat, különösen, ha nagyobb felbontásokkal, például 4K-val vagy magasabb felbontással dolgozik. Ezért fejlesztette ki az NVIDIA a DLSS-t (Mélytanulási szuper mintavétel). A DLSS technológia mesterséges intelligencia segítségével előrejelzi a következő pixelt, segítve ezzel a GPU munkaterhelésének csökkentését.
Az Ada Lovelace architektúra DLSS 3.0-jával azonban az NVIDIA a pixelekről a képkockákra bővíti az előrejelzést. Ez lehetővé teszi a GPU számára, hogy megjósolja a következő képkockát, anélkül, hogy megnézné a még renderelendő képadatokat. Ezzel mind a GPU-t, mind a CPU-t igénylő játékok teljesítményét javítja, ami Huang szerint akár négyszer jobb, mint a brute force renderelés.
4. Tenzor magok
Az NVIDIA igyekszik nagyot tenni a mesterséges intelligencia számítási területén, és ez a legújabb generációs chipen is meglátszik. Az Ada Lovelace mikroarchitektúra a 4. generációt használja Tenzor magok1400 Tensor TFLOP leadására képes – több mint négyszer gyorsabb, mint a 3090 Ti, amelynek mindössze 320 Tensor TFLOP-ja volt.
Valószínűleg ez az új generációs Tensor Cores az oka annak, hogy a DLSS 3.0 sokkal jobban teljesít, mint a korábbi iterációk. Ez lehet az is, hogy a viszonylag alacsonyabb modellű 4000-es sorozatú chipek jobban teljesítenek, mint a 3000-es sorozatú GPU-k felső kategóriás modelljei.
5. Fokozott teljesítmény és hatékonyság
Az NVIDIA azt állítja, hogy az Ada chipek kétszer gyorsabbak a raszteres játékoknál, és akár négyszer gyorsabbak a ray-traced játékoknál. Ezenkívül azt mondják, hogy a legújabb chipjei több mint kétszer akkora teljesítményt nyújtanak, ha ugyanazt a teljesítményt.
Ezen fejlesztések miatt a Lovelace GPU-kat 3 GHz fölé is túlhajthatja – ennek azonban óriási teljesítményfelvétel az ára: az RTX 4090 esetében akár 450 watt is.
Mindazonáltal ezek a fejlesztések okozhatják azt is, hogy a pletykák szerint az RTX 4070 olyan erős, mint az RTX 3090 Ti, és az RTX 4090 kétszer akkora teljesítményt ad le, mint a 3090 Ti ugyanazon a teljesítményfelvételen.
Az RTX 4000-es sorozatú GPU-k szíve
Az Ada Lovelace mikroarchitektúra egy újabb ugrás a GPU teljesítményében, teljesítményében és hatékonyságában az NVIDIA-tól. És mivel ez a chip az RTX 4000-es sorozatú fogyasztói GPU-k dobogó szíve, elvárjuk, hogy ezek a bejövő kártyák kiemelkedő teljesítményt nyújtsanak.
Ezek azonban csak elméleti állítások, amíg 2022. október 12-én kézbe nem kerül az RTX 4090, a következő hónapban pedig az RTX 4080. Így hát visszafojtjuk a lélegzetünket, és arra várunk, hogy láthassuk a tényleges viszonyítási pontokat, amikor a kiskereskedelmi egységek megjelennek a boltok polcain.