GTC 2022

GeForce RTX 4090 und 4080: Ada Lovelace startet für 1.099 bis 1.949 Euro ab Oktober

Update 2 20.9.2022 18:45 Uhr

Wolfgang Andermahr (+1)

1.733 Kommentare

Bild: Nvidia

Nvidia hat mit der GeForce RTX 4090 sowie zwei Varianten der RTX 4080 die ersten drei Spieler-Grafikkarten der Ada-Lovelace-Generation vorgestellt. Und auch wenn eigene Erfahrungen noch fehlen, alleine Nvidias Angaben sind beeindruckend und deuten auf massive Leistungssteigerungen gegenüber der Vorgänger-Generation Ampere hin.

Große AD102-GPU aus TSMCs N4-Prozess

Nvidia-CEO Jensen Huang hat in der aufgezeichneten Keynote der GTC wie erwartet beeindruckende Zahlen genannt. Das fängt bereits bei der großen GPU AD102 an, die auf TSMCs neuen N4-Prozess setzt und aus 76 Milliarden Transistoren besteht. Der Vorgänger GA102 der Ampere-Generation kommt nicht einmal auf die Hälfte.

Laut PNY ist der AD102-Chip 608,3 mm² groß. Das wären 20 mm² oder drei Prozent weniger als beim GA102. Von Nvidia bestätigt wurde die Chip-Größe bis dato nicht.

Die technischen Spezifikationen der GeForce RTX 3090 Ti im Überblick

GPU	GA102	AD102
Architektur	Ampere	Ada Lovelace
Prozess	Samsung 8 nm Custom-Prozess	TSMC N4
Chipgröße	628 mm²	608 mm²
Transistoren	28 Mrd.	76 Mrd.
Packdichte	44,6 Mio. Transistoren pro mm²	125,5 Mio. Transistoren pro mm²

Doppelt so schnell bei Raster, viermal so schnell bei Raytracing

Und das bringt einen massiven Leistungsschub mit sich. Rasterizer-Spiele sollen mit Ada Lovelace bis zu doppelt so schnell wie auf der aktuellen GeForce-RTX-3000-Generation laufen, in Raytracing-Spielen nennt Nvidia bis zu vier Mal so viel Leistung – auch wenn dies vermutlich nur Spezialfälle sein werden. Folgende Beispiele hat Nvidia konkret genannt:

Leistungssprung mit RTX 4090 gegenüber RTX 3090 Ti laut Nvidia:

2 × FPS bei Microsoft Flight Simulator
3 × FPS bei Portal mit RTX (Mod)
4 × FPS bei Racer X

Zugleich soll die Energieeffizienz ebenso doppelt so hoch ausfallen. Genaue Zahlen wurden zwar nicht genannt, eine Grafik zeigt aber 450 Watt und damit den spekulierten Wert für die GeForce RTX 4090.

Ein Großteil der technischen Spezifikationen fehlt zwar noch, doch mehr als 18.000 FP32-ALUs soll der Chip im Vollausbau haben, etwa 70 Prozent mehr als der Vorgänger. Im Labor soll Ada Lovelace mehr als 3 GHz geschafft haben – was darauf schließen lässt, dass die meisten Modelle diese Marke zwar nicht knacken werden, der Takt aber immer noch klar höher als bislang wäre. Denn deutlich mehr als 2,0 GHz sind mit Ampere nicht zu schaffen.

Die FP32-ALUs sollen laut Nvidia bei der GeForce RTX 4000 schneller als auf der GeForce RTX 3000 arbeiten. Als neues Herzstück bieten diese bis zu 90 TFLOPs. Das wiederum würde bei den spekulierten 18.432 ALUs um die 2.500 MHz bedeuten – ein höherer Takt ist in der Praxis wahrscheinlich.

Nvidia Ada Lovelace — Nvidia Ada Lovelace (Bild: Nvidia)

Nvidia Ada Lovelace

Nvidia Ada Lovelace

Nvidia Ada Lovelace (Bild: Nvidia)

Die Shader sollen sortiert deutlich schneller sein

Aufgrund von „Shader Execution Reordering“ (SER) sollen die ALUs laut Nvidia auch bei gleicher theoretischer Rechenleistung schneller als mit Ampere arbeiten, da diese die ankommenden Arbeitsaufträge in Echtzeit neu sortieren und dann in optimierter Reihenfolge an die Shadereinheiten weitergeben. Raytracing soll dadurch maximal zwei bis drei Mal schneller als ohne dieses Feature arbeiten – auch wenn dies nicht bedeutet, dass ein Spiel plötzlich zwei bis drei Mal schneller läuft. Die „Overall Gaming Performance“ soll 25 Prozent besser durch SER ausfallen.

Nvidia Ada Lovelace — Nvidia Ada Lovelace (Bild: Nvidia)

Die Raytracing-Kerne gehen nach Turing und Ampere in die dritte Generation und sollen den Durchsatz für die Ray-Triangle-Intersection-Tests (Prüfung von Schnittpunkten) verdoppeln. Zudem können die neuen Einheiten Raytracing auf Alpha-Test-Geometrie doppelt so schnell beschleunigen, darüber hinaus kann komplexe Geometrie besser beschleunigt werden, ohne die Erstellungskosten der BVH-Struktur allzu sehr zu erhöhen.

Neu sind auch die Tensor-Kerne, die mit Ada Lovelace in der vierten Generation angekommen sind und eine Rechenleistung von 1.400 TFLOPS bei Tensor-Berechnungen bieten. Diese kommen unter anderem beim neuen DLSS 3 zum Einsatz. Mehr zum neuen Upsampling gibt es in einer separaten Meldung.

Die GeForce RTX 4090 und die doppelte RTX 4080

Drei Grafikkarten wird Nvidia zunächst veröffentlichen, die restlichen Probanden werden vermutlich nächstes Jahr folgen. Das Flaggschiff ist die GeForce RTX 4090, die 1.599 US-Dollar und somit 100 US-Dollar teurer als die GeForce RTX 3090 ausfällt. In Deutschland liegt der Preis inklusive Steuern bei 1.949 Euro. Die Performance soll zugleich um den Faktor 2 (Rasterizer-Spiele) bis Faktor 4 (spezielle Raytracing-Anwendungen) gegenüber der GeForce RTX 3090 Ti ansteigen, während der Speicherausbau bei 24 GB des Typs GDDR6X verbleibt. Ab dem 12. Oktober wird die GeForce RTX 4090 erhältlich sein.

Nvidia Ada Lovelace — Nvidia Ada Lovelace (Bild: Nvidia)

Die GeForce RTX 4080 wird es dann wie bereits spekuliert tatsächlich in zwei verschiedenen Varianten geben, eine mit 16 GB VRAM und eine mit deren 12 GB, in beiden Fällen wird GDDR6X verbaut. Genaue Angaben zu den Unterschieden gibt es nicht, preislich liegen diese aber weit auseinander. Denn die 16-GB-Karte soll 1.199 US-Dollar respektive 1.469 Euro kosten, das 12-GB-Modell in den USA 899 US-Dollar ohne Steuern oder hierzulande 1.099 Euro mit Steuern. Gegenüber der GeForce RTX 3080 gibt es also entsprechend einen großen Aufpreis, finanziell lässt sich die 16-GB-Variante deshalb eher mit der GeForce RTX 3080 Ti vergleichen.

Nvidia Ada Lovelace — Nvidia Ada Lovelace (Bild: Nvidia)

Apropos GeForce RTX 3080 Ti: Die GeForce RTX 4080 – vermutlich das 16-GB-Modell – soll zwei bis vier Mal so schnell sein wie die GeForce RTX 3080 Ti. Ab November soll es beide Ausbaustufen zu kaufen geben.

Die GeForce RTX 3060, GeForce RTX 3070 und die GeForce RTX 3080 werden zunächst im Portfolio bleiben.

Nvidia Ada Lovelace — Nvidia Ada Lovelace (Bild: Nvidia)

RTX 4080 mit 12 GB nur als Custom-Design?

Die RTX 4090 misst laut Nvidia 30,4 cm in der Länge, 137 mm in der Breite und belegt bei 61 mm Tiefe drei Steckplätze. Das gleiche gilt für die RTX 4080 mit 16 GB, die somit das gleiche Design nutzt.

Bei den Abmessungen der RTX 4080 mit 12 GB nennt Nvidia hingegen „unterschiedlich je nach Hersteller“. Das ist ein deutliches Indiz dafür, dass es die „kleinere“ RTX 4080 nicht als Founders Edition, sondern nur im Custom-Design der Board-Partner geben wird.

PCIe 4.0 und DisplayPort 1.4

In puncto Schnittstellen werden so manche Erwartungen enttäuscht. Denn weder PCIe 5.0 noch der neue VESA-Standard DisplayPort 2.0 werden bei RTX 4000 geboten. Stattdessen kommt weiterhin PCIe 4.0 und DisplayPort 1.4a (3×) sowie HDMI 2.1 (1×) zum Einsatz.

Die Spezifikationen zur RTX 4000

Um die Technik und die Ada-Architektur soll es an dieser Stelle gar nicht großartig gehen, Nvidia hat aber dennoch einige Details wie die Anzahl der FP32-ALUs und die Taktraten genannt.

Die GeForce RTX 4090 verfügt über die große AD102-GPU, die im neuen Prozess N4 bei TSMC hergestellt wird. Die Grafikkarte verfügt über satte 16.384 FP32-Einheiten – ein Plus von 56 Prozent gegenüber der GeForce RTX 3090. Zugleich steigt die Taktrate auf einen Boost-Takt von 2.520 MHz an (+48 Prozent). Zugleich hat es auch an der Architektur selbst einige Verbesserungen gegeben. Darüber hinaus steigt trotz des deutlich effizienteren Prozesses die Leistungsaufnahme auf 450 Watt, was ebenso einen großen Anteil an dem Leistungsplus hat. Gleich geblieben ist der Speicherausbau, der erneut 24 GB beträgt.

Spezifikationen der RTX-4000-Serie

	RTX 3090 Ti	RTX 4090	RTX 3090	RTX 4080 16 GB	RTX 3080	RTX 4080 12 GB	RTX 3070
Architektur	Ampere	Ada	Ampere	Ada	Ampere	Ada	Ampere
Fertigung	Samsung 8 nm	TSMC N4	Samsung 8 nm	TSMC N4	Samsung 8 nm	TSMC N4	Samsung 8 nm
GPU	GA102	AD102	GA102	AD103	GA102	AD104	GA104
SM	84	128*	82	76*	68	60*	46
FP32-ALUs	10.752	16.384	10.496	9.728	8.704	7.680	5.888
RT-Kerne	84, 2nd Gen	128, 3rd Gen	82, 2nd Gen	76, 3rd Gen	68, 2nd Gen	60, 3rd Gen	46, 2nd Gen
Tensor-Kerne	336, 3rd Gen	512, 4th Gen	328, 3rd Gen	304, 4th Gen	272, 3rd Gen	240, 4th Gen	184, 3rd Gen
Base-Takt	1.560 MHz	2.230 MHz	1.400 MHz	2.210 MHz	1.440 MHz	2.310 MHz	1.500 MHz
Boost-Takt	1.860 MHz	2.520 MHz	1.700 MHz	2.510 MHz	1.710 MHz	2.610 MHz	1.730 MHz
FP32-Rechenleistung	40,0 TFLOPS	82,6 TFLOPS	35,7 TFLOPS	48,8 TFLOPS	29,8 TFLOPS	40,1 TFLOPS	20,4 TFLOPS
Speicher	24 GB GDDR6X	24 GB GDDR6X	24 GB GDDR6X	16 GB GDDR6X	10 GB GDDR6X	12 GB GDDR6X	8 GB GDDR6
Speicherinterface	384 Bit	384 Bit	384 Bit	256 Bit	320 Bit	192 Bit	256 Bit
Speicherdurchsatz	21 Gbps	21 Gbps*	19,5 Gbps	21 Gbps*	19 Gbps	21 Gbps*	14 Gbps
Speicherbandbreite	1.008 GB/s	1.008 GB/s*	936 GB/s	672 GB/s*	760 GB/s	504 GB/s*	448 GB/s
TDP	450 Watt	450 Watt	350 Watt	320 Watt	320 Watt	285 Watt	220 Watt
Preis	1.329 €	1.949 €	1.199 €	1.469 €	759 €	1.099 €	549 €
*Spekulation

Update 20.09.2022 19:34 Uhr

Die Meldung wurde zwischenzeitlich um Euro-Preise, offizielle Spezifikationen sowie Details zu den Designs und den Schnittstellen ergänzt.

Update 21.09.2022 08:50 Uhr

Die Meldung wurde um Informationen zur „Die Size“ des AD102 sowie zur Anzahl der aktiven RT- und Tensor-Kernen der drei ersten Modelle ergänzt. Im Beitrag GeForce RTX 4000 „FE“: Drei Grafikkarten, zwei Namen und nur ein Design hat die Redaktion darüber hinaus alle verfügbaren Informationen zu den neuen Founders Edition zusammengetragen.

CB-Funk Podcast #70: Benchmarks ohne Ende, FSR 3.1 (?) und Copilot+ PCs mit Arm mit Fabian und Jan-Frederik

Nvidia GTC 2022 (September) (19.–22. September 2022): Alle News auf der Themenseite!

Nvidia GeForce RTX 4000: Weitere Details zu Architektur, DLSS 3 und Founders Editions
GeForce RTX 4090: Nvidia verspricht 2,85 GHz Boost-Takt in Cyberpunk 2077
GeForce RTX 4090 und 4080: Custom-Designs fahren schwere Geschütze auf
+8 weitere News

Microsoft Build 2024 (21.–23. Mai 2024): Alle News auf der Themenseite!