GTC 2022

GeForce RTX 4090 und 4080: Ada Lovelace startet für 1.099 bis 1.949 Euro ab Oktober

Update 2 Wolfgang Andermahr (+1)
1.733 Kommentare
GeForce RTX 4090 und 4080: Ada Lovelace startet für 1.099 bis 1.949 Euro ab Oktober
Bild: Nvidia

Nvidia hat mit der GeForce RTX 4090 sowie zwei Varianten der RTX 4080 die ersten drei Spieler-Grafikkarten der Ada-Lovelace-Generation vorgestellt. Und auch wenn eigene Erfahrungen noch fehlen, alleine Nvidias Angaben sind beeindruckend und deuten auf massive Leistungssteigerungen gegenüber der Vorgänger-Generation Ampere hin.

Große AD102-GPU aus TSMCs N4-Prozess

Nvidia-CEO Jensen Huang hat in der aufgezeichneten Keynote der GTC wie erwartet beeindruckende Zahlen genannt. Das fängt bereits bei der großen GPU AD102 an, die auf TSMCs neuen N4-Prozess setzt und aus 76 Milliarden Transistoren besteht. Der Vorgänger GA102 der Ampere-Generation kommt nicht einmal auf die Hälfte.

Laut PNY ist der AD102-Chip 608,3 mm² groß. Das wären 20 mm² oder drei Prozent weniger als beim GA102. Von Nvidia bestätigt wurde die Chip-Größe bis dato nicht.

Die technischen Spezifikationen der GeForce RTX 3090 Ti im Überblick
GPU GA102 AD102
Architektur Ampere Ada Lovelace
Prozess Samsung 8 nm Custom-Prozess TSMC N4
Chipgröße 628 mm² 608 mm²
Transistoren 28 Mrd. 76 Mrd.
Packdichte 44,6 Mio. Transistoren pro mm² 125,5 Mio. Transistoren pro mm²

Doppelt so schnell bei Raster, viermal so schnell bei Raytracing

Und das bringt einen massiven Leistungsschub mit sich. Rasterizer-Spiele sollen mit Ada Lovelace bis zu doppelt so schnell wie auf der aktuellen GeForce-RTX-3000-Generation laufen, in Raytracing-Spielen nennt Nvidia bis zu vier Mal so viel Leistung – auch wenn dies vermutlich nur Spezialfälle sein werden. Folgende Beispiele hat Nvidia konkret genannt:

Leistungssprung mit RTX 4090 gegenüber RTX 3090 Ti laut Nvidia:
  • 2 × FPS bei Microsoft Flight Simulator
  • 3 × FPS bei Portal mit RTX (Mod)
  • 4 × FPS bei Racer X

Zugleich soll die Energieeffizienz ebenso doppelt so hoch ausfallen. Genaue Zahlen wurden zwar nicht genannt, eine Grafik zeigt aber 450 Watt und damit den spekulierten Wert für die GeForce RTX 4090.

Ein Großteil der technischen Spezifikationen fehlt zwar noch, doch mehr als 18.000 FP32-ALUs soll der Chip im Vollausbau haben, etwa 70 Prozent mehr als der Vorgänger. Im Labor soll Ada Lovelace mehr als 3 GHz geschafft haben – was darauf schließen lässt, dass die meisten Modelle diese Marke zwar nicht knacken werden, der Takt aber immer noch klar höher als bislang wäre. Denn deutlich mehr als 2,0 GHz sind mit Ampere nicht zu schaffen.

Die FP32-ALUs sollen laut Nvidia bei der GeForce RTX 4000 schneller als auf der GeForce RTX 3000 arbeiten. Als neues Herzstück bieten diese bis zu 90 TFLOPs. Das wiederum würde bei den spekulierten 18.432 ALUs um die 2.500 MHz bedeuten – ein höherer Takt ist in der Praxis wahrscheinlich.

Die Shader sollen sortiert deutlich schneller sein

Aufgrund von „Shader Execution Reordering“ (SER) sollen die ALUs laut Nvidia auch bei gleicher theoretischer Rechenleistung schneller als mit Ampere arbeiten, da diese die ankommenden Arbeitsaufträge in Echtzeit neu sortieren und dann in optimierter Reihenfolge an die Shadereinheiten weitergeben. Raytracing soll dadurch maximal zwei bis drei Mal schneller als ohne dieses Feature arbeiten – auch wenn dies nicht bedeutet, dass ein Spiel plötzlich zwei bis drei Mal schneller läuft. Die „Overall Gaming Performance“ soll 25 Prozent besser durch SER ausfallen.

Nvidia Ada Lovelace
Nvidia Ada Lovelace (Bild: Nvidia)

Die Raytracing-Kerne gehen nach Turing und Ampere in die dritte Generation und sollen den Durchsatz für die Ray-Triangle-Intersection-Tests (Prüfung von Schnittpunkten) verdoppeln. Zudem können die neuen Einheiten Raytracing auf Alpha-Test-Geometrie doppelt so schnell beschleunigen, darüber hinaus kann komplexe Geometrie besser beschleunigt werden, ohne die Erstellungskosten der BVH-Struktur allzu sehr zu erhöhen.

Neu sind auch die Tensor-Kerne, die mit Ada Lovelace in der vierten Generation angekommen sind und eine Rechenleistung von 1.400 TFLOPS bei Tensor-Berechnungen bieten. Diese kommen unter anderem beim neuen DLSS 3 zum Einsatz. Mehr zum neuen Upsampling gibt es in einer separaten Meldung.

Die GeForce RTX 4090 und die doppelte RTX 4080

Drei Grafikkarten wird Nvidia zunächst veröffentlichen, die restlichen Probanden werden vermutlich nächstes Jahr folgen. Das Flaggschiff ist die GeForce RTX 4090, die 1.599 US-Dollar und somit 100 US-Dollar teurer als die GeForce RTX 3090 ausfällt. In Deutschland liegt der Preis inklusive Steuern bei 1.949 Euro. Die Performance soll zugleich um den Faktor 2 (Rasterizer-Spiele) bis Faktor 4 (spezielle Raytracing-Anwendungen) gegenüber der GeForce RTX 3090 Ti ansteigen, während der Speicherausbau bei 24 GB des Typs GDDR6X verbleibt. Ab dem 12. Oktober wird die GeForce RTX 4090 erhältlich sein.

Nvidia Ada Lovelace
Nvidia Ada Lovelace (Bild: Nvidia)

Die GeForce RTX 4080 wird es dann wie bereits spekuliert tatsächlich in zwei verschiedenen Varianten geben, eine mit 16 GB VRAM und eine mit deren 12 GB, in beiden Fällen wird GDDR6X verbaut. Genaue Angaben zu den Unterschieden gibt es nicht, preislich liegen diese aber weit auseinander. Denn die 16-GB-Karte soll 1.199 US-Dollar respektive 1.469 Euro kosten, das 12-GB-Modell in den USA 899 US-Dollar ohne Steuern oder hierzulande 1.099 Euro mit Steuern. Gegenüber der GeForce RTX 3080 gibt es also entsprechend einen großen Aufpreis, finanziell lässt sich die 16-GB-Variante deshalb eher mit der GeForce RTX 3080 Ti vergleichen.

Nvidia Ada Lovelace
Nvidia Ada Lovelace (Bild: Nvidia)

Apropos GeForce RTX 3080 Ti: Die GeForce RTX 4080 – vermutlich das 16-GB-Modell – soll zwei bis vier Mal so schnell sein wie die GeForce RTX 3080 Ti. Ab November soll es beide Ausbaustufen zu kaufen geben.

Die GeForce RTX 3060, GeForce RTX 3070 und die GeForce RTX 3080 werden zunächst im Portfolio bleiben.

Nvidia Ada Lovelace
Nvidia Ada Lovelace (Bild: Nvidia)

RTX 4080 mit 12 GB nur als Custom-Design?

Die RTX 4090 misst laut Nvidia 30,4 cm in der Länge, 137 mm in der Breite und belegt bei 61 mm Tiefe drei Steckplätze. Das gleiche gilt für die RTX 4080 mit 16 GB, die somit das gleiche Design nutzt.

Bei den Abmessungen der RTX 4080 mit 12 GB nennt Nvidia hingegen „unterschiedlich je nach Hersteller“. Das ist ein deutliches Indiz dafür, dass es die „kleinere“ RTX 4080 nicht als Founders Edition, sondern nur im Custom-Design der Board-Partner geben wird.

PCIe 4.0 und DisplayPort 1.4

In puncto Schnittstellen werden so manche Erwartungen enttäuscht. Denn weder PCIe 5.0 noch der neue VESA-Standard DisplayPort 2.0 werden bei RTX 4000 geboten. Stattdessen kommt weiterhin PCIe 4.0 und DisplayPort 1.4a (3×) sowie HDMI 2.1 (1×) zum Einsatz.

Die Spezifikationen zur RTX 4000

Um die Technik und die Ada-Architektur soll es an dieser Stelle gar nicht großartig gehen, Nvidia hat aber dennoch einige Details wie die Anzahl der FP32-ALUs und die Taktraten genannt.

Die GeForce RTX 4090 verfügt über die große AD102-GPU, die im neuen Prozess N4 bei TSMC hergestellt wird. Die Grafikkarte verfügt über satte 16.384 FP32-Einheiten – ein Plus von 56 Prozent gegenüber der GeForce RTX 3090. Zugleich steigt die Taktrate auf einen Boost-Takt von 2.520 MHz an (+48 Prozent). Zugleich hat es auch an der Architektur selbst einige Verbesserungen gegeben. Darüber hinaus steigt trotz des deutlich effizienteren Prozesses die Leistungsaufnahme auf 450 Watt, was ebenso einen großen Anteil an dem Leistungsplus hat. Gleich geblieben ist der Speicherausbau, der erneut 24 GB beträgt.

Spezifikationen der RTX-4000-Serie
RTX 3090 Ti RTX 4090 RTX 3090 RTX 4080 16 GB RTX 3080 RTX 4080 12 GB RTX 3070
Architektur Ampere Ada Ampere Ada Ampere Ada Ampere
Fertigung Samsung 8 nm TSMC N4 Samsung 8 nm TSMC N4 Samsung 8 nm TSMC N4 Samsung 8 nm
GPU GA102 AD102 GA102 AD103 GA102 AD104 GA104
SM 84 128* 82 76* 68 60* 46
FP32-ALUs 10.752 16.384 10.496 9.728 8.704 7.680 5.888
RT-Kerne 84, 2nd Gen 128, 3rd Gen 82, 2nd Gen 76, 3rd Gen 68, 2nd Gen 60, 3rd Gen 46, 2nd Gen
Tensor-Kerne 336, 3rd Gen 512, 4th Gen 328, 3rd Gen 304, 4th Gen 272, 3rd Gen 240, 4th Gen 184, 3rd Gen
Base-Takt 1.560 MHz 2.230 MHz 1.400 MHz 2.210 MHz 1.440 MHz 2.310 MHz 1.500 MHz
Boost-Takt 1.860 MHz 2.520 MHz 1.700 MHz 2.510 MHz 1.710 MHz 2.610 MHz 1.730 MHz
FP32-Rechenleistung 40,0 TFLOPS 82,6 TFLOPS 35,7 TFLOPS 48,8 TFLOPS 29,8 TFLOPS 40,1 TFLOPS 20,4 TFLOPS
Speicher 24 GB GDDR6X 24 GB GDDR6X 24 GB GDDR6X 16 GB GDDR6X 10 GB GDDR6X 12 GB GDDR6X 8 GB GDDR6
Speicherinterface 384 Bit 384 Bit 384 Bit 256 Bit 320 Bit 192 Bit 256 Bit
Speicherdurchsatz 21 Gbps 21 Gbps* 19,5 Gbps 21 Gbps* 19 Gbps 21 Gbps* 14 Gbps
Speicherbandbreite 1.008 GB/s 1.008 GB/s* 936 GB/s 672 GB/s* 760 GB/s 504 GB/s* 448 GB/s
TDP 450 Watt 450 Watt 350 Watt 320 Watt 320 Watt 285 Watt 220 Watt
Preis 1.329 € 1.949 € 1.199 € 1.469 € 759 € 1.099 € 549 €
*Spekulation
Update

Die Meldung wurde zwischenzeitlich um Euro-Preise, offizielle Spezifikationen sowie Details zu den Designs und den Schnittstellen ergänzt.

Update

Die Meldung wurde um Informationen zur „Die Size“ des AD102 sowie zur Anzahl der aktiven RT- und Tensor-Kernen der drei ersten Modelle ergänzt. Im Beitrag GeForce RTX 4000 „FE“: Drei Grafikkarten, zwei Namen und nur ein Design hat die Redaktion darüber hinaus alle verfügbaren Informationen zu den neuen Founders Edition zusammengetragen.

Nvidia GTC 2022 (September) (19.–22. September 2022): Alle News auf der Themenseite!
  • Nvidia GeForce RTX 4000: Weitere Details zu Architektur, DLSS 3 und Founders Editions
  • GeForce RTX 4090: Nvidia verspricht 2,85 GHz Boost-Takt in Cyberpunk 2077
  • GeForce RTX 4090 und 4080: Custom-Designs fahren schwere Geschütze auf
  • +8 weitere News
Microsoft Build 2024 (21.–23. Mai 2024): Alle News auf der Themenseite!