Warum hat AMD beim Ray Tracing eine schlechtere Leistung?

Eines der Dinge, über die ausführlich gesprochen wird, ist die schlechte Leistung von AMD Grafikkarten im Raytracing , besonders im Vergleich zu NVIDIA's. Viele werfen jedoch die Hände hoch, wenn wir sagen, dass die Implementierung der erforderlichen Hardware durch die Radeon Technology Group so schlecht ist, dass es buchstäblich wie ein Boykott der Einführung dieser Technologie erscheint. Wobei wir uns daran erinnern sollten, dass es ideal ist, um bestimmte visuelle Probleme in der Computergrafik zu lösen, und dass es auch keine Erfindung des GeForce-Herstellers ist.

Für uns besteht die Hauptfunktion einer Grafikkarte darin, dass sie es uns ermöglicht, unsere Spiele mit Leichtigkeit und Leistung zu spielen, während Sie sie gleichzeitig für professionellere Aufgaben wie Videobearbeitung oder die Erstellung von 3D benötigen Modelle, es ist mehr als genug. mit seiner Arbeit. Wenn wir sagen, dass AMD beim Ray Tracing wenig Leistung hat, bringen wir NVIDIA nicht durch die Decke, sondern als Benutzer, die wir auch sind, sind wir traurig zu sehen, dass etwas, das in Radeons viel besser sein könnte, es nicht ist.

Warum hat AMD beim Ray Tracing eine schlechtere Leistung?

Der Raytracing-Algorithmus

Um die schlechte Leistung von AMD-Karten beim Ray Tracing zu verstehen, müssen wir verstehen, dass dies eigentlich ein rekursiver Algorithmus zur Generierung einer vollständigen Szene ist, der in seiner einfachsten Version wie folgt zusammengefasst werden kann:

  • Für jedes Pixel in der Szene
    • Berechnen Sie den Visualisierungsstrahl
      • Wenn der Blitz in ein Objekt einschlägt, bewerten Sie die Farbe des Objekts.
      • Wenn nicht, hat dieses Pixel die Hintergrundfarbe.

Der Strahl ist nichts anderes als ein Vektor, der sich von der Kamera aus bewegt, die die Szene „aufnimmt“, und der eine Matrix von Punkten oder ein Netz kreuzt, wo jeder von ihnen ein Pixel ist. Jedes Mal wird ein Überprüfungseffekt auf die Szene ausgeführt. Nun, wenn wir eine Szene in Full HD haben, bedeutet dies, dass 2 Millionen Überprüfungen durchgeführt werden müssen, wenn das Spiel mit 60 FPS läuft, sind dies 120 Millionen Überprüfungen pro Sekunde.

Mathematisch gesehen ist die häufigste Formel zur Überprüfung keine einfache Operation, sondern eine komplexe Gleichung mit Vektoren, die einige Kraft erfordert. So sehr, dass die einfache Tatsache, dass keine parallele Einheit für diese Aufgabe zuständig ist, die prozentuale Leistung auf einstellige Zahlen reduzieren kann.

Esquema funcionamiento Raytracing

Hardware-Schnitteinheiten

Aus diesem Grund hat NVIDIA die RT Cores und AMD die Ray Accelerator Units, sie sind gleich, da sie den gleichen Einheitentyp haben und für die gleiche Aufgabe verwendet werden. In der letzten Generation hatte der RX 6000 jedoch eine Einschränkung, die das RTG glücklicherweise in RDNA 3 und folglich in der RX 7000-Reihe gelöst hat.

Tarjetas Grafik RX 7000 Raytracing

Was ist denn das Problem?

  • Das Gute und damit Positive ist, dass jetzt das, was in RDNA 2 gefehlt hat, in RDNA 3 aufgenommen wurde.
  • Das Schlimme und was uns dazu bringt, eine schlechte Leistung von Ray Tracing auf AMD zu haben, ist die Menge an Strahl-Dreieck-Wechselwirkungen dass es rechnen kann. Ein Sprung von nur 50 % ist sehr schlecht, wenn Ihr Rivale die Leistung von einer Generation zur nächsten verdoppelt hat.

Vergessen wir nicht, dass die ersten 3D-Karten, die auf den Markt kamen, dafür verantwortlich waren, den Vorgang der Dreiecksrasterung, die in dieser Hinsicht am häufigsten vorkommt, zunehmend zu beschleunigen. Dasselbe gilt für diesen Teil beim Raytracing. Dass AMD in dieser Hinsicht einen so kleinen Sprung gemacht hat, ist also enttäuschend.

Wie wirkt es sich auf die Gesamtleistung aus?

Obwohl der Schnittpunkt der Strahlen ein Teil des Sets ist, ist er ein gemeinsames Element in allen Szenen, das wesentlich ist. Vergessen wir nicht, dass es sich um einen schrittweisen Prozess handelt, bei dem die Tatsache, dass einer langsamer als normal fährt, die Leistung der nachfolgenden beeinflusst.

DXR Kein Inline-Raytracing

Wenn es uns also gelingt, eine Stufe zu beschleunigen, erhalten wir eine kürzere Zeit, um denselben Frame zu generieren, das heißt, es dauert weniger Millisekunden und das sind mehr Frames pro Sekunde. Es muss klar sein, dass der Schnittpunktprozess beim Ray Tracing rekursiv und kontinuierlich ist und daher ist es notwendig, dass dieser Teil eine gute Leistung hat.

Das andere Problem: Gleitkommaleistung

GPUs arbeiten normalerweise gemeinsam an Datenblöcken und wenden dieselben Anweisungen auf sie an. Aus diesem Grund ist der wesentliche Einheitentyp das, was wir SIMD-Einheiten nennen, die, wie ihr Name schon sagt, dieselbe Anweisung auf mehrere verschiedene Daten gleichzeitig anwenden. Nun, NVIDIA hat in der RTX 30 eine ziemlich merkwürdige Verbesserung vorgenommen, die es ermöglicht, doppelt so viele 32-Bit-Gleitkommaoperationen pro Taktzyklus und Kern zu berechnen.

Der Trick bestand darin, eine zweite SIMD-Einheit mit 16 Elementen auf jedem der Sub-Cores hinzuzufügen, um insgesamt 64 zusätzliche Operationen pro Einheit im Inneren zu erhalten GPU. Sie erhöhten jedoch nicht die Anzahl der Datensätze oder Zugriffe, da sie mit der Einheit ganzer Zahlen ausgetauscht wurden. Was bedeutet das? Sowohl die RTX 30 als auch die RTX 40 erreichen unter bestimmten Bedingungen, nicht immer, eine doppelte Gleitkommaleistung.

AMD hingegen hat nach einer anderen Lösung gesucht, die sie Dual Issue genannt haben, aber in ihren technischen Spezifikationen sagen sie, dass die Anzahl der Gleitkommaeinheiten nicht erhöht wurde, aber dass sie unter bestimmten Bedingungen 2 Befehle gleichzeitig packen können . Allerdings beträgt die Anzahl der Einheiten pro Core bzw. Compute Unit weiterhin maximal 64, statt 128 wie bei NVIDIA.

Doppelausgabe RDNA 3

Was meint AMD mit „Dual Issue“ in RDNA 3?

Wenn Sie jedoch die von AMD angegebene Anzahl von Gleitkommaoperationen zählen, die normalerweise mit einem theoretischen Maximum angegeben werden, führen 100% der Zeit die FMA-Operation oder Addition mit Gleitkommamultiplikation durch, was unrealistisch ist, da es nicht berücksichtigt wird berücksichtigt Speicherzugriffe und die Tatsache, dass Programme diese Anweisung nicht immer verwenden, aber es wird berücksichtigt, dass sie am häufigsten verwendet wird, wenn Grafiken erzeugt werden. Tatsache ist, dass die Anweisung 2 Operationen umfasst.

Nun, was AMD getan hat, ist, dass bestimmte Anweisungen zu zweit in die Recheneinheiten gepackt werden können, wodurch unter bestimmten Bedingungen mit RDNA 2 die doppelte Leistung in Fließkomma erreicht werden kann. Es ist der gleiche Fall wie bei NVIDIA-GPUs. Die zusätzliche Fließkommaleistung wird nicht generell verdoppelt, sondern nur unter bestimmten Bedingungen. Es ist also ein allgemeines Problem. Ohnehin ist die Messung in TFLOPS auch heute noch ein Marketingtrick.

Warum ist es also wichtig für die Raytracing-Leistung von AMD? Nun, aufgrund der Tatsache, dass es uns hilft, die Rechenleistung der Einheiten zu messen, die in den restlichen Stadien der Strahlverfolgung verwendet werden, die nicht der Schnittpunkt von Strahlen sind. Jedenfalls behauptet AMD selbst, dass die Verbesserung zwischen den Generationen 18 % bei gleicher Taktrate beträgt.

AMD RDNA 3 Mejora Rendimiento

AMD GPU-Leistung im Raytracing: Die Zahlen

Wenn wir die Leistung der verschiedenen Schnittstelleneinheiten auf den beiden verschiedenen Grafikkartengenerationen von NVIDIA und AMD vergleichen, werden wir sehen, wo das Problem liegt.

GPUs Kreuzungen/s (in Millionen) Kerne MHz Schnittpunkte (Kern und MHz)
RTX 2080Ti 105600 68 1545 dank One
RTX 3090Ti 312480 84 1860 2
RTX 4090 1290240 144 2520 3.6
RX 6950 XT 184800 80 2310 dank One
RX7900XTX 360000 96 2500 1.5

Auf den ersten Blick ist die Rohleistung in diesem Aspekt höher als die einer RTX 3090 Ti, ja, schauen wir uns die zweite Spalte an. Letzteres ist jedoch wichtig, da es uns sagt, wie viele Intercepts pro Kern und Taktzyklus auf der GPU berechnet werden. Und die Enttäuschung rührt von der Tatsache her, dass AMD zwar nicht aufgefordert wird, das Ergebnis von 3.6 für die RTX 40 zu geben, aber mindestens 2 für die RTX 30 erreichen soll. Dies ist der Hauptgrund für die schlechte Leistung von AMD-Grafikkarten beim Raytracing. Und der Grund, warum wir denken, dass sie es viel besser hätten machen können.

Es ist mehr und schon zu Ende, denn die Ray Accelerator Unit ist eine Blackbox für sich, die ausgetauscht werden kann, ohne den Rest der Architektur zu beeinträchtigen. AMD kann aufgreifen und für das kommende Jahr eine RX 7×50-Reihe herausbringen, die all die guten Eigenschaften des aktuellen RDNA 3 beibehält, aber mit dem verbesserten RAU und einer Steigerung der Spieleleistung um zweistellige Prozentsätze in Bezug auf die Bildrate verbunden ist.

Was ist die Leistung von AMD-Spielen mit Ray Tracing in RDNA 3?

Zum Abschluss haben wir jetzt das Sahnehäubchen auf dem Kuchen und sprechen darüber, wie es sich in Spielen verhält. Da AMD öffentlich eine Verbesserung um 50 % behauptete, sollten wir mit einem ebenso großen Sprung rechnen. Später stellten wir jedoch fest, dass sie sich auf Leistung pro Watt beziehen, auf eine bestimmte Menge davon und mit einem bestimmten Spiel, das nicht spezifiziert wurde. Daher ist es wichtig zu wissen, was die Verbesserung in diesem Aspekt im Vergleich zur vorherigen Generation war, insbesondere aufgrund der Tatsache, dass sie von einer eher schlechten Leistung beim Raytracing ausgehen, die von der RX 6000 stammt.