NVIDIA RTX IO: Was ist das und wie funktioniert es auf Grafikkarten?

Eine der Technologien, die NVIDIA Neben der neuesten Generation von GeForce-Grafikkarten wurde RTX IO eingeführt, das für die NVIDIA-Bereiche 20 × 0 und 30 × 0 verfügbar sein wird. Dank dieser Technologie können die Grafikkarten dieser NVIDIA-Serien auf die zugreifen SSD mit dem PCI Express als wäre es eine Erinnerung an die Grafik selbst mit wenig Beteiligung der CPU. Wie funktioniert es?

Das RTX IO ermöglicht den Zugriff auf die SSD durch die GPU Unabhängig von der Architektur der CPU, die wir im System installiert haben, ist es die GPU selbst, die für den Zugriff auf die Daten von der SSD verantwortlich ist, ein Merkmal, das zuvor nicht implementiert wurde. Zumindest auf NVIDIA-GPUs, da wir eine weniger fortgeschrittene Implementierung mit gesehen hatten AMD's HBCC integriert in seine Vega-Grafik.

NVIDIA RTX IO

Das RTX IO ist die Implementierung des DirectStorage auf Hardwareebene zur Verbesserung der Gesundheitsgerechtigkeit Microsoft wurde in DirectX 12 Ultimate implementiert und ist eine API, mit der wir auf einen Speicherplatz zugreifen können, der über das Video hinausgeht RAM. Daher können Sie bestimmte Daten von einer SSD anfordern, die an einen PCI Express-Port angeschlossen ist.

Warum wirkt die CPU bei NVIDIA RTX IO nicht auf den Prozess?

Um zu verstehen, warum die CPU dabei nicht funktioniert, müssen wir verstehen, wie die GPU auf den Systemspeicher zugreift. Jede GPU kann unabhängig von ihrer Architektur auf zwei verschiedene Speicherquellen zugreifen:

  • Ihr lokaler Speicher, der in der Grafikkarte enthalten ist ( VRAM ).
  • Systemspeicher (wo die CPU ihre Daten stoppt).

Für den Zugriff auf die zweite Einheit werden eine oder mehrere DMA-Einheiten verwendet, die über den PCI Express-Bus mit dem RAM des Systems kommunizieren.

Diagramm GPU SSD Acceso

Erinnern Sie sich an die Systeme in SLI und Crossfire, in denen wir zwei Karten im selben System hatten? Nun, der Mechanismus zur Kommunikation mit einer SSD, die an einen PCI Express-Port angeschlossen ist, wäre genau der gleiche.

Der Grund dafür ist, dass trotz der Tatsache, dass wir unterschiedliche PCIe-Eingänge am PC haben, auf der Ebene des E / A-Controllers (der Southbridge) alle auf demselben Controller konzentriert sind und dies alle an den PCI Express angeschlossenen Geräte ermöglicht Ports, um Daten untereinander senden zu können, einschließlich unter anderem der SSD (falls an denselben PCIe-Controller angeschlossen).

Die SSD als Erweiterung des GPU-Speichers

Die GPU behandelt sie beim Zugriff auf die SSD so, als wäre sie RAM-Speicher. In jedem Befehl mit RAM-Zugriff fordert sie die spezifische Speicheradresse an, unter der sich die Daten direkt befinden. Durch eine Reihe vollständig transparenter Mechanismen werden die Daten auf der SSD durchsucht und direkt in einen Teil des RAM kopiert, der als Cache für die SSD verwendet wird, wenn Daten auf der SSD und nicht im Speicher angefordert werden.

Demo der Unreal Engine 5

Dies ermöglicht es dem System, praktisch eine große Menge an Speicher zur Verfügung zu haben und die Grenzen des VRAM zu überschreiten, um auf bestimmte Daten zuzugreifen. Die GPU muss nur vorbestellen, um sie in den Arbeitsspeicher zu kopieren.

Wenn wir beispielsweise in einem Open-World-Spiel in einen neuen Bereich zoomen, kann der Speicher die nicht mehr benötigten Texturen und anderen Daten aus dem RAM entfernen und erneut von der SSD laden. Zum Beispiel hatte die vor einigen Monaten veröffentlichte Unreal Engine-Demo „nur“ 768 MB, um Daten von der SSD in den Grafik-RAM zu kopieren.

Echtzeit-Datendekomprimierung mit einer bescheidenen CPU

Eines der Dinge, die mit RTX IO geliefert werden und seit dem RTX 20 × 0 gefunden wurden, ist eine Echtzeit-Datendekomprimierungseinheit.

Dieses Gerät verwendet die komprimierten Daten als Eingabe von der SSD, führt die Dekomprimierung im laufenden Betrieb durch und sendet die bereits dekomprimierten Daten an den Speicher des Diagramms.

RTX IO-Dekompressor

Das Laufwerk verfügt über eine Datendekomprimierungsgeschwindigkeit, die mit der CPU übereinstimmt. Dies würde eine große Anzahl von Kernen erfordern, um dieselbe bestimmte Aufgabe mit derselben Geschwindigkeit wie der RTX IO-Dekomprimierer auszuführen.

Damit sorgen diejenigen von Huang dank ihrer NVIDIA RTX IO-Technologie für eine bessere Leistung, die es schafft, die Leistungslücke zwischen sehr leistungsstarken CPUs und viel bescheideneren CPUs zu verringern.