Innosilicon Fantasy I: Architektur und Funktionen

Wenn wir über GPUs in PCs sprechen, nennen wir normalerweise drei amerikanische Unternehmen: AMD, NVIDIA und in geringerem Maße Intel. Was würde passieren, wenn wir Ihnen mitteilen würden, dass in China Grafikkarten auf den Markt kommen, die britische Technologie verwenden? GPU, aber in China montiert und hergestellt? In diesem Artikel beschreiben wir die Architektur des Innosilicon Fantasy I.

Innosilicon Fantasy I

Über die PowerVR-Architekturen von Imagination zu sprechen, ist fast so, als würde man über eine griechische Tragödie sprechen. Seit seiner Einführung und über verschiedene Generationen hinweg haben wir es auf verschiedenen Systemen wie dem SEGA Dreamcast, den KYRO-Grafikkarten von ST Micro und sogar dem gesehen Playstation Vita. Ihr gemeinsamer Punkt? Authentische kommerzielle Misserfolge trotz der hohen Qualität seiner GPU. Sie hatten jedoch das Glück, die Grafikarchitektur der Prozessoren auszuschalten Apple Geräte, bis sich die aus Cupertino entschieden, für eine Weile auf eigene Faust zu gehen und ihre eigene Grafikarchitektur zu „designen“.

Imagination Technologies Fantasy I PowerVR

Die Zeit der Meinungsverschiedenheiten zwischen Apple und Imagination veranlasste die Briten erneut, ihre Grafikarchitekturen an Dritte zu lizenzieren. Wenn wir uns derzeit das Panorama sowohl in Smart Devices als auch in der PC-Welt ansehen, werden wir sehen, wie Imagination und sein PowerVR verschwunden zu sein scheinen.

Seine Abwesenheit in der Android Welt wurde von anderen Teilnehmern ausgenutzt, wie z ARM sich mit Mali oder Qualcomm mit seinem Adreno. Das hat sie auf andere Märkte verlagert, wie etwa der chinesische Hersteller Innosilicon, berühmt für seine ASICs fürs Mining, der vor kurzem seine Fantasy 1 präsentierte. Es ist die erste Grafikkarte auf PowerVR-Basis seit den frühen Kyro-2000er-Jahren , aber können sie im PC-Bereich gegen NVIDIA und AMD antreten?

Was ist gekacheltes Rendering?

In den späten 1990er Jahren mussten Entwickler von Grafikkarten mit einem weit verbreiteten Problem, mangelnder Bandbreite, um Leistung kämpfen. Grafikprozessoren waren im Vergleich zu heute sehr einfach. Der erste Teil der 3D-Pipeline vor der Rasterung wurde von berechnet CPU. Den zweiten Teil des Wandels übernahm die Grafikkarte, die große Mengen an Bandbreite benötigte, die der damalige Speicher nicht ohne explodierende Kosten bereitstellen konnte.

Fliesen-Rendeirng-Pipeline

Die von Imagination vorgeschlagene Lösung war das Rendering von Tiles, das nach wie vor die Grundlage seiner Architektur darstellt, sodass auch heute noch der Fantasy I, sobald die Geometrie in der GPU selbst berechnet wurde, zusätzliche Stufen im Vergleich zu einer herkömmlichen GPU hinzugefügt werden. Ein Tile Renderer sortiert die Position der Geometrie ein RAM basierend auf seiner Position in der Szene unmittelbar vor dem Rastern, um individuelle Anzeigelisten für jede Kachel zu erstellen, die dann während des Rendering-Prozesses einzeln aufgelöst werden.

Vorteile

Aufgrund der geringen Größe jedes Blocks oder Tiles kann dies gelöst werden, ohne auf den VRAM zugreifen zu müssen, da sie dafür internen Speicher verwenden. Dies macht es auch ideal für Lazy Rendering, das oft mehrere Bildpuffer verwendet, um die Beleuchtung der Szene zu berechnen. Ein weiterer Vorteil besteht darin, dass es einfacher ist, Raytracing in dieser Art von Architektur zu implementieren, da die Kenntnis der Position der Elemente in der Szene für die Generierung der räumlichen Datenstruktur für Raytracing unerlässlich ist.

Nachteile

Dies hat jedoch zwei Nachteile. Der erste ist, dass komplexere Hardware als eine herkömmliche GPU erforderlich ist, um die gleiche Leistung zu erzielen, und daher erhalten wir für einen Chip gleicher Größe immer eine geringere Leistung. Der zweite ist, dass die Existenz von Speicher mit hoher Geschwindigkeit wie GDDR oder HBM eliminiert seinen Vorteil in einem Gaming-PC. Aus diesem Grund hat sich diese Art von Architektur in Pocket-Geräten durchgesetzt, wo die Speicherbandbreite aus Verbrauchsgründen begrenzt ist.

PowerVR B-Serie, die Grafikarchitektur von Fantasy I

Um die Architektur von Innosilicons Fantasy-I-Grafikkarten zu verstehen, und übrigens auch, was in Apples Prozessoren für seine Geräte steckt, müssen wir einen Rundgang durch die aktuelle Architektur von Imagination machen, und obwohl wir wissen, dass sie kürzlich vorgestellt wurde, auch die C-Serie bekannt als Photon, im Moment verwenden die fortschrittlichsten Geräte die B-Serie von Imagination als Architektur.

Innosilicon Fantasy I-GPU

Das Herzstück der B-Serie

Die Organisation jedes dieser Kerne ist wie folgt:

Innosilicon Fantasy I PowerVR

  • Vier USC-Blöcke, Unified Shader Cluster, wobei jeder bis zu 128 ALUs in FP32 für insgesamt 512 pro Kern hat. Angesichts der Fähigkeit, einen Additions- und Multiplikationsbefehl in einem einzigen Taktzyklus auszuführen, ist er in der Lage, 1024 Operationen pro Taktzyklus auszuführen.
  • 8 Textureinheiten, die jeweils 4 Texel produzieren können, also insgesamt 32.
  • 16 ROPS.
  • 1 Tessellationseinheit.
  • 1 Rastereinheit.

Jeder der Kerne ist unabhängig vom Rest ausschließlich für eine Kachel oder einen Block auf dem Bildschirm zuständig. Daher hat jeder von ihnen seine eigenen Raster- und Tessellationseinheiten. Zusätzlich zum Tragen eines kleinen internen Speichers, um den darin enthaltenen Bildpuffer aufzulösen und die Auswirkungen auf den System-RAM zu reduzieren. Dieser Speicher wird jedoch ausschließlich für den ROPS verwendet, und trotz der Vorteile der GPU ist es aufgrund der heute verwendeten riesigen Texturkarten erforderlich, auf das VRAM zuzugreifen, um die Texturdaten zu erhalten.

Fantasy I, die erste Chiplet-GPU

Die große Neuheit der in Fantasy I verwendeten Imagination B-Serie ist die Tatsache, dass sie die erste GPU ist, die aus Chiplets besteht, also aus verschiedenen Chips, die als ein einziger Prozessor zusammenarbeiten. Dazu wird die Bildschirmliste an das erste der vier Chiplets gesendet, aus denen die GPU besteht, während die anderen drei untergeordnet sind. Es ist eine Lösung, die der von AMD in Patenten mit RDNA 3 vorgeschlagenen sehr ähnlich ist und die in Zukunft sicherlich bei allen GPUs dieses Typs üblich sein wird.

Diese Lösung unterscheidet sich jedoch in einem bestimmten Punkt, der Verwendung des Renderns durch Kacheln, um das durchzuführen, was vorab gerendert wird, und um mehrere Bildschirmlisten nicht vor dem Rastern, sondern ab Beginn der 3D-Pipeline haben zu können. Das Konzept ist nichts anderes als das Rendern der Szene ohne Shader oder Texturen jeglicher Art und aus der Rechenpipeline und nicht aus der Grafik. Auf diese Weise können Sie mehrere Befehlslisten organisieren und nicht nur eine, mit der Sie die große Anzahl von Kernen während des Vorab-Renderings ausnutzen können. Dieser Vorgang wird automatisch durchgeführt, sobald der Befehlsprozessor der ersten GPU die Bildschirmliste gelesen hat.

Dies ermöglicht es uns, mehrere Bildschirmlisten für dieselbe Szene zu haben, die von den verschiedenen Kernen organisiert werden können. So wird erreicht, dass bei einer Konfiguration von 2 Chiplets jeweils eine Hälfte des Bildschirms zuständig ist, bei 4 davon sind sie in einem Viertel verteilt.

Was hat Innosilicon zu Ihrer Grafikkarte gebracht?

Allerdings wurde nicht die gesamte Arbeit von den Leuten von Imagination geleistet, aber Innosilicon war derjenige, der den Rest der Grafikkarte entworfen, das PCB-Design hinzugefügt und den Rest der Materialien ausgewählt hat. Was am meisten auffällt, ist die Verwendung von GDDR6- oder GDDR6X-Speichern je nach zu verwendendem Modell, die Unterstützung von DisplayPort 1.5 und HDMI 2.1, aber insbesondere die Verwendung seiner Innolink-Technologie, die entwickelt wurde, um die vier Chiplets intern zu kommunizieren das bilden einen Teil der GPU.

Innolink Chiplets Fantasy I

Konkret haben wir zwei unterschiedliche Varianten, die Typ-A-Anrufe erreichen können 5 TFLOPS Leistung in FP32 , es hat eine Speicherschnittstelle mit dem 128-Bit-GDDR6X-VRAM bei 19 Gbit / s mit einer Bandbreite von 304 GB / s. Typ B hingegen hat zwei vollständige GPUs und besteht daher aus insgesamt 8 Chiplets und doppelt so vielen

Innosilicon Fantasy I ist nichts für Ihren PC

Die Realität ist, dass Sie die Fantasy I-Grafikkarten von Innosilicon nicht kaufen können, um sie in Ihrem Gaming-PC zu verwenden, und Sie würden auch nicht daran interessiert sein, da Imagination seine Architekturen für Taschengeräte entwickelt Windows ist nicht das dominierende Betriebssystem und DirectX auch nicht, denn wir finden eine Reihe von Mängeln. Es macht keinen Sinn, Ihrer Hardware Funktionen hinzuzufügen, die Ihr Client nicht verwenden wird, und der größte Client dieser GPUs, wenn auch im Verborgenen, ist Apple und insbesondere seine Metal-API.

Tarjetas Graficas Innosilicon

Ironischerweise ist PowerVR so an Metal gebunden, die API, die in verwendet wird iOS, macOS und den Rest von Apples Betriebssystemen, dass die Leute von Tim Cook am Ende eine Vereinbarung mit Imagination unterzeichnet haben, damit sie die in ihre Prozessoren integrierte GPU weiter entwickeln können. Im aktuellen Apple A15, M1 und seinen Pro- und Max-Varianten steckt also ein PowerVR drin. Das Gegenstück dazu ist, dass die aus Cupertino die allgemeine Idee geschaffen haben, dass sie so allmächtig sind, dass sie die gesamte Hardware in einem System erstellen und mit der ganzen Welt um Ressourcen konkurrieren können. Die Realität sieht ganz anders aus.

Die Tatsache, dass eine aus 4 Chiplets bestehende GPU 6 TFLOPS erreicht, wenn der Eingangsbereich für den PC bereits erreicht ist, mag uns überraschen, aber wir müssen bedenken, dass es sich um ein Design handelt, das für mobile Prozessoren entwickelt wurde, jedoch mit dem Ziel, Cloud Computing zu erreichen und nicht in einem Gaming-PC verwendet werden.

Entwickelt für Rechenzentren und Cloud Computing

Vergessen wir nicht, dass es bei Servern normal ist, mehrere Prozessoren zu verwenden, und dass wir immer mehr Server haben, die auf Smartphone-Prozessoren basieren. Wir können auch nicht die Tendenz vergessen, eine Grafikkarte in der Cloud für mehrere Clients zu virtualisieren. Das Fantasy I erfordert von Natur aus keine Virtualisierung, jedes der Chiplets, aus denen es besteht, kann als kleine GPU arbeiten.

ARM-Server

Wir haben also eine Architektur, die sich von Mobiltelefonen ableitet und bis zu Rechenzentren skaliert, aber ohne die Nachbarschaft zu durchlaufen, die der PC ist. Damit fehlen ihm eine Reihe von Features, die heute für PC-Spiele unverzichtbar sind. Deshalb sind sie trotz der Tatsache, dass das Aussehen der Fantasy I vielleicht an das einer Gaming-GPU erinnert oder mit diesen Farben nicht seriös aussieht, wirklich für Cloud-Computing, obwohl es sich um eine erste Generation handelt. Stehen wir vor der Zukunft, in der die Grafikkarte nicht in den Händen des Benutzers, sondern im Server liegt?

In jedem Fall muss China als rivalisierende Supermacht der Vereinigten Staaten aus technologischer Sicht völlig unabhängig sein, und das bedeutet, eigene Lösungen außerhalb der klassischen Lösungen von NVIDIA, Intel und AMD zu entwickeln, an die wir uns erinnern, amerikanische Unternehmen.