Fabric Attached Memory, Speicher, der kein RAM oder Cache in der CPU ist

Fabric Attached Memory

Fortschritte in der Computerarchitektur bringen nicht nur Verbesserungen bei den Prozessoren, sondern auch bei den verwendeten Speichern und oft werden neue Arten von Hardware geschaffen. Einer davon ist Fabric Attached Memory, eine Art von RAM das ist Teil des neuen Paradigmas der In-Memory-Verarbeitung. Was ist das und welche Eigenschaften hat diese Art von Gedächtnis?

Vor Beginn muss klargestellt werden, dass Sie zum Zeitpunkt der Erstellung dieses Artikels den Fabric Attached Memory auf keinem PC auf dem Markt finden, auch wenn es sich um eine HEDT-Workstation handelt. Der Grund? Einfach gesagt, FAM ist ein Speichertyp, der sich auf High Performance Computing oder HPC bezieht. Das Ziel der Entwicklung dieser Art von Gedächtnis? Es ist sehr wichtig, die Rechenleistung des ExaFLOP und an dieser Stelle die Speicherarchitektur der Systeme zu übertreffen.

Was ist Fabric Attached Memory?

Fabric Attached Memory

Unter Fabric Attached Memory (FAM) oder FAM verstehen wir einen Speichertyp, auf den von einem oder mehreren Prozessoren zugegriffen werden kann, die vom gleichen Typ oder von einem anderen Typ sein können. Wie unterscheidet es sich von herkömmlichen Erinnerungen? Da der Zugriff über eine Netzschnittstelle möglich ist und sich die Interconnection-Infrastrukturen zu den sog Netzwerk on a Chip kann man sagen, dass dieser mit der Schnittstelle verbundene Speicher der Schlüssel zur Beschleunigung von Prozessen in den CPUs und GPUs der Zukunft ist.

Wenn wir über RAM sprechen, denken wir normalerweise an Speicher außerhalb des Prozessors, der auf separaten Chips montiert ist und über eine Schnittstelle zugegriffen wird. Unter dieser Definition können wir denken, dass wir die 3DIC-Schaltungen mit vertikal verbundenem Speicher als FAM definieren können, aber das FAM ist, wie der Name schon sagt, ein Speicher, der direkt mit dem verbunden ist, was wir „Fabric“ nennen. Und was meinen wir mit diesem Namen? Was ist die Northbridge, das ist das Element, das die verschiedenen Prozessoren miteinander und diese mit dem RAM kommuniziert.

Nun, der Fabric Attached Memory befindet sich in der Northbridge und damit vor dem RAM, daher der Name.

Das Scratchpad-Speicherkonzept

Cache-Mikroskop

Wenn wir von Scratchpad-Speicher sprechen, sprechen wir von einem alternativen Arbeitsspeicher, der sich hinsichtlich seiner Adressierung vom herkömmlichen Speicher unterscheidet. Dies bedeutet, dass jedes System mit einem Scratchpad-Speicher zwei Datenerfassungssysteme benötigt. . Natürlich haben wir vergessen zu erwähnen, dass sich der Scratchpad-Speicher normalerweise nicht außerhalb des Prozessors befindet, sondern im Inneren des Prozessors. Was eine Reihe von Vorteilen hat:

  • Programme, die innerhalb des Scratchpad-Speichers laufen, laufen aufgrund des geringen Abstands zum Prozessor schneller und bei geringerem Stromverbrauch.
  • Aufgrund seiner Nähe zum Prozessor wird kein Cache-System verwendet, um auf diesen Speicher zuzugreifen.

Diese Art von Speicher wird seit Jahrzehnten verwendet und heute finden wir sie in den Shader-Einheiten von GPUs, sie sind also keine Neuheit. Wie hängt es mit Fabric Attached Memory zusammen? Nun, die Tatsache, dass das FAM eine Art Scratchpad-Speicher ist, aber die Verwendung einer Netzwerkschnittstelle zur Kommunikation macht es in seinem Zugriff völlig anders.

Der Fabric Attached Memory ist eine Ebene vor der Hierarchie in Bezug auf RAM, aber sein Zugriff erfolgt wie in einem NoC, wo die verschiedenen Elemente als miteinander verbundenes Netzwerk mit dem NoC im zentralen Teil arbeiten und jedes Element Ihren Router hat . Das heißt, um auf das FAM zuzugreifen, muss nur seine Netzwerkadresse aufgerufen werden, und dies können alle Elemente des Systems tun.

Speicher ist der größte Engpass bei der Verarbeitung

Evolución cuello botella memoria

Im idealen System hätte der Speicher genügend Reaktionszeit, damit die Verarbeitung der Befehle mit der höchstmöglichen Geschwindigkeit erfolgt. Leider hat die Entwicklung des Speichers nicht mit der Entwicklung der Prozessoren Schritt gehalten und ist zu einer Belastung geworden, die es notwendig gemacht hat, Lösungen für diese Probleme zu finden.

Es gibt zwei Gründe, warum Speicher keine Geschwindigkeit erreichen kann, aber der Hauptgrund ist, dass wir keine großen Speichermengen in einen Prozessor stecken können und daher außerhalb davon auf einem anderen Chip untergebracht werden müssen. Die zweite wird mit folgender Frage beantwortet: Was passiert mit den elektrischen Signalen, wenn der Leitungsabstand vergrößert wird? Ihr Energieverbrauch wächst. Und genau hier kommt der Fabric Attached Memory voll zum Tragen, da er als Speicher in der Nähe der Verarbeitungseinheiten hohe Bandbreiten ohne hohen Verbrauch erreichen kann.

Fabric Attached Memory Multiprozessor

Aber der Fabric Attached Memory ist nicht nur der Schlüssel zur Kommunikation von Elementen innerhalb desselben Prozessors, sondern auch verschiedener Prozessoren miteinander. Wenn wir beispielsweise mehrere SoCs haben, die regelmäßig kommunizieren müssen, schreiben sie die Daten normalerweise in den von allen geteilten RAM sie, damit es später wiederhergestellt wird. vom gleichen RAM durch den Rest der Prozessoren, um mit der Arbeit fortzufahren. Beim Fabric Attached Memory ist es nicht erforderlich, dass die Prozessoren auf den RAM zugreifen, da die Daten in den Fabric Attached Memory geschrieben werden können, der sich auf einer Ebene der Hierarchie zwischen dem letzten Cache der verschiedenen Prozessoren und der Schnittstelle befindet. in den RAM von jedem von ihnen.

Das FAM ist Teil der Zukunft im PC

CPU-Chiplets CPU GPU AMD Intel

Am Anfang des Artikels haben wir die Aussage gemacht, die diesen Abschnitt betitelt, aber jede Aussage ist immer noch eine Antwort auf eine Frage, die auf einen Grund antwortet. Und das ist nichts anderes, als bei herkömmlichen PCs die Menge an FAM, die im Prozessor verwendet werden muss, begrenzt wäre. Die beste Lösung ist also ein Chiplet-basiertes System, bei dem die Northbridge vom Rest des Systems getrennt ist, wie dies der Fall ist AMDRyzen 3000 und Ryzen 5000 CPUs.

Der FAM muss von Natur aus innerhalb der Speicherhierarchie mehr Kapazität haben als der schnellste Cache, aber weniger als der RAM-Speicher. Bei der Northbridge auf einem separaten Chip ist es möglich, den Fabric Attached Memory darin zu integrieren, auf einem 2D-Chip ist dies jedoch schwierig. Andererseits ist es ein 3D-Chip, der aus mehreren Ebenen besteht, mit der Northbridge des Systems auf einer Ebene und dem FAM-Speicher auf der anderen. Dadurch wird ein Großteil der Prozesse und sogar Threads, die die Prozessoren parallel und koordiniert ausführen, beschleunigt und der enorme Engpass des herkömmlichen Arbeitsspeichers vermieden.

Es gibt eine große Anzahl von Anwendungen, deren Leistung nicht aufgrund mangelnder Verarbeitungsgeschwindigkeit, sondern aufgrund fehlender Speichergeschwindigkeit belastet wurde. Die Platzierung eines Speichers deutlich näher am Prozessor lindert viele dieser Probleme und mit dem Sprung zu Chiplet-basierten Prozessoren, bei denen ein einzelner Prozessor in mehrere Teile zerlegt wird und die Verwendung neuer Verpackungssysteme seine Implementierung im PC ermöglicht.