Fonctions FG-DRAM et VRAM des futurs GPU NVIDIA

Caractéristiques FG-DRAM, VRAM

Le FG-DRAM est l'un des développements qui NVIDIA a dans la chambre à coucher dans le futur, c'est un nouveau type de mémoire qui vient remplacer le HBM2 comme mémoire pour le calcul haute performance. Verrons-nous ce type de RAM dans le NVIDIA Tesla avec chipset NVIDIA Hooper? On ne sait pas, mais pour le moment on fait une petite introduction.

Habituellement, la façon dont la RAM conventionnelle a évolué a été de tirer parti des nouveaux nœuds de fabrication pour obtenir une mémoire plus rapide, en bande passante, sous le même niveau de consommation, mais avec des résultats assez doux.

Pour vous expliquer quel est le problème de l'évolution de la RAM en ce qui concerne ses performances, sa bande passante, imaginez que nous ayons une interface qui transmet 1 Go / s, qui a environ 64 broches et que nous voulons l'étendre pour supporter 2 Go / s, pour eux, nous avons deux options:

  • Doublez la vitesse de l'horloge.
  • Doublez le nombre de broches.

L'augmentation de la vitesse d'horloge pose le problème que la consommation augmente de manière exponentielle avec la vitesse d'horloge et la tension et le pire est que pour atteindre certaines vitesses d'horloge, la tension doit augmenter, de sorte que l'augmentation de la consommation ne serait pas 4 fois plus élevée, mais encore plus élevée de sorte que nous pouvons manquer d'assez d'énergie pour alimenter la mémoire.

L'autre option est d'augmenter le nombre de broches, cela signifie que de moins en moins de vitesse d'horloge est nécessaire, réduisant ainsi la tension et la consommation d'énergie. Mais le problème que cela implique est qu'il s'agit d'élargir le périmètre de la puce, donc cela augmente son coût, donc bien qu'il ait une meilleure solution de consommation, ce n'est pas meilleur en termes de coût.

Rendu HBM Interposer

Mais la solution à ce dilemme est venue par le biais du silicium, pour connecter les interfaces de mémoire verticalement sur l'interposeur dans lequel le processeur et la mémoire étaient connectés, avec cela la mémoire HBM est née, ce qui a permis d'énormes bandes passantes, mais avec beaucoup moins consommation d'énergie.

Mais le temps passe et la mémoire HBM manque de capacités car un nouveau type de mémoire est nécessaire avec une consommation d'énergie beaucoup plus faible. C'est pourquoi tous les regards sont tournés vers d'autres types de souvenirs tels que la DRAM à grain fin.

Qu'est-ce que le FG-DRAM?

FG-DRAM

En 2017, NVIDIA a fait une présentation pour parler d'un type de DRAM appelé FG-DRAM ou Fine Grained DRAM comme proposition de remplacement du HBM2, qui est utilisé dans les cartes NVIDIA Tesla depuis le Tesla P100

Le FG-DRAM comme le HBM2 est une mémoire de type 2.5DIC avec le processeur (ou les processeurs) au-dessus d'un inteposer à côté des piles de mémoire. Son point fort? Il a la particularité de passer de 3.9 Pj / bit de la mémoire HBM2 à 2 Pj / bit, donc il peut offrir deux fois la bande passante sous la même consommation que le HBM2.

De HBM2 à FG-DRAM

FG-DRAM contre HBM2 Une façon de faire évoluer le HBM2 est d'accepter simplement les configurations avec une bande passante plus élevée, en plaçant un plus grand nombre de puces dans la pile, le problème est que comme nous plaçons de plus en plus de puces, les probabilités que toute la batterie tourne mal, elles se déclenchent. , c'est la raison pour laquelle nous ne voyons pas de mémoire HBM2 avec plus de 4 puces mémoire par batterie.

Mais la DRAM Fine Grained emprunte un chemin différent de ce qui a été proposé avec le HBM 3 afin d'obtenir une pile avec une bande passante de 1 To / s. Pour ce faire, l'idée est d'augmenter le nombre de banques dans chaque puce mémoire, jusqu'à un total de 512 banques simultanées, accessibles à une vitesse de 2 Go / s chacune.

Consommation d'énergie FGDRAM

Grâce à cela. La pile de mémoire FG-DRAM est accessible à 1 To / s pour deux fois la consommation d'énergie du HBM2 à 256 Go / s . Mais comme vous obtenez quatre fois la bande passante, cela signifie que la consommation par bit transmis est divisée par deux .