Analyse détaillée de l'architecture matérielle du Steam Deck

Architecture matérielle du Steam Deck

La présentation du PC de Valve sous la forme d'une console portable, baptisée le Steam Deck, a pris beaucoup d'entre nous par surprise. Non seulement à cause du fait que ce n'était pas prévu, mais aussi à cause de ce que cela suppose. Pouvoir jouer à des jeux PC n'importe où. Mais à quel point est-il capable ? C'est pourquoi nous avons décidé d'analyser l'architecture.

Qui ne voudrait pas pouvoir jouer à ses jeux PC préférés en déplacement ? Il est vrai que le Nintendo Switch existe pour les jeux haute définition sur ordinateur portable. Mais il faut garder à l'esprit que tous les jeux ne sont pas sur le Nintendo console et il y a des jeux PC que nous aimerions pouvoir emporter partout, que ce soit dans une chambre d'hôtel, notre appartement ou lors d'un long voyage en voiture où nous ne le faisons pas. nous conduisons.

C'est pourquoi nous avons décidé de faire une analyse du matériel Steam Deck, en tenant spécifiquement compte de son utilité. Jeux PC n'importe où ou n'importe où. Nous l'avons donc également pris en compte et nous avons souligné les parties où nous pensons qu'en termes de portabilité, Valve et AMD aurait pu mieux faire.

Van Gogh, la technologie de console de nouvelle génération à grande échelle

AMD Van Gogh Rembrandt

Si nous regardons les deux locaux principaux de l'APU Steam Deck principal, nous constaterons qu'il a un Processeur comprenant Architecture Zen 2 et un GPU avec architecture RDNA 2 , deux points communs avec toutes les consoles de nouvelle génération, mais à plus petite échelle. .

En commençant par le CPU, Steam Deck utilise un Zen 2 4-core CCX , au lieu d'en utiliser 2 comme dans les consoles, c'est donc un Conception à 4 cœurs et 8 fils . Il nous surprend qu'un appareil qui fonctionne sous batterie opte pour le multithreading, mais en même temps il faut tenir compte du fait que le coût énergétique du placement de 8 cœurs est bien plus élevé. Votre vitesse d'horloge ? C'est entre 2.4 GHz et 3.5 GHz . Encore une fois, nous trouvons un autre élément surprenant si l'on considère que nous parlons d'un système conçu pour ne pas être connecté à la prise de courant.

APU Steam Deck

Concernant le GPU, nous avons un RDNA 2 avec 8 unités de calcul , qui se déplace en vitesse entre 1 GHz et 1.6 GHz z, Valve n'a pas parlé de l'utilisation de la technologie SmartShift d'AMD, implémentée dans les RX 5000 et RX 6000 Gaming et dans le PlayStation 5 APU. Mais nous devons prendre en compte le problème de la limitation thermique qui conduit à réduire la vitesse d'horloge du CPU, du GPU ou des deux en même temps et plus dans les appareils à faible consommation.

La façon dont, par exemple, Nintendo le fait avec la Nintendo Switch, c'est en laissant le CPU à 1 GHz et en permettant des variations de la vitesse du GPU. Uniquement aux moments où il y a une transition d'écran, sous la forme d'un fondu noir, ou la lecture d'une vidéo qui ne peut pas être ignorée. Que le processeur Nintendo Switch soit mis à la vitesse maximale pour effectuer la tâche de copie des données de la mémoire flash NAND de la console vers le RAM. où se trouvent les données de niveau suivant. Mais, en général, il est rare que la conception d'un système portable conçu pour offrir des heures de jeu loin de chez soi finisse par lancer des vitesses Boost dans le CPU et le GPU.

Le manque d'Infinity Cache est crucial

Consumo de cache infini Nous ne savons pas si le Steam Deck porte Cache infini ou pas , mais nous pensons que non car cela n'est pas confirmé pour le reste des APU AMD pour le moment et cela semble être une caractéristique unique des GPU dédiés et non des intégrés. mais nous savons à quel point l'Infinity Cache est important en termes de performances. Surtout en raison du fait que les GPU actuels se comportent en rastérisant pour les tuiles. Nous ne parlons pas de rendu de tuile. Le raster de tuiles se trouve sur tous NVIDIA GPU depuis Maxwell sous le nom Tiled Caching et sur tous les GPU AMD depuis Vega sous le nom DSBR.

L'idée est que la partie du pipeline 3D qui va du raster du triangle à celui dessiné dans le tampon d'image se fait comme dans le rendu par tuiles, mais avec une différence. Les tuiles sont stockées dans le cache L2. Ce qui n'est pas de la RAM et ne fonctionne donc pas en tant que tel. Cela signifie que toutes les données qui tombent des lignes de cache L2 se retrouveront directement dans la RAM. Car le cache L2 est directement lié à la bande passante du contrôleur mémoire, qui est bien plus petite avec un GPU intégré et un bus LPDDR128 5 bits. Ainsi, les chances que des données tombent dans la RAM sont beaucoup plus élevées.

Dans RDNA 2 pour PC et uniquement dans la Radeon RX 6000, AMD a ajouté l'Infinity Cache, c'est un niveau de cache supplémentaire qui agit comme Victim Cache, collectant les données supprimées du cache L2 et les adoptant à l'intérieur. L'importance de ceci est que l'accès aux données qui se trouvent dans l'Infinity Cache augmente l'efficacité énergétique en nécessitant moins de pJ / bit pour y accéder. Il est vrai que la LPDDR5 a une consommation inférieure à la GDDR6, puisqu'elle est proche de 4 pJ/bit en moyenne, mais l'ajout de l'Infinity Cache dans l'APU aurait rendu le Steam Deck plus performant.

Le lancer de rayons n'est pas nécessaire, VRS est

Portada de traçage de rayons Vulkan

Étant donné que le GPU intégré est RDNA 2, il prend en charge le lancer de rayons, compte tenu de l'inclusion des unités d'intersection de rayons. Mais le Ray Tracing n'est pas seulement le calcul d'intersection, mais aussi le parcours de l'arbre BVH. Ce qui est fait dans RDNA 2 grâce à l'informatique et croyez-nous que la puissance dans cet aspect dans le cas du Steam Deck n'est pas suffisante.

Un autre sujet est le Variable Rate Shading, qui regroupe les pixels auxquels le Pixel ou le Fragment Shader qui ont à la fois une valeur de couleur et un programme de shader en commun, pour les traiter comme un seul, puis copier les données. Cela donne une performance selon le jeu entre 10% et 30% supplémentaire par rapport à ne pas l'utiliser, à part couper les accès à la VRAM, mortels comme on l'a dit précédemment face à la consommation d'énergie.

La plupart des utilisateurs de Steam Deck utiliseront leur bibliothèque Steam existante, où 99% des jeux ne nécessitent pas de lancer de rayons, ils n'auront pas à se soucier des capacités de lancer de rayons du GPU Steam Deck.

RAM, vitesse, taille et accès sur Steam Deck

Contrôleur de mémoire AMD Ryzen 4000
Dans tous les APU/SoC AMD dont le CPU est issu d'une des générations de l'architecture Zen il y a un élément en commun : la façon dont il y accède. Dans tous les cas, son contrôleur de mémoire unifié, UMC, communique avec la RAM avec un bus 256 bits à la vitesse memclk, qui dans les mémoires DDR et LPDDR est la moitié de son taux de transfert, en l'occurrence 2750 MHz, soit la moitié de 5500. MT/s. La bande passante totale ? 88 Go/s, qui est plus du triple des 25.6 Go/s du SoC Nintendo Switch.

L'UMC a donc été mis à jour par rapport à celui utilisé dans les APU Ryzen 4000 et Ryzen 5000 pour PC, puisqu'il est passé de la prise en charge de 4 canaux LPDDR4 à un dépassement du même nombre de canaux LPDDR5. Il faut prendre en compte qu'à chaque nouvelle génération de tout type de mémoire, la tension est abaissée pour atteindre une vitesse d'horloge, cela permet d'augmenter la vitesse d'horloge et d'avoir une RAM plus rapide et donc avec une plus grande bande passante. Le problème vient de l'efficacité énergétique, qui se mesure en pJ/bit, et on peut dire que l'évolution de cet aspect est en train de reculer.

Étant donné que les watts sont des joules par seconde, nous pouvons facilement extrapoler la bande passante de la RAM en ce qu'elle consomme à chaque seconde. La réponse? Dans le Switch Deck, nous avons un chiffre beaucoup plus élevé que ce que consomme la RAM de la Nintendo Switch, donc dès le départ nous avons déjà le premier problème en termes de conception, la consommation d'énergie de la mémoire est beaucoup plus élevée que celle de sa concurrence directe. , étant l'un des problèmes concernant sa consommation d'énergie et donc la durée de vie de la batterie.

Intensité arithmétique et texturante dans Steam Deck

En informatique, il existe le concept d'octets par FLOP ou d'octets par opération en virgule flottante. Nous l'utilisons pour mesurer l'intensité arithmétique des différents algorithmes lors de leur exécution sur le GPU. Un autre problème à mesurer est ce que nous avons baptisé intensité de texturation, où cela nous aide à vérifier s'il y a un goulot d'étranglement par rapport à la capture de textures par rapport aux GPU à architecture PC RDNA 2.

Pour cela nous avons décidé de prendre l'AMD RX 6700 XT, afin de faire une comparaison au sein d'une même architecture graphique. Le RX 6700 XT d'AMD, pour le comparer avec un autre RDNA 2, a une largeur de 412.8 Go/s et une puissance de 13.21 TFLOPS, ce qui nous donne environ 0.032 octets par FLOP. La puissance GPU maximale du Steam Deck est de 1.6 TFLOPS avec une bande passante de 88 Go/s comme nous l'avons déduit précédemment. Le chiffre qu'on obtient ? 0.055 octet par FLOP , la mémoire n'est donc pas un goulot d'étranglement par rapport à l'AMD RX 6000 de bureau pour les shaders informatiques et le reste des shaders graphiques, à l'exception des shaders Pixel ou Fragment.

Call-of-Duty-Modern Warfare

L'autre problème à mesurer avec l'intensité arithmétique dans le Steam Deck concerne les unités de texturation qui fonctionnent conjointement avec les Pixel Shaders. Sur le RX 6700 XT nous avons un taux de texturation de 413 GTexeles/s. Dans le cas du Steam Deck, nous avons 8 unités de calcul, qui font chacune 32 unités de texture et une vitesse d'horloge maximale de 1.6 GHz, qui se transforme en 51.2 Gtexels / s. taux. En appliquant la même règle des octets par FLOP, nous pouvons mesurer les performances en matière de texturation.

Et qu'obtenons-nous? Sur le RX 6700 XT c'est 0.99, pour ne pas dire une corrélation 1: 1, évidemment la bande passante ne sera pas utilisée pour la texturation. C'est juste un moyen de mesurer l'intensité de la mémoire pour cette tâche. Et qu'en est-il du cas du Steam Deck ? Encore l'intensité de la mémoire est meilleure, étant de 1.71. Donc encore l'équilibre entre le GPU intégré et la bande passante est l'un des points forts. Cela garantit que la mémoire n'est pas un goulot d'étranglement pour les performances graphiques de la console.

La partie sombre, le stockage Steam Deck

Pont à vapeur

La version de base de la console est livrée avec 64 Go eMMC , un chiffre qui semble ridicule et où il sera impossible d'installer quoi que ce soit, il est donc indispensable d'acheter un module M.2 2230 pour l'installer à l'intérieur de la console. Manœuvre qui pourrait annuler la garantie puisque Valve ne recommande pas de jouer avec la console pour cela. Et c'est de là que vient notre première tape sur le poignet à Valve. Puisqu'au moment de la rédaction de cet article, on peut trouver des modules M.2 2230 pour un prix bien inférieur à la différence entre les différents modèles. Donc pour nous il aurait été bien mieux de donner un accès facile via un cache à l'interface M.2.

Mais que faire si nous manquons d'espace et n'avons pas le M.2 SSD installée? Ne vous inquiétez pas, Valve a placé un emplacement pour carte microSD. À première vue, cela semble très bien, mais les performances d'une microSD lors de la transmission de données sont très, très faibles et vous allez voir comment les charges des jeux deviennent éternelles. C'est pourquoi nous vous recommandons de vous diriger d'abord vers un M.2 2230 PCIe et de l'installer ou, à défaut, d'opter pour les deux modules les plus avancés.

SSD du pont Steam

Ce n'est pas seulement à cause du stockage, c'est qu'on parle de multiplier la bande passante plusieurs dizaines de fois et cela signifie que l'appareil en devient directement un autre en termes de performances. Cependant, sans oublier que le Steam Deck est conçu pour être un ordinateur portable on est surpris par le choix de ce type de stockage. Un SSD NVMe est la meilleure vitesse d'accès à la mémoire que vous pouvez mettre dans un système, c'est vrai.

Est-ce le meilleur dans un système portable ? Pas vraiment, car la mémoire eUFS 3.x aurait eu plus de sens, car cela n'a aucun sens d'utiliser un NVMe PCIe si les jeux que la machine du catalogue PC pourront exécuter sans problèmes de performances d'aucune sorte ce sont ceux-là qui ne profitent pas bien des avantages. D'ici à la sortie des jeux qui tirent parti des SSD NVMe sur PC, le Steam Deck sera potentiellement obsolète pour les exécuter à une vitesse décente.

Et maintenant pour finir l'écran

Pont de vapeur Pantalla

Pour beaucoup, l'inclusion d'un écran à 800p et au format 16:10 semblera un retour en arrière, mais ce n'est pas le cas si l'on prend en compte les coûts associés en termes de bande passante et de besoins informatiques qui ont des résolutions plus élevées. .

Un point négatif est que l'écran n'est pas OLED, puisque ce type d'écrans consomme moins et le problème de gravure des pixels ne devrait pas être un problème dans un système de jeu vidéo. Tenant compte du fait que Nintendo l'a adopté dans le nouveau modèle Switch et que ceux de Kyoto mettent des années à adopter une technologie et quand ils le font, c'est à un prix avantageux. L'inclusion d'un écran OLED par Valve pour son Steam Deck aurait été une meilleure option et non, nous ne disons pas que l'écran est mauvais, mais nous parlons sous le concept de consommation d'énergie qui est important pour un système portable.

Dans tous les cas, il a une résolution suffisante pour donner une bonne qualité d'image et de bonnes performances, puisque Valve garantit que tous les jeux de son catalogue fonctionnent avec une fréquence d'images minimale de 30, ce qui n'est pas idéal pour tous les jeux.