Kommt wegen KI eine neue Grafikkartenknappheit?

Die Nachfrage nach KI-Hardware ist im vergangenen Jahr exponentiell gewachsen, insbesondere nach GPUs. Dies lässt uns fragen, ob wir a sehen werden Grafikkartenmangel wieder wie der Bergbau vor nicht allzu langer Zeit. Es noch schlimmer machen, NVIDIA hat in seinen AGB Produkte zur Versorgung dieses Marktes vorgestellt, was viele fragen lässt, ob der Albtraum zurückkehren wird.

Wie jeden März veranstaltet NVIDIA seine eigene Konferenz, die GTC, die sich auf die Welt der künstlichen Intelligenz und des Supercomputing konzentriert. Darin präsentieren sie nichts für PC, sondern Produkte und Dienstleistungen in Form von Software und Hardware rund um KI und für verschiedene Branchen. Der Boom von Anwendungen wie ChatGPT, Stable Diffusion und vielen mehr, die auf großen Sprachmodellen und der Generierung von Bildern aus Text basieren, hat die Nachfrage in dieser Hinsicht jedoch wachsen lassen. Und natürlich müssen die von Jen Hsen Huang in irgendeiner Weise davon profitieren. Was uns jedoch wichtig ist, ist, wie es uns betrifft, und zu sehen, ob wir wieder einen Mangel an Grafikkarten erleben werden.

Fassen Sie beliebige Texte mit der KI von Google Docs zusammen

NVIDIA springt auf den ChatGPT-Zug auf und bringt seine Dual-Grafikkarte in die Jahre

Wir haben Ihnen kürzlich mitgeteilt, dass NVIDIA versuchen wird, aus dem neuen KI-Boom mit zwei offensichtlichen Elementen Kapital zu schlagen. Zum einen der Verkauf von Grafikkarten, damit große Unternehmen und Verwaltungen eigene Server aufstellen können, um Dienste auf Basis von Deep oder Machine Learning bereitzustellen oder zu nutzen. Zum anderen die Schaffung von Servern in der Cloud ihrerseits, damit kleine und mittelständische Unternehmen auf diese Ressourcen zugreifen können.

Nun, bzw. und im ersten Fall haben sie ihre vorgestellt NVIDIA H100 NVL Dual , das aus zwei Grafikkarten besteht, die über NVLink miteinander verbunden sind. Sie basieren nicht auf der gleichen Architektur wie die RTX 40, sondern auf der für den Supercomputing-Markt konzipierten H100. Seine Besonderheit ist, dass die Menge an VRAM, die sie insgesamt haben, 188 GB des Typs HBM3 beträgt, was bedeutet, dass das System 2 GB pro reserviert GPU für bestimmte Aufgaben. Ihr Zielmarkt? Eines der großen Sprachmodelle im ChatGPT-Stil.

Das zweite Produkt ist es NVIDIA DGX Cloud , ein Supercomputing-Cloud-Dienst, der Zugriff auf NVIDIA-Server gewährt, um die Leistung seiner GPUs für KI-zentrierte Anwendungen nutzen zu können. Diese Server basieren auf Microsoft Azure und Google Cloud. Die Idee ist, dass jedes kleine und mittlere Unternehmen solche Server mieten kann.

Tarjetas Grafik NVIDIA H100 NVL Dual

Wird es einen Mangel an Gaming-Grafikkarten geben?

Wie Sie sehen können, verschiebt NVIDIA seine Standard-RTX 40 nicht in Richtung KI-Markt, sondern verwendet stattdessen seinen anderen Chip, den H100. Natürlich müssen wir davon ausgehen, dass sowohl die neueste GeForce für PCs als auch dieser leistungsstarke Chip von denselben Herstellern stammen, die den N4-Knoten von TSMC verwenden. Daher wird die Nachfrage nach einem theoretisch die Nachfrage nach einem anderen beeinflussen, aber wir müssen eine Reihe wichtiger Punkte berücksichtigen:

  • Die Margen der H100-Grafikkarten sind erheblich höher, sogar als eine RTX 40, was es für eine von NVIDIAs HPC-Grafikkarten der nächsten Generation kostet, ist fast das Zehnfache dessen, was Sie für eine RTX 10 bezahlen.
  • Trotz steigender Nachfrage wird sie nicht so groß sein wie beim Mining. Gaming-Grafikkarten sind also sicher.

Wir müssen jedoch berücksichtigen, dass der H100-Chip ziemlich groß ist, was bedeutet, dass nur wenige Einheiten pro Wafer herauskommen und die Ausfallrate ziemlich hoch ist. Auf jeden Fall werden sie von großen multinationalen Unternehmen, die diese Art von Hardware kaufen können, enorm nachgefragt. Denken Sie nur, dass für ChatGPT 3 10,000 Grafikkarten für das KI-Training benötigt wurden, wir wissen nicht, wie viele es für die neue Version sein werden, aber um ein Vielfaches mehr sicher als ja. Und sie werden nicht die einzigen sein, die nach dieser Hardware gefragt sind. Auf jeden Fall werden wir sehen, ob TSMC und NVIDIA die Kapazität haben, diese Nachfrage zu unterstützen, ohne ihren älteren Markt zu beeinträchtigen, obwohl er heute weniger lukrativ ist.