Können Sie einen Dienst wie ChatGPT oder Dall-E zu Hause erstellen?

Seit einiger Zeit fügen Grafikkarten immer mehr Fähigkeiten hinzu, die nicht nur über die Erzeugung realistischer Grafiken auf unserem Bildschirm hinausgehen, sondern auch den Aufstieg der künstlichen Intelligenz unterstützen. Dies hat die Erstellung von Diensten über das Internet für die Generierung automatischer Bilder wie z DALL-E oder andere Dienstleistungen wie z ChatGPT. Aber Wie hoch sind die Kosten für die Erstellung eines KI-Dienstes auf Hardwarebasis?

Trotz der Tatsache, dass wir auf dem Gebiet der künstlichen Intelligenz noch einen langen Weg vor uns haben, ist das Erscheinen von Diensten, bei denen es möglich ist, durch die Platzierung einer Reihe von Schlüsselwörtern oder Phrasen eine Textgeschichte zu generieren, oder, falls dies nicht möglich ist, ein Bild, das mehr oder weniger stimmen kann. Und trotz des Ausmaßes an Fehlern, die diese Technologie aufweist, sind viele Menschen davon fasziniert, aber sie sind sich nicht bewusst, dass ein gewisses Maß an Komplexität erforderlich ist und dass es unmöglich ist, es selbst auf dem leistungsstärksten Computer zu emulieren, den Sie mit dem teuersten zusammenbauen können Komponenten, die Sie jetzt finden können.

Können Sie einen Dienst wie ChatGPT oder Dall-E zu Hause erstellen

Wie viel kostet ChatGPT- oder Dall-E-Hardware?

Nun, viele tausend Euro, wenn nicht sogar mehrere zehn Euro, denn die Menge an Daten, die sie verarbeiten, um ihre Arbeit zu erledigen, und die Menge an Energie, die dafür benötigt wird, erfordern Konfigurationen von Dutzenden und sogar Hunderten von Grafikkarten. Nicht nur, um die Antworten aus dem Inferenzalgorithmus zu generieren, mit dem der Benutzer interagiert, sondern auch, um die KI zu trainieren, also die Werte zu lernen und eigene Schlüsse zu ziehen.

NVIDIA DGX Server IA

Die Hardware, die in vielen dieser Fälle verwendet wird, ist die NVIDIA DGX SuperPOD , ein von NVIDIA gebauter Server, der aus Hunderten von Grafikkarten besteht, aber nicht für Spiele, sondern für Hochleistungs-Computing. Denken Sie zum Beispiel daran, dass der Preis für eine NVIDIA H100 uns insgesamt 5,000 Euro kosten kann und wir sogar Modelle haben, die in den fünfstelligen Bereich gehen, das ist viel mehr als das, was ein ständiger Benutzer selbst mit einem i9 für seinen Computer ausgeben wird neuste Generation und heute eine RTX 4090.

Und hoch, dass die Sache damit nicht zu Ende ist. Das Datenvolumen ist so groß, dass es nicht auf eine Grafikkarte passt und es notwendig ist, mehrere davon zu verwenden. Beispielsweise erfordert ChatGPT Teams von 8 Grafikkarten dieses Typs, Kosten von mindestens 40,000 Euro pro Server als Minimum. Und wenn wir über Dall-E sprechen, das Bilder verarbeitet und komplexer ist, dann können die Kosten um mehrere Dutzend in die Höhe schnellen. Wir haben also noch lange Zeit, um so etwas auf heimischer Ebene zu haben, und dafür müssen wir ein ganzes Jahrzehnt warten, um etwas von dieser Kapazität in unserem Heim-PC zu haben.

Speicher ist der größte Engpass, um dies zu erreichen

All dies ist auf die Menge an Informationen zurückzuführen, die der Algorithmus der künstlichen Intelligenz benötigt, um seine Schlussfolgerungen zu ziehen, genau wie es mit dem menschlichen Gehirn geschieht, das Schlussfolgerungen aus den Informationen und dem Wissen zieht, das es hat. Sie müssen also Internetsuchdaten als Grundlage für Ihre Arbeit speichern. Das ist riesig und erzwingt den Einsatz extrem teurer Infrastruktur.

Astronaut Caballo Dall-E GPT

Darüber hinaus sind sie nicht vollständig funktionsfähig. Sie müssen nur bestimmte Abweichungen sehen, die ChatGPT als Antwort auf bestimmte Fragen oder Zeichnungen gibt, die der schlimmsten Alpträume würdig sind, und ohne Sinn, den Dall-E uns manchmal zeigt und von dem wir nicht wissen, wie er konnte zu einem solchen Schluss kommen. Es muss zwar anerkannt werden, dass einige sogar neugierig und rahmenwürdig sind, aber es werden noch viele Jahre vergehen, bis sie keine so hohe Fehlerquote hinsichtlich dessen haben, was sie gefragt werden und was sie zeigen.