Computex: Nvidia: Keine Produkte mehr für Menschen

vor 1 Tag 1

Nach der Computex-Keynote könnte man tatsächlich denken, Nvidia hätte den Kontakt mit der Realität verloren. c’t 3003 hört genauer hin.

Transkript des Videos

(Hinweis: Dieses Transkript ist für Menschen gedacht, die das Video oben nicht schauen können oder wollen. Der Text gibt nicht alle Informationen der Bildspur wieder.)

Guckt mal hier, so ehrlich wie Nvidia hier auf der Computex habe ich noch nie eine Firma über KI reden gehört (Übersetzungen von uns): „Rechenleistung ist jetzt Umsatz. Rechenleistung ist Gewinn. Das Fehlen von Umsatz und Gewinn ist Verlust.“ Menschen? Unwichtig. Es geht um Agenten. „Früher haben wir CPUs für Menschen gebaut. Diese CPU ist für Agenten gebaut.“ Inhalte? Unwichtig. Es geht um Tokens und um Profit. „Tokens sind jetzt profitable Einheiten.“ Profit? „Jeder Token ist profitabel.“ Profit. „Rechenleistung ist Umsatz. Leistung pro Watt ist euer Umsatz.“

Also, zusammengefasst: Die Tokens, die da dank ganz viel Compute hinten rauskommen, bei denen geht es nicht darum, ob man etwas Sinnvolles damit macht, sondern es geht nur darum, dass sie Profit generieren. „Das ist ganz genau der Grund, warum ihr alle so beschäft seid und eure Firmen so gut laufen. Tatsächlich sieht das so aus wie manch einer eurer Aktienkurse.“

Also ich weiß nicht, wie euch das geht, aber mit meiner Realität hat das gar nichts zu tun. Was ich hier auf der Computex stattdessen sehe: Der klassische PC-Markt liegt ziemlich am Boden, woran Nvidia nicht ganz unschuldig ist, weil alle der kompletten „KI macht euch alle reich“-Psychose verfallen sind und ein KI-Rechenzentrum nach dem anderen aus dem Boden gestampft wird.

Und weil die Komponentenhersteller da mehr Geld verdienen können, geht halt der Speicher vor allem in die KI-Rechenzentren. Und das führt dann dazu, dass eine vier Jahre alte PC-Konsole nicht billiger wird, wie sonst immer in der Technikgeschichte, sondern teurer. Und zwar viel teurer, gleich mehrere hundert Euro. Und AMD bringt sogar wieder Prozessoren für zehn Jahre alte AM4-Plattform raus, damit man den alten DDR4-Speicher halt weiter benutzen kann, statt viel zu teuren neuen zu kaufen.

So, und jetzt kommt das Krasseste. Also man kann ja durchaus sagen, dass Nvidia den Personal-Computer-Markt so richtig ins Taumeln gebracht hat. Und dann kommt jetzt Nvidia auch noch um die Ecke und sagt: „Hey, der alte PC, der ist tot! Jetzt gibt’s von uns den neuen PC.“ „Das wird der neue PC sein. Über die letzten drei Jahre, so lange hat es gedauert, um den PC komplett neu zu erfinden.“ Personal AI PC. Da könnt ihr eure Tokens sogar selbst generieren, dank RTX Spark. Und da ist Microsoft mit im Boot und da sind wirklich alle großen PC-Hersteller mit dabei.

Ok, also ich glaube, hier gibt es von mir jetzt viel journalistisch auseinanderzunehmen. Bleibt dran.

Liebe Hackerinnen, liebe Internet-Surfer, herzlich willkommen hier bei ...

Nvidias verstörende Präsentation auf der Computex

Okay, was ist passiert? Zur Computex in Taiwan, der größten Computermesse der Welt, auf der ich auch zum ersten Mal unterwegs bin, hat Nvidia die Eröffnungspräsentation gehalten. Zwei Stunden lang. Man muss auch vielleicht dazu sagen, dass der Nvidia-Gründer Jensen Huang hier in Taiwan so etwas wie ein Volksheld ist. An jedem Imbissstand, wo er mal etwas gegessen hat, da scheinen Fotos von ihm zu hängen. Also zumindest schien mir das so. Ja, und es gab im Rahmen der Computex auch, also sagt Chairman Huang ganz stolz, 70 Keynote-Guckpartys, wo eben sein Vortrag übertragen wurde. Bei so einer Guckparty habe ich die Keynote auch gesehen, weil eingeladen zum Vortrag direkt hat mich Nvidia nicht. Komisch.

Ja, und Nvidia hat tatsächlich CPUs, also keine GPUs, für Notebooks angekündigt, zusammen mit Microsoft. Dazu später die Details. Aber erst mal dazu, was Jensen Huang da auf der Keynote genau gesagt hat. Und das fand ich ganz ehrlich dystopisch. Das fand ich beklemmend.

Also klar, das Ding fing erst mal an mit, wie wahrscheinlich bei jeder KI-Firma: Die Welt wird besser mit KI und alle Krankheiten werden geheilt und so weiter und so fort. Man kennt das. Aber sobald es dann konkret wurde, da ging es dann nicht mehr um die Menschheit. Jensen Huang hat sogar gesagt: Früher haben wir CPUs für Menschen gebaut. Jetzt geht es darum, CPUs für KI-Agenten zu bauen und darum, Tokens zu maximieren.

Tokens, das sind ja die grundlegenden Einheiten, mit denen aktuelle KI-Systeme, also Sprachmodelle, arbeiten. Und Nvidia und deren direkte Kundschaft, klar, die wollen, dass möglichst viele Leute möglichst viel mit KI machen, also möglichst viele Tokens konsumieren. In der Realität hat das aber schon dazu geführt, dass Angestellte zum Beispiel bei Amazon einfach komplett sinnlose, teure KI-Anfragen gestellt haben, weil sie halt Angst hatten, dass sie in den Token-Rankings schlecht dastehen könnten, weil irgendwelche, ja, sage ich einfach mal, vielleicht nicht ganz so schlauen Vorgesetzten einfach geglaubt haben, was Jensen Huang hier neulich schon gesagt hat, nämlich dass es zutiefst alarmierend sei, wenn ein hochbezahlter Entwickler nicht mindestens eine Viertelmillion Dollar an Tokenkosten verursacht.

Also, dass Jensen Huang und seine Kundschaft natürlich gerne wollen, dass die eine Viertelmillion in Tokenkosten konsumieren, das ist klar. Aber dass das wirklich so verkauft wird, dass man den Wert von Angestellten in ihrem Tokenverbrauch messen kann, ja, das ist, muss ich leider so sagen, dumm.

Ja, und Jensen hat am Ende der zweistündigen Keynote auch gezeigt, was man mit ganz vielen Tokens machen kann: ein ganz schlimmes KI-generiertes Lied mit einem generischen Cartoon plus typischen KI-Slop-Fehlern. Hey, habt ihr Lust auf KAROOKE? Oder auf so komisch zusammengeklebte Roboter? Ja, RESENANG ACCELABED COMFUTING.

Ja, und hier in Taipeh hat Jensen Huang diesen Token-Extremismus noch weitergetrieben. Nämlich einfach: „Tokens sind Umsatz.“ Okay, also das war so seine Story. Rechenleistung, also in dem Fall Rechenleistung in KI-Servern, die berechnet Tokens, und Tokens sind Umsatz, also ist Rechenleistung auch direkter Umsatz. Das hat er nicht einmal gesagt, sondern mantraartig immer wiederholt.

„Tokens sind jetzt profitable Einheiten. Tokens sind jetzt profitable Einheiten von Umsätzen. Chip, Rack, Netzwerk, Strom, Kühlung und Stromnetz müssen Ende zu Ende zusammengebaut werden, weil Rechenleistung Umsatz ist. DSX Max LPS lässt Betreiber mehr GPUs installieren bei gleicher Leistungsaufnahme, wodurch Milliarden an Umsatz generiert werden. Mehr Strom fließt in umsatzgenerierende Rechenleistung. Rechenleistung ist jetzt Umsatz. Rechenleistung ist Profit. Leistung pro Watt ist Umsatz. Denn jeder Token ist profitabel. Jeder Token ist Umsatz. Je mehr ihr kauft, desto mehr verdient ihr.“

Und das ist halt wild, weil das ja wirklich extrem irreführend ist. Es geht ja schon auch darum, was man mit den Tokens macht. Also klar, die, die die Tokens verkaufen und die Server erstellen, für die ist das egal. Aber Jensen Huang tut so, als würden alle profitieren. Also auch die, die Tokens nur kaufen. Und Arbeitsplätze würden auch nicht verloren gehen dadurch. Das sei totaler Nonsens, weil die Mitarbeiter ja ihre Produktivität – Achtung – verdreifachen. Ja, das hat er wirklich gesagt.

„Die Gehaltssumme von 3 Billionen Dollar erzeugt jetzt fast dreimal so viel Output. Das entspricht effektiv einer Produktivität von 9 Billionen Dollar aus 3 Billionen Dollar Gehältern.“

Und dadurch steigt der Gewinn und die Arbeitgeber stellen dann natürlich auch neue Leute ein, wenn der Gewinn steigt.

„Die Anzahl an Software-Engineers steigt. Leute reden darüber, dass KI die Anzahl der Arbeitsplätze verringert. Kompletter Nonsens. Sie sorgt dafür, dass mehr Software-Engineers eingestellt werden. Und der Grund ist ganz einfach: Wenn ihr einen Software-Engineer einstellen könnt, und dadurch 9 Billionen Dollar an produktiver Arbeit generiert: Warum würdet ihr dann nicht einfach mehr einstellen?“

Aber diese Rechnung, die kann man ja so was von auseinandernehmen. Allein schon, wie Nvidia die Produktivität misst. Die haben sich nämlich einfach das Commit-Volumen auf GitHub angeguckt. Also wie viele Code-Änderungen in Softwareprojekte eingepflegt werden. Und ja, die Commits sind extrem hochgegangen in der letzten Zeit, durch sehr wahrscheinlich KI-Agenten. Das stimmt. Aber ich überlasse es mal euch in den Kommentaren zu diskutieren, ob die Zahl der Commits auf GitHub wirklich eins zu eins mit Produktivität gleichzusetzen ist.

Und sowieso: Dass sich da in der Rechnung nur Softwareentwickler wiederfinden, also Leute, die zweifellos heute am meisten mit KI-Systemen anfangen können. Es gibt aber etliche Berufe, bei denen gibt es ziemlich sicher gar keinen Produktivitätsgewinn durch KI.

Sowieso schien mir die Nvidia-Keynote halt so von Milliardären für Milliardäre zu sein. Ich bin da offenbar nicht die Zielgruppe. Ich finde KI zwar technisch ganz interessant und beschäftige mich beruflich viel damit, aber ich verdreifache damit definitiv nicht meine Produktivität. Und dass Tokens für mich profitable Werteinheiten sein sollen? Ja, weiß ich jetzt auch nicht. Also das schien mir jedenfalls alles sehr abgekoppelt von der Realität zu sein, oder zumindest von meiner Realität.

Ich möchte ja auch nicht die ganze Zeit nur rumhaten. Ich fand tatsächlich ein Beispiel aus der Keynote wirklich sehr interessant. Hier so: Ich habe die Klappe von meiner Fernbedienung verloren, die sieht so und so aus, machen wir mal eine CAD-Datei. Und dann baut der KI-Agent mit Hilfe der CUDA-X-Bibliothekensammlung eine Datei, die ein 3D-Drucker frisst, und dann kann man sich das Teil einfach ausdrucken lassen. Also dahinter steckt halt die Idee, dass man spezielle Bibliotheken und Frameworks zur Verfügung stellt, die explizit von KI-Agenten bedient werden können. Das könnte tatsächlich sinnvoll sein, auch wenn ich nicht wirklich weiß, ob das unbedingt zwingend CUDA-Bibliotheken sein müssen, die ja nur auf Nvidia-Hardware laufen.

Die neue PC-Plattform RTX Spark

So, aber jetzt noch zur interessantesten, zumindest halb konkreten Ankündigung von Nvidia. Ab Herbst sollen Windows-Notebooks herauskommen, die komplett mit Nvidia-Architektur laufen. Also nicht nur die Grafikeinheit, sondern auch die CPU. Das Ganze gab es ja bislang nicht, also zumindest nicht für Windows.

Das Ganze heißt RTX Spark, also nicht DGX Spark, wie diese kleinen KI-Kisten heißen, die wir ja schon getestet haben, sondern RTX Spark. Das Ganze ist auf ARM-Basis, also das, was Qualcomm schon mit Windows macht und Apple halt mit macOS. Eben die Konkurrenzarchitektur von x64, also was Intel und AMD machen.

Ja, und mit 20 ARM-CPU-Kernen, also mit Cortex X925 und A725, und 6144 Shader-Kernen, also das ist die Blackwell-Architektur, entspricht der RTX-Spark-Prozessor einer Endnutzerversion des System-on-Chip GB10, also eben dem Chip aus der DGX Spark. Nur zieht die DGX Spark halt bis zu 216 Watt. Und das ist natürlich bei so einem Notebook schwierig. Und deshalb wird Nvidia die RTX Spark sicherlich viel optimiert haben. Aber Konkretes dazu gab es noch nicht. Nur dass es der effizienteste Chip ever von Nvidia ist und dass der Akku einen Arbeitstag durchhält. Zumindest sagt das Microsoft auf einer Webseite zu ihrer RTX-Spark-Variante. Das Ding heißt dann Surface Laptop Ultra.

Ja, und Microsoft sind da nicht die Einzigen, die RTX-Spark-Geräte bauen. Tatsächlich hat Nvidia alle, wirklich alle relevanten Player im Boot, also Acer, Asus, Dell, Gigabyte, HP, Lenovo und MSI.

Ja, und damit soll man, wie gesagt, seine Tokens selbst generieren können und die KI-Agenten lokal ausführen. Also quasi das, was ich in meinem OpenCore-Video mit einem AMD-Strix-Halo-System gemacht habe. Ja, und spielen soll man auch können. Aber da gibt es halt leider noch keinerlei Benchmarks und Specs auch wirklich nur ein ganz bisschen.

Also die RTX-Spark-Geräte soll es halt mit bis zu 128 GB Unified LPDDR5X-Speicher geben, der einen Durchsatz von 300 GB pro Sekunde schafft. CPU und GPU sind mit 600 GB pro Sekunde per NVLink angebunden. Und ja, das war es schon.

Nvidia sagt, die ersten Geräte kommen im Herbst. Hier auf der Computex hört man allerdings so ein bisschen hinter vorgehaltener Hand, dass das sportlich sein könnte, weil es bei Microsoft bei der Windows-11-Unterstützung noch knirscht. Ja, mal gucken.

Ich finde es auf jeden Fall wirklich interessant, dass durch die von Nvidia mit ausgelöste KI-Manie in den Rechenzentren der klassische PC-Markt richtig ins Straucheln kommt, also wegen der Speicherpreise, und dann Nvidia sagt: Ihr braucht auch auf euren Laptops richtig doll KI-Leistung. Und da weiß ich jetzt nicht, ob die Zielgruppe das mitmacht. Weil bei den Copilot-Plus-PCs von Microsoft, da, sage ich mal, ist ja die Euphorie eher nicht so.

Ja, das Ganze steht und fällt halt damit, ob man mit diesen Nvidia-Rechnern irgendwas machen kann, was man, sagen wir mal, mit einem gleich teuren x64-Rechner oder einem MacBook nicht machen kann.

Ja, Stichwort gleich teuer: Also wie teuer so ein RTX-Spark-Teil mit 128 Gigabyte werden soll, das ist bislang unklar. Also ich sehe hier auf der Computex halt vor allem, dass die Hersteller alle 8-GB-Notebooks vorstellen, was ja eigentlich ziemlich unnütz ist, weil sie eben preislich mit dem MacBook Neo mithalten müssen, weil der Speicher so teuer ist wegen Nvidia.

Also ist alles schwierig. Ich bin gespannt, wie das weitergeht. Was meint ihr dazu? Gerne in die Kommentare schreiben. Tschüss aus Taiwan!

c't 3003 ist der YouTube-Channel von c't. Die Videos auf c’t 3003 sind eigenständige Inhalte und unabhängig von den Artikeln im c’t Magazin. Die Redakteure Jan-Keno Janssen, Lukas Rumpler, Sahin Erengil und Pascal Schewe veröffentlichen jede Woche ein Video.

(jkj)

Gesamten Artikel lesen