Nvidia says its AI data center design runs hotter to use a lot less water

Nvidia hat ein neues Referenzdesign für Rechenzentren der Rubin-Generation vorgestellt, das durch vollständige Flüssigkeitskühlung den Wasserverbrauch nahezu auf null reduziert. Durch die Erhöhung der Betriebstemperatur und den Einsatz von Direct-to-Chip-Kühlung will das Unternehmen den Wasserbedarf von bisher 2,6 Millionen Gallonen pro Megawatt und Jahr drastisch senken.

Die technische Wende: Warum Nvidia auf Wärme setzt

Herkömmliche Rechenzentren setzen auf Luftkühlung, bei der mechanische Kältemaschinen gekühlte Luft zirkulieren lassen, um die Server zu kühlen. Doch mit der steigenden Größe von KI-Modellen und dem Einsatz von Reasoning-Modellen wird dieser Ansatz energetisch und finanziell untragbar. Die Leistungsdichte pro Rack ist massiv gestiegen: Während früher 20 kW pro Rack üblich waren, unterstützen moderne Hyperscale-Einrichtungen heute über 135 kW.

Um diese thermischen Lasten zu bewältigen, implementiert Nvidia eine Direct-to-Chip-Flüssigkeitskühlung. Dabei wird das Kühlmittel über Kälteplatten direkt an GPUs und CPUs geleitet, wodurch die Luft als Zwischenmedium entfällt. Ein entscheidender Faktor ist dabei die höhere Temperaturtoleranz. Laut The Verge laufen die KI-Server in diesem Design heißer, mit Temperaturen von bis zu 45 Grad Celsius (113 Grad Fahrenheit).

Diese Strategie erlaubt es, die Wärme effizienter an die Außenluft abzugeben.

„Wärme wird direkt am Chip erfasst und durch Flüssigkeitskreisläufe transportiert, die mit viel höheren Temperaturen betrieben werden, sodass Außen-Trockenkühler das Jahr über einen Großteil der Zeit effizient Wärme abführen können.“Josh Parker, Nachhaltigkeitsleiter bei Nvidia, via The Verge

Wasserersparnis und finanzielle Effizienz der Blackwell-Plattform

Die Auswirkungen auf die Ressourcenbilanz sind erheblich. Nvidia gibt an, dass das Design der Rubin-Generation massive Mengen an Strom und so gut wie den gesamten Wasserverbrauch eliminiert hat. Konkret bedeutet dies eine Reduzierung des Wasserverbrauchs von etwa 2,6 Millionen Gallonen pro Megawatt und Jahr auf nahezu null – eine Senkung um bis zu 100 Prozent.

Für die bereits verfügbaren Blackwell-Systeme, wie den GB200 NVL72, nennt Nvidias eigener Blog deutlich höhere Effizienzwerte im Vergleich zu luftgekühlten Architekturen:

Wasser-Effizienz: 300-mal höherer Wirkungsgrad.
Energie-Effizienz: 25-mal effizienterer Betrieb (beim GB300 NVL72 sogar 30-mal).
Durchsatz: 30-mal höherer Durchsatz beim GB200; 35-mal beim GB300.

Diese technischen Verbesserungen schlagen sich direkt in den Betriebskosten nieder. Rechenzentren geben jährlich schätzungsweise 1,9 bis 2,8 Millionen US-Dollar pro Megawatt aus, wovon fast 500.000 US-Dollar auf die Kühlung entfallen. Durch den Einsatz des flüssigkeitsgekühlten GB200 NVL72 können Hyperscale-Zentren Kosteneinsparungen von bis zu 25-mal erzielen, was bei einem 50-MW-Zentrum jährlichen Ersparnissen von über 4 Millionen US-Dollar entspricht.

Das Energie-Paradoxon: Höhere Effizienz bei steigendem Hunger

Exploring NVIDIA's Revolutionary Data Center Design: A Giant Chip Concept

Trotz der Effizienzgewinne pro Recheneinheit gibt es eine kritische Kehrseite: den absoluten Strombedarf. Während herkömmliche Server-Racks etwa 20 kW verbrauchen und H100-basierte Racks über 40 kW benötigen, springt der Verbrauch bei den GB200 NVL72 und GB300 NVL72 Systemen auf 120 kW bis 140 kW.

Wie Tom’s Hardware berichtet, übertreffen diese Systeme die meisten installierten Racks bei weitem. Die Luftkühlung ist bei dieser Leistungsdichte schlichtweg nicht mehr ausreichend, um die thermische Last zu bewältigen. Die Flüssigkeitskühlung ist somit keine bloße Option zur Nachhaltigkeit, sondern eine technische Notwendigkeit, um die Hardware überhaupt betreiben zu können.

Logistische Hürden und die Kosten des Umbaus

Der Übergang zu einem geschlossenen Flüssigkeitskreislauf bringt erhebliche infrastrukturelle Herausforderungen mit sich. Im Gegensatz zu evaporativen Systemen verdunstet bei diesem Ansatz kein Kühlmittel, was die Wasserersparnis erklärt. Doch die Implementierung im großen Maßstab ist komplex.

Ein Hauptproblem ist die Wartbarkeit. Rechenzentren setzen auf modulare, „hot-swappable“ Komponenten. Hermetisch versiegelte Flüssigkeitssysteme erschweren jedoch den schnellen Austausch defekter GPUs oder Server, da das Öffnen der Versiegelung den gesamten Cluster gefährden könnte. Nvidia nutzt zwar Schnellverschlusskupplungen mit tropffreien Dichtungen, doch die Gefahr von Lecks bleibt ein operatives Risiko.

Zudem erfordert die Umstellung auf flüssigkeitsgekühlte Systeme oft eine komplette Neugestaltung des Rechenzentrums, was mit enormen Kosten verbunden ist. Nvidia behauptet, dass jeder Cloud-Anbieter, der auf die Rubin-Generation setzt, diesen Übergang vollzieht. Allerdings fehlen in den offiziellen Angaben detaillierte Vergleiche zu den Baukosten dieser Anlagen gegenüber traditionell luftgekühlten Zentren.

Während Nvidia die operative Effizienz betont, bleiben Fragen zur ökologischen Gesamtbilanz offen. Die Kritik an KI-Fabriken konzentriert sich nicht nur auf den laufenden Wasserverbrauch, sondern auch auf die Energiebedarfe der Stromerzeugung und die Umweltbelastungen während der Bauphase der massiven Anlagen.

Find more reporting in our Technik und Wissenschaft section.

Nvidia says its AI data center design runs hotter to use a lot less water

Die technische Wende: Warum Nvidia auf Wärme setzt

Wasserersparnis und finanzielle Effizienz der Blackwell-Plattform

Das Energie-Paradoxon: Höhere Effizienz bei steigendem Hunger

Logistische Hürden und die Kosten des Umbaus

Über den Autor

Schreibe einen Kommentar Antwort abbrechen

Die technische Wende: Warum Nvidia auf Wärme setzt

Wasserersparnis und finanzielle Effizienz der Blackwell-Plattform

Das Energie-Paradoxon: Höhere Effizienz bei steigendem Hunger

Logistische Hürden und die Kosten des Umbaus

Über den Autor

Weitere Nachrichten aus Technik und Wissenschaft

NASA-Mission Viking 1: Vor 48 Jahren gelang die erste Landung auf dem Mars

Ransomware-Welle Eskaliert: Unternehmen Ringen um Lösegeld-Strategien bei KI-Angriffen

Weltweite Gewässer verlieren massiv Sauerstoff und bedrohen Ökosysteme

Schreibe einen Kommentar Antwort abbrechen

Ressorts

Redaktion

Rechtliches