Die technische Wende: Warum Nvidia auf Wärme setzt
Herkömmliche Rechenzentren setzen auf Luftkühlung, bei der mechanische Kältemaschinen gekühlte Luft zirkulieren lassen, um die Server zu kühlen. Doch mit der steigenden Größe von KI-Modellen und dem Einsatz von Reasoning-Modellen wird dieser Ansatz energetisch und finanziell untragbar. Die Leistungsdichte pro Rack ist massiv gestiegen: Während früher 20 kW pro Rack üblich waren, unterstützen moderne Hyperscale-Einrichtungen heute über 135 kW.
Um diese thermischen Lasten zu bewältigen, implementiert Nvidia eine Direct-to-Chip-Flüssigkeitskühlung. Dabei wird das Kühlmittel über Kälteplatten direkt an GPUs und CPUs geleitet, wodurch die Luft als Zwischenmedium entfällt. Ein entscheidender Faktor ist dabei die höhere Temperaturtoleranz. Laut The Verge laufen die KI-Server in diesem Design heißer, mit Temperaturen von bis zu 45 Grad Celsius (113 Grad Fahrenheit).
Diese Strategie erlaubt es, die Wärme effizienter an die Außenluft abzugeben.
„Wärme wird direkt am Chip erfasst und durch Flüssigkeitskreisläufe transportiert, die mit viel höheren Temperaturen betrieben werden, sodass Außen-Trockenkühler das Jahr über einen Großteil der Zeit effizient Wärme abführen können.“Josh Parker, Nachhaltigkeitsleiter bei Nvidia, via The Verge
Wasserersparnis und finanzielle Effizienz der Blackwell-Plattform

Die Auswirkungen auf die Ressourcenbilanz sind erheblich. Nvidia gibt an, dass das Design der Rubin-Generation massive Mengen an Strom und so gut wie den gesamten Wasserverbrauch eliminiert hat. Konkret bedeutet dies eine Reduzierung des Wasserverbrauchs von etwa 2,6 Millionen Gallonen pro Megawatt und Jahr auf nahezu null – eine Senkung um bis zu 100 Prozent.
Für die bereits verfügbaren Blackwell-Systeme, wie den GB200 NVL72, nennt Nvidias eigener Blog deutlich höhere Effizienzwerte im Vergleich zu luftgekühlten Architekturen:
- Wasser-Effizienz: 300-mal höherer Wirkungsgrad.
- Energie-Effizienz: 25-mal effizienterer Betrieb (beim GB300 NVL72 sogar 30-mal).
- Durchsatz: 30-mal höherer Durchsatz beim GB200; 35-mal beim GB300.
Diese technischen Verbesserungen schlagen sich direkt in den Betriebskosten nieder. Rechenzentren geben jährlich schätzungsweise 1,9 bis 2,8 Millionen US-Dollar pro Megawatt aus, wovon fast 500.000 US-Dollar auf die Kühlung entfallen. Durch den Einsatz des flüssigkeitsgekühlten GB200 NVL72 können Hyperscale-Zentren Kosteneinsparungen von bis zu 25-mal erzielen, was bei einem 50-MW-Zentrum jährlichen Ersparnissen von über 4 Millionen US-Dollar entspricht.
Das Energie-Paradoxon: Höhere Effizienz bei steigendem Hunger
Trotz der Effizienzgewinne pro Recheneinheit gibt es eine kritische Kehrseite: den absoluten Strombedarf. Während herkömmliche Server-Racks etwa 20 kW verbrauchen und H100-basierte Racks über 40 kW benötigen, springt der Verbrauch bei den GB200 NVL72 und GB300 NVL72 Systemen auf 120 kW bis 140 kW.
Wie Tom’s Hardware berichtet, übertreffen diese Systeme die meisten installierten Racks bei weitem. Die Luftkühlung ist bei dieser Leistungsdichte schlichtweg nicht mehr ausreichend, um die thermische Last zu bewältigen. Die Flüssigkeitskühlung ist somit keine bloße Option zur Nachhaltigkeit, sondern eine technische Notwendigkeit, um die Hardware überhaupt betreiben zu können.
Logistische Hürden und die Kosten des Umbaus
Der Übergang zu einem geschlossenen Flüssigkeitskreislauf bringt erhebliche infrastrukturelle Herausforderungen mit sich. Im Gegensatz zu evaporativen Systemen verdunstet bei diesem Ansatz kein Kühlmittel, was die Wasserersparnis erklärt. Doch die Implementierung im großen Maßstab ist komplex.
Ein Hauptproblem ist die Wartbarkeit. Rechenzentren setzen auf modulare, „hot-swappable“ Komponenten. Hermetisch versiegelte Flüssigkeitssysteme erschweren jedoch den schnellen Austausch defekter GPUs oder Server, da das Öffnen der Versiegelung den gesamten Cluster gefährden könnte. Nvidia nutzt zwar Schnellverschlusskupplungen mit tropffreien Dichtungen, doch die Gefahr von Lecks bleibt ein operatives Risiko.
Zudem erfordert die Umstellung auf flüssigkeitsgekühlte Systeme oft eine komplette Neugestaltung des Rechenzentrums, was mit enormen Kosten verbunden ist. Nvidia behauptet, dass jeder Cloud-Anbieter, der auf die Rubin-Generation setzt, diesen Übergang vollzieht. Allerdings fehlen in den offiziellen Angaben detaillierte Vergleiche zu den Baukosten dieser Anlagen gegenüber traditionell luftgekühlten Zentren.
Während Nvidia die operative Effizienz betont, bleiben Fragen zur ökologischen Gesamtbilanz offen. Die Kritik an KI-Fabriken konzentriert sich nicht nur auf den laufenden Wasserverbrauch, sondern auch auf die Energiebedarfe der Stromerzeugung und die Umweltbelastungen während der Bauphase der massiven Anlagen.
Find more reporting in our Technik und Wissenschaft section.
