Bulldozer auf dem Server: AMDs neue Opteron-CPUs

AMD stellt heute neue Server-Prozessoren auf Basis seiner Bulldozer-Architektur vor. Nachdem der Chipdesigner vor einem Monat Bulldozer-CPUs für Desktop-Systeme gezeigt hat, folgen jetzt die Modelle für Pizzaboxen im Rechenzentrum.

Dabei bringt AMD zwei verschiedene Modellreihen auf den Markt: Die Reihe 4200 (Codename Valencia) ist den Desktop-Modellen recht ähnlich. Sie haben jedoch drei Hypertransport-3.0-Kanäle und sind somit für 2P-Systeme geeignet.

Zudem kommt das Spitzenmodell für Server mit 95 Watt TDP aus, während die schnellsten Desktop-CPUs 125 Watt benötigen. Dafür taktet das Serverspitzenmodell nur mit 3,0 GHz (Turbo bis 3,7 GHz), während die Desktop-Variante bis 3,6 GHz (Turbo bis 4,2 GHz) hochgezüchtet wurde.

Die Reihe 6200 (Codename Interlagos) ist quasi eine Verdopplung der Reihe 4200. Statt zwei DDR3-1600-Speicherkanälen gibt es vier und der gemeinsame L3-Cache beträgt 16 MByte statt 8 MByte. Ferner gibt es vier Hypertransport-3.0-Kanäle, so dass bis zu vier Interlagos-CPUs auf einem Motherboard kombiniert werden können.

Bulldozer-CPUs werden aus sogenannten Modulen aufgebaut. Jedes Modul besteht aus zwei Integer-Kernen, die aber ein gemeinsames Instruction-Fetching und -Decoding besitzen und sich vor allem eine Floating-Point-Unit teilen müssen. Bei bisherigen AMD-CPUs und allen aktuellen Intel -Prozessoren gehört zu jedem Integer-Kern auch eine eigene Floating-Point-Unit. Durch das gemeinsame Instruction-Decoding arbeiten die zwei Integer-Kerne auch nicht zu 100 Prozent unabhängig voneinander.

Für AMDs Marketingabteilung ist die Sache klar: Ein Bulldozer-Modul hat zwei Cores, denn ein 16-Kerner verkauft sich besser als ein Achtkerner. Kritiker wenden jedoch ein, dass es sich bestenfalls um eine Art "Hyperthreading Deluxe" handelt. Die Wahrheit liegt irgendwo dazwischen.

Die folgenden beiden Tabellen geben eine Übersicht über alle seit heute verfügbaren Modelle.

Übersicht über AMD-Interlagos-CPUs mit Bulldozer-Kernen

Übersicht über AMD-Valencia-CPUs mit Bulldozer-Kernen

Kompatibilitätsprobleme mit älteren Betriebssystemen

Man kann darüber streiten, ob ein Bulldozer-Modul als Dual-Core bezeichnet werden darf. Fakt bleibt aber, dass die Bulldozer-Architektur eine Neuheit im x86-Markt darstellt. Das heißt, dass im Hardware Abstraction Layer der Betriebssysteme Anpassungen vorgenommen werden müssen.

Das ist im Serverbereich sehr ärgerlich, denn in den Rechenzentren wird mitnichten nur das neueste Betriebssystem mit aktuellem Patchstand verwendet. Der Betrieb von Legacy-Software auf älteren Betriebssystemen wie Windows Server 2003, RHEL 5.x oder SLES 10 ist der Normallfall.

Doch die Liste der Betriebssysteme beziehungsweise Hypervisor, die auf Bulldozer-CPU erst gar nicht hochfahren oder deren Betrieb vom Hersteller nicht empfohlen wird, ist lang:

Für viele IT-Abteilungen und Rechenzentren wird bei dieser Aufzählung der Betrieb von Bulldozer-basierten Systemen vorerst nicht in Frage kommen. Wer beispielsweise eine private Cloud in seinem Intranet aufbaut, weiß im Zweifel gar nicht, welche Betriebssysteme seine internen Kunden in den virtuellen Instanzen hochfahren. Er wird sich hüten, auf eine Hardwareplattform zu setzen, die weniger als 2 Jahre alte Betriebssysteme nicht unterstützt.

Durchsatz statt Rechenleistung

Auf dem Desktop können Bulldozer-CPU gegen Intels Sandy-Bridge-Modelle nicht überzeugen. Sie schneiden in Benchmarks meist schlechter ab und brauchen erheblich mehr Strom. Für bestimmte Serveraufgaben sind Bulldozer-CPUs hingegen geradezu ideal.

Wenn ein Client beispielsweise ein JPEG-Bild anzeigt, dann muss er viele Floating-Point-Operationen durchführen. Hier ist Bulldozer schwach, da sich zwei Integer-Kerne eine Fließkommaeinheit teilen müssen. Ein Server geht mit einem JPEG-Bild jedoch ganz anders um. Er dekodiert es nicht, sondern übergibt es als Web-, File- oder Mail-Server einem Client. Für den Server ist es nur eine Datei, die von A nach B verschoben werden muss.

Genau hier haben die Bulldozer-Server-CPUs ihre Stärke und können weit nach oben skalieren. Ein 4P-System mit 62xx-CPU verfügt insgesamt über 16 DDR3-1600-Speicherkanäle. Das würde theoretisch ausreichen, um jede Sekunde mehr als 200 GByte Daten im Hauptspeicher zu verschieben.

Bei einem typischen Web-, Mail- oder File-Server ist der Verzicht auf Floating-Point-Units zugunsten von mehr Cores und Cache sicherlich ideal. Wer aber Business-Intelligence-Aufgaben mit seinen Servern lösen oder einen Compute-Cluster aufbauen möchte, der wird eher auf CPUs mit einer FPU pro Integer-Core setzen. Eine Ausnahme sind möglicherweise Compute-Cluster mit GPU-Karten wie Nvidia-Tesla. Wenn die Floating-Point-Leistung ohnehin nicht von der CPU erbracht wird, benötigt man weniger FPUs.

Leistung

ZDNet steht noch kein Testgerät zur Verfügung, aber es gibt einige wenige von AMD durchgeführte Benchmarks. Hersteller neigen allerdings dazu, nur solche Ergebnisse zu veröffentlichen, bei denen sie besonders gut abschneiden.

Beim SPECint_rate2006 erzielte ein Supermicro A+ 1022-URF ausgestattet mit zwei CPUs des Spitzenmodells 6282 SE 526 Punkte. Ein Dell Poweredge mit zwei Xeon-X5690-Prozessoren kann hingegen nur 419 Punkte erreichen, obwohl der Xeon-Prozessor etwa 600 Dollar mehr kostet.

Vergleicht man zwei AMD 6220-CPUs (523 Dollar und 115 Watt TDP pro Stück) mit zwei Xeon-E5640-Prozessoren (774 Dollar und 80 Watt TDP pro Stück), so kann AMD 317 Punkte erzielen, während Intel nur 253 erreicht.

Auch beim SPECfp_rate2006-Benchmark kann AMD punkten. Zwei 6276 (788 Dollar / 115 Watt) schlagen zwei Xeon-X5670-CPUs (1440 Dollar / 95 Watt) mit 360 zu 263 Punkten. Beim Linpack mit denselben CPUs erreicht AMD 239,1 FLOP/s und Intel nur 130,1 FLOP/s.

Derzeit können AMDs Bulldozer-CPUs Intels aktuelle Xeon-56xx-CPUs auf Westmere-Basis durchaus schlagen. Zudem bietet Intel nur drei DDR3-Speicherkanäle, während AMD mit vier aufwarten kann. Dass AMD Intel derzeit auch bei Floating-Point-Benchmarks schlagen kann, liegt vor allem daran, dass die Bulldozer-CPUs bereits den 256-Bit-SIMD-Befehlssatz AVX sowie Fused-Multiply-Add besitzen, was Intels Westmere-CPUs noch nicht können.

Allerdings dürften noch dieses Jahr die Karten neu gemischt werden. Gerüchteweise sollen noch vor dem Jahreswechsel die Nachfolger der Xeon-56xx-CPUs erscheinen. Sie basieren auf bis zu acht Sandy-Bridge-Kernen, verfügen über bis zu 20 MByte L3-Cache und haben ebenfalls vier DDR3-Speicherkanäle – jedenfalls, wenn die Gerüchte stimmen. Sie sollen den Namen Xeon-E5-26xx tragen und bis zu 2000 Dollar kosten. Dann werden auch Intel-Server-CPUs AVX beinhalten und obwohl sie kein Fused-Multiply-Add beherrschen, werden sie mit AMD vermutlich mindestens mithalten können.

Fazit

Wer einen Server braucht, bei dem es auf Datendurchsatz ankommt und nicht auf Rechenleistung, der sollte über ein Gerät mit Bulldozer-basierter CPU nachdenken. Mehr Cache und mehr Integer-Cores auf Kosten von Floating-Point-Units ist ein ideales Konzept für typische Web, File- oder Mail-Server.

Bei allen Bulldozer-basierten Rechnern, egal ob Server oder Client, muss bedacht werden, dass nur neuere Betriebssysteme darauf laufen. Einige OS, die nicht einmal zwei Jahre alt sind, können nicht mit Interlagos- oder Valencia-CPUs betrieben werden.

Ferner kann man argumentieren, dass Intels kommende Xeon-E5-26xx-CPUs vermutlich denselben Datendurchsatz wie die heute vorgestellten Bulldozer-CPUs erreichen werden, aber deutlich schneller rechnen können. Hier muss man aber Preis und Performance analysieren.

Tracey is the Contributing Editor for Foodies100, Tots100, Hibs100 and Trips100. She also blogs at PackThePJs. Tracey writes mainly about family travel; from days out to road trips with her pet dogs, to cruises and long-haul tropical destinations. Her family consists of her husband Huw, a medical writer, Millie-Mae (14), Toby (12) and Izzy and Jack the spaniels