Epyc™- und Threadripper™-Prozessoren – High-End-Equipment für große Träume

AMD hat in den letzten Jahren die Welt der Prozessoren verändert. Schritt für Schritt brachte das Unternehmen die Konkurrenz ins Schwitzen und spätestens mit der Zen-3-Architektur dürfte wohl so gut wie jeder Kritiker verstummt sein. Denn die leistungsstarken Ryzen™-5000er-CPUs übertrafen alle Erwartungen und bieten eine Performance, die im Consumer-Bereich seinesgleichen sucht.

Doch wie sieht der Blick in Richtung Workstations und Server aus? Kann AMD auch auf diesen Gebieten punkten und den langjährigen Platzhirsch Intel® von seinem Thron stoßen? Das erfahrt Ihr in diesem Beitrag.

Worin unterscheiden sich die Epyc™- und Threadripper™-Prozessoren von Consumer-CPUs?

AMD bietet in seinem Portfolio unterschiedliche Arten von CPUs an. Darunter befinden sich die beliebten Ryzen™-Prozessoren, die vornehmlich für den Mainstream-Sektor konzipiert sind. Mit diesen zockt Ihr Games, bearbeitet Bilder und Videos und könnt sogar in die Welt des Renderings eintauchen. Office-Aufgaben erledigen diese CPUs selbstverständlich mit Bravour und selbst CAD-Anwendungen sind mit den hohen Leistungsstufen, wie einem Ryzen™ 9, zu realisieren.

Workstations und Rechenzentren benötigen jedoch wesentlich mehr Power, um anspruchsvolle Rechenaufgaben zu meistern oder großen Datenströmen Herr zu werden. Deshalb verfügen CPUs für diese beiden Bereiche über sehr viele Kerne, um komplexe Prozesse zu meistern.

Forschungseinrichtungen, IT-Unternehmen und Cloud-Dienste verwalten und analysieren ihre Datenmengen mithilfe von Serverfarmen bzw. Rechenzentren, in denen zahlreiche Rechner im Verbund die ankommenden und ausgehenden Daten verarbeiten. Welche Dimensionen diese Farmen annehmen können, zeigt das Beispiel Microsoft® mit dem Standort Chicago. Auf einer Fläche von 65.705 m² türmen sich Server um Server. Und dabei sei lediglich am Rande bemerkt, dass dieses Rechenzentrum selbstverständlich nicht das Einzige ist, das der Konzern betreibt. Wie groß die Datenströme dementsprechend sind, ist gut vorstellbar. Um den hohen Anforderungen gerecht zu werden, haben sowohl AMD mit der Epyc™-Serie als auch Intel® mit der Xeon®-Reihe spezielle Prozessoren entwickelt.

Ähnlich rechenintensiv sind die Anwendungen bei Workstations. Sie werden vor allem in Forschungseinrichtungen und in großen Unternehmen für anspruchsvolle Aufgabenfelder aus dem Bereich der 3D-Simulation und -Konstruktion sowie für die Videobearbeitungen eingesetzt. Special Effects in Filmen und grandiose Fantasiewelt, die wir aus zahlreichen Blockbustern wie Terminator und Avatar kennen, beruhen auf der Rechenleistung von Workstation-Prozessoren. In diesem Gebiet treffen wir erneut auf die beiden Konkurrenten AMD und Intel®. Mit der Ryzen™-Threadripper™-Reihe hat AMD eine Serie geschaffen, die sich klar einer Aufgabe widmet: dem Erschaffen kreativer Inhalte. Obwohl sich die Prozessoren ebenfalls fürs Gaming eignen, liegt deren Hauptdisziplin in der Content-Erstellung. Im Fall von Intel® ist die Grenze zwischen Server- und Workstation-CPU nicht ganz so eindeutig. Denn wer mit rechenintensiven Aufgaben konfrontiert ist, muss sich mit dem Xeon™-Portfolio auseinandersetzen.

Die Unterschiede zwischen den einzelnen CPU-Typen bestehen vor allem in der Anzahl der Kerne, Threads, der Taktrate und der Leistungsaufnahme.

3 Top-Modelle im Überblick

Eigenschaften Epyc™ 7763  Threadripper™ Pro 3995WX Ryzen™ 9 5950X
Sockel SP3 sWRX8 AM4
Kerne 64 64 16
Threads 128 128 32
Boost-Takt 3,5 GHz 4,2 GHz 4,9 GHz
L3-Cache 256 MB 256 MB 64 MB
PCIe Version PCIe 4.0 x128 PCIe 4.0 x128 PCIe 4.0 x20
max. Speichertaktfrequenz</strong> 3.200 MHz 3.200 MHz 3.200 MHz
Speicherkanäle 8 8 2
TDP 280 Watt 280 Watt 105 Watt
Preis* (Stand 09/21) ca. 9.300 € ca. 5.200 € ca. 700 €

*Der Preis kann je nach Marktlage und Verfügbarkeit variieren.

Für unsere kurze Übersicht haben wir uns drei Modelle für die jeweiligen Anwendungsgebiete zum Vergleich herausgesucht. Hierbei handelt es sich um die Flaggschiffe der Ryzen™-, Threadripper™ und Epyc™-Serie. Der Überblick offenbart bereits in der Kernanzahl große Unterschiede. Während die Gaming-CPU mit dem Ryzen™ 9 5950X stolze 16 Kerne offeriert, sprengen der Threadripper™ Pro 3995WX und der Epyc™ 7763 mit 64 Cores die Vorstellungsgrenzen des Consumer-Bereiches. Da AMD für seine sehr gute Multicore-Performance bekannt ist, fallen die Threads dementsprechend doppelt so hoch aus.

Keine großen Überraschungen erblicken wir bei den jeweiligen Boost-Taktungen. Bekanntermaßen sinkt die maximal erreichbare Taktfrequenz mit steigender Core-Anzahl. Der Ryzen™ 9 5950X weist mit 4,9 GHz den höchsten Boost-Takt auf. An zweiter Stelle folgt der Threadripper™ Pro 3995WX mit 4,2 GHz und danach der Epyc™ 7763 mit 3,5 GHz. Neben der Kern- und Threadanzahl ist in Servern und Workstations vor allem die Größe des L3-Cache von Relevanz. Dieser fällt bei unseren Modellen aus der Epyc™- und Threadripper™-Reihe mit 256 MB erwartungsgemäß großzügig aus. Vollkommen ausreichend für sein Einsatzgebiet sind hingegen die 64 MB des Ryzen™ 9.  Um den Datendurchsatz entsprechend den Anforderungen für Server und Workstations zu beschleunigen, sind sowohl der Epyc™ als auch der Threadripper™ mit der neuesten PCIe-4.0-Schnittstelle ausgestattet, die mit 128 Lanes arbeitet. Der Ryzen™ muss sich hingegen mit 20 Lanes zufriedengeben.

Was die Anzahl der unterstützten Speicherkanäle anbelangt, erfüllen alle Prozessoren die Erwartungen. Unsere Gaming-CPU bietet mit 2 Speicherkanälen den üblichen Standard an, während die Workstation- und Server-Modelle mit 8 Channels ihren Fachgebieten gerecht werden. Preislich sehen wir für die einzelnen Produkte starke Unterschiede. Mit 700 € für den Ryzen™ 9 ist der Prozessor für den Gaming-Bereich als sehr teuer einzustufen. Allerdings handelt es sich hierbei auch um ein High-End-Exemplar, das ebenfalls für Video- und Bildbearbeitungen oder kleinere Projekte im Bereich des Renderings eingesetzt werden kann. Unsere Kandidaten für Serverumgebungen und Workstations weisen handelsübliche Preise für ihr Segment auf.

Die Threadripper™ – Workstation-CPUs, die ihresgleichen suchen

Die Threadripper™ von AMD sind speziell auf die Bedürfnisse von kreativen Arbeitsfeldern ausgelegt. Dabei habt Ihr in erster Linie die Wahl zwischen Modellen mit 24, 32 und 64 Kernen, während die Pro-Ausführungen Euch drei Varianten mit 16, 32 oder 64 Cores bereitstellen. Alle Threadripper™ der 3000er-Serie – egal ob Pro- oder Standard-CPU – basieren auf der Zen-2-Architektur, bei der die Prozessoren im 7-nm-Verfahren gefertigt werden. Das bedeutet, dass sich unter den Heatspreadern insgesamt neun Chips verbergen. Diese teilen sich in acht 7 nm kleine Chips mit bis zu 8 Kernen und einem 12 nm großen I/O-Die auf.

Der I/O-Die nutzt im Falle der Nicht-Pro-Modelle lediglich 50 % seines Potenzials, wodurch nur 64 PCIe-Lanes zur Verfügung stehen und 4 anstelle von 8 Speicherkanälen unterstützt werden. Erfreulich ist wiederum, dass alle hier erwähnten Prozessoren mit der neuesten PCIe-Version 4.0 ausgestattet sind.

Die Threadripper™ der dritten Generation im Überblick

Modell Kerne/Threads Frequenz
(Basic / Boost)
L3-Cache PCIe-Lanes
Threadripper™ Pro 3995WX 64 / 128 2,7 GHz / 4,2 GHz 256 MB 128
Threadripper™ Pro 3975WX 32 / 64 3,5 GHz / 4,2 GHz 128 MB 128
Threadripper™ Pro 3955WX 16 / 32 3,9 GHz / 4,3 GHz 64 MB 128
Threadripper™ 3990X 64 / 128 2,9 GHz / 4,3 GHz 256 MB 64
Threadripper™ 3970X 32 / 64 3,7 GHz / 4,5 GHz 128 MB 64
Threadripper™ 3960X 24 / 48 3,8 GHz / 4,5 GHz 128 MB 64

Die Threadripper™ der dritten Generation weisen nicht nur starke Gemeinsamkeiten im Design auf, sondern auch in den technischen Details. Alle Modelle verfügen über Hyperthreading, wodurch die Anzahl der Kerne virtuell verdoppelt wird.  Davon profitieren vor allem Anwendungen aus der 3D-Konstruktion, der Postproduktion und der Softwareentwicklung. Die verfügbaren Boost-Frequenzen sind unter den Spitzenexemplaren nahezu identisch. Lediglich die 24- und 32-Kerner der Standard-Ausführung übertrumpfen die Top-Modelle.

Bezüglich der Größe des L3-Caches sind der Threadripper™ Pro 3995WX und der Threadripper™ 3990X mit 256 MB führend. Unterschiede finden sich jedoch vor allem beim Speicherinterface. Dieses erlaubt den Pro-Prozessoren mit bis zu 128 PCIe-Lanes zu arbeiten, während die interne Konkurrenz mit lediglich 64 Lanes kompatibel ist. Einigkeit herrscht bei den unterstützen RAM-Taktfrequenzen, die bei allen Threadrippern™ bei 3.200 MHz liegt. Wie viel RAM insgesamt von den Prozessoren verwaltet werden kann, variiert zwischen den CPUs stark. Die Threadripper™ 3970X und 3960X verarbeiten bis zu 256 GB und entsprechen damit dem Consumer-Standard. Etwas mehr Arbeitsspeicher offeriert der Threadripper™ 3990X, der immerhin 512 GB akzeptiert. Auf Server-Klasse befinden sich hingegen die Pro-Modelle, die mit bis zu 2 TB RAM perfekt für rechenintensive Aufgaben auf jedem Gebiet gerüstet sind. Um Fehler beim Speichern und Übertragen von Daten zu vermeiden, lassen sich alle Threadripper™ mit ECC-Modulen ausstatten.

Allerdings müssen diese hohen Kapazitäten auch vom Mainboard unterstützt werden. Das Gigabyte™ WRX80-SU8-IPMI ist beispielsweise in der Lage bis zu 8 LRDIMM-Steckkarten mit einer Einzelkapazität von bis zu 128 GB zu verwalten. Damit erzielt Ihr einen maximalen Arbeitsspeicher von 1 TB.

Welcher Threadripper™ eignet sich für meine Anforderungen? Und wie schneiden die Workstation-CPUs von AMD gegenüber der Intel®-Xeon®-W-Familie ab?

Obwohl sich prinzipiell alle Prozessoren dieser Serie für rechenintensive Anwendungen auf dem Gebiet der Workstations eignen, liegen dennoch Unterschiede in der Geschwindigkeit vor, mit der bestimmte Aufgaben erledigt werden. Um eine hohe Produktivität sicherzustellen und eine Maximierung der Effizienz zu erreichen, ist es von entscheidender Bedeutung zu wissen, von welchen spezifischen Eigenschaften Eurer Programm profitiert. Denn je nach Tool sollte der Fokus entweder auf zahlreiche Kerne, beste Taktfrequenzen oder große Zwischenspeicher gelegt werden. Welcher Threadripper™ zu Euren Bedürfnissen passt, entnehmt Ihr unseren Übersichten.

Threadripper™ für Fertigungsoptimierung und Postproduktionen

(Platzhalter Grafik)

Postproduktion Fertigungsoptimierung
Threadripper™ Pro 3995WX Threadripper™ Pro 3975WX Threadripper™ Pro 3955WX Threadripper™ 3990X Threadripper™ 3970X

Sowohl bei der Fertigungsoptimierung als auch in der Postproduktion profitieren die Anwendungen von zahlreichen Kernen und guten Taktfrequenzen. Ob Slicer Software für den 3D-Druck oder Adobe After Effects – mit den Kerngiganten der dritten Generation seid Ihr bestens für rechenintensive Aufgaben gerüstet. Welchen hohen Einfluss die Anzahl der Kerne und eine möglichst maximale Taktung auf Programme wie Adobe After Effects haben, zeigt sehr gut der Benchmark von pudgetsystems.com, bei dem drei Threadripper™ der Pro-Modelle mit vier Intel®-Xeon®-Prozessoren verglichen werden.

Bei diesem Benchmark haben wir uns lediglich den Gesamtscore im Balance-Modus angeschaut. In diesen fließen die Einzelbewertungen des RAM Preview sowie des Render- und Tracking-Scores. In diesen drei Disziplinen sind die Threadripper™ Pro führend und stellen die Performance der Intel®-CPUs in den Schatten.

Quelle: pudgetsystems.com

Hierbei zeigt sich jedoch auch, dass allein die Kernanzahl nicht ausschlaggebend ist. Denn obwohl die Threadripper™ Pro 3995WX und 3975WX mit mehr Cores und Threads aufwarten als das 3955WX-Modell, schlägt dieser seine internen Konkurrenten dank einem höheren Basis- und Boost-Takt (3,9 GHz / 4,3 GHz). Zum Vergleich: die beste CPU aus dem Hause Intel®, die ebenfalls 16 Kerne aufweist, besitzt einen Grundtakt von 3,4 GHz und eine Turbofrequenz von 4,0 GHz.

Threadripper™ für 3D-Modelling, -Rendering und -Konstruktion sowie für CAD-Systeme

Im Bereich des 3D-Modelling und der dreidimensionalen Konstruktion stellen die jeweiligen Programme sehr unterschiedliche Anforderungen an den Prozessor. Während traditionelle Aufgaben in diesem Gebiet eher auf  wenige Kerne mit hohen Taktungen setzen, ziehen generative Gestaltungsmethoden ihren Nutzen aus dem Hyperthreading. Beim Rendern von großen Objekten erhöhen Prozessoren mit vielen Kernen in der Regel die Produktivität, weil mehr Befehle gleichzeitig abgearbeitet werden. Wer jedoch vornehmlich eine CAD-Software verwendet, wird sich über höhere Taktfrequenzen anstelle von zahlreichen Cores freuen.

(Platzhalter Grafik)

3D-Modelling- und Rendering

 

CAD und 3D-Konstruktion

 

Threadripper™ Pro 3995WX Threadripper™ Pro 3975WX Threadripper™ Pro 3955WX Threadripper™ 3960X
Threadripper™ 3970X Threadripper™ 3990X

Ein beliebtes Tool zum Rendern von Szenen und Objekten ist V-Ray. Es wird vorzugsweise für die Erstellung visueller Effekte in Filmen und Serien genutzt, dient aber auch der Architektur und dem Design für Visualisierungen in höchster Qualität. Wie gut die Threadripper™ im Vergleich zu Intel®-Prozessoren in diesem Segment performen, hat pudgetsystems.com ebenfalls ermittelt. Erneut widmen wir uns ausschließlich dem Balance-Modus, der für die meisten User ausschlaggebend sein dürfte.

Quelle: pudgetsystems.com

In dieser Disziplin sind mehr Kerne ein eindeutiges Plus. Wie die Benchmarks zeigen, ist der Threadripper™ Pro 3995WX dank seiner 64 Cores und 128 Threads deutlich im Vorteil. Darauf folgen mit fast gleicher Punktzahl der 32-Kerner von AMD und der 38 Cores starke Intel® Xeon W-3375. Die Schlusslichter werden von den 16-Kern-Modellen gebildet, die trotz hoher Taktfrequenzen die geringere Ausstattung an Kernen und Threads nicht ausgleichen können.

Threadripper™ für Simulationen

Simulationen werden unter anderem eingesetzt, um reale Bedingungen nachzubilden. So lassen sich beispielsweise geplante Bauwerke auf ihre Stabilität unter bestimmten Einflüssen testen. Vor allem die Auswirkungen von unterschiedlichen Lichtverhältnissen auf ein Objekt oder eine Szene und die Verwendungen verschiedener Materialien stehen im Fokus der Simulationen. Diese Vorgänge sind jedoch sehr rechenintensiv, da zahlreiche Aufgaben parallel abgearbeitet werden. Allerdings können manche Softwarelizenzen zur Limitierung der nutzbaren Kerne führen, sodass je nach vorliegenden Voraussetzungen weniger Kerne mit einer höheren Taktung von Vorteil sind.

(Platzhalter Grafik)

Simulationen

 

Threadripper™ Pro 3995WX Threadripper™ 3970X Threadripper™ 3960X

Eine beliebte Software dieses Anwendungsgebietes ist Cinema 4D, das als Cinebench einen guten Überblick der zu erwartenden Performance unter Verwendung von einzelnen Kernen und vielen Cores liefert. Erneut ziehen wir hierfür die Plattform pudgetsystems.com zurate, wobei wir uns auf den meistgenutzten Balance-Modus konzentrieren.

Quelle: pudgetsystems.com

Der Cinebench R23 für den Singlecore-Modus offenbart, dass höhere Taktfrequenzen eine bessere Performance darbieten. Hierbei siegt der 16-Kerner von AMD knapp vor seiner internen Konkurrenz. Unter den Intel®-Modellen schneidet der Xeon® W-3375 mit seinen 38 Cores überraschend am besten ab, obwohl der Basis-Takt geringer ausfällt als beim kleinsten Intel®-Exemplar. Das könnte ein Indiz dafür sein, dass nicht allein die Taktfrequenz im Cinebench R23 von entscheidender Bedeutung ist, sondern auch die Größe des L3-Caches. Der Intel® Xeon® W-3375 weist mit 57 MB eine doppelt so hohe Kapazität auf als der Intel® Xeon® W-3335. Die Threadripper™-Pro-Modelle verfügen bei der kleinsten Variante über 64 MB L3-Cache und in der größten Ausführung über 256 MB. Ein Unterschied, der sich bemerkbar macht.

Quelle: pudgetsystems.com

Die Multicore-Performance ist bekannterweise die Paradedisziplin von AMD. Daher verwundert es kaum, dass die beiden Kerngiganten unter den Threadrippern™ Platz eins und zwei belegen. Den dritten Rang nimmt der Intel® Xeon W-3375 mit seinen 38 Cores ein, während die 16-Kerner von AMD und Intel® die Schlusslichter bilden.

Threadripper™ für virtuelle Realitäten

Die Erstellung von VR-Inhalten nimmt einen immer größeren Markt ein. Ob im Gaming oder für virtuelle Rundgänge – das Thema VR wird uns in der Zukunft häufiger begleiten und uns neue Optionen zur Wissensvermittlung oder Unterhaltung bieten. Dabei deckt die virtuelle Realität ein Teilgebiet der Simulation ab, bei der vor allem die Tiefenwirkung von Objekten und die Interaktion im 360°-Raum im Mittelpunkt stehen. Um solch komplexe Berechnungen durchzuführen, sind Prozessoren mit zahlreichen Kernen notwendig, wie bereits der Cinebench R23 für den Multicore-Modus bezeugt hat.

Virtuelle Realität

 

Threadripper™ Pro 3995WX Threadripper™ 3970X Threadripper™ 3960X

 

Threadripper™ für Software- und Spieleentwicklung

In der Software- und Spieleentwicklung nimmt vor allem das Kompilieren eine Menge Zeit in Anspruch. Wer nicht stundenlang auf das Resultat warten möchte, benötigt Prozessoren mit vielen Kernen und Threads, um den Vorgang zu beschleunigen.

Software- und Spieleentwicklung

 

Threadripper™ Pro 3995WX Threadripper™ Pro 3975WX Threadripper™ 3990X Threadripper™ 3970X

Ob beim Generieren des Quellcodes oder beim Rendern von realistischen Lichtverhältnissen – die Threadripper™ spielen in diesem Segment ihre Stärken aus. Viele Kerne und Threads, gute Taktfrequenzen und ein großzügiger L3-Cache sind in diesem Anwendungsgebiet essenziell. Um die Performance der Threadripper™ und Intel®-Xeon®-Prozessoren miteinander zu vergleichen, hat pudgetsystem.com die Leistung der CPUs in der Unreal Engine getestet.

Quelle: pudgetsystems.com

Der Benchmark offenbart die Dominanz der Threadripper™ in dieser Disziplin deutlich. Die 64 Kerne des 3995WX zeugen von einer immensen Power, die in schnelleren Arbeitsabläufen und einer höheren Produktivität resultieren. Selbst der Threadripper™ Pro 3975WX ist dem Top-Modell von Intel® überlegen. Lediglich die 16-Kern-Ausführung von AMD muss sich weit hinten in der Rangliste anschließen, wobei die CPU immerhin den direkten Konkurrenten von Intel® schlägt.

Workstations mit Threadripper™-Prozessoren ausstatten? – Lohnt sich der Kauf?

Die Antwort auf diese Frage lautet ohne Zweifel: ja. Wie die Benchmarks von pudgetsystems.com gezeigt haben, sind die Kerngiganten von AMD in jedem Anwendungsgebiet führend. Ob visuelle Effekte, Postproduktionen, 3D-Konstruktionen oder die Softwareentwicklung – mit einem Threadripper™ profitiert Ihr von beschleunigten Prozessen und mehr Flexibilität. Bekannte Branchengrößen wie Epic Games setzen seit geraumer Zeit auf die Leistung der Threadripper™, um Entwicklungszeiten drastisch zu reduzieren.

Ebenso begeistert zeigte sich das Team von Blur Studio, das komplexe Szenen in Terminator: Dark Fate mithilfe der Threadripper™ binnen weniger Sekunden renderte.

Wer mit anspruchsvollen und rechenintensiven Aufgaben tagtäglich betraut ist, sollte unserer Meinung nach auf die Threadripper™ der dritten Generation von AMD setzen. Mit diesen bearbeitet Ihr aufwendige Projekte in Rekordzeit und genießt die unglaubliche Vielseitigkeit, die Euch nur CPUs mit smarter Architektur und innovativen Technologien bieten können.

Die Epyc™-Prozessoren von AMD – CPUs, die neue Maßstäbe im HPC-Bereich setzen

Der Markt der Server-Prozessoren wird hauptsächlich von Intel® dominiert. Das liegt in erster Linie nicht an einer deutlich besseren Performance, sondern daran, dass sich gewisse Branchen nur ungern von althergebrachten Technologien verabschieden. Mit der Epyc™-Serie der dritten Generation etabliert AMD neue Standards in puncto Leistung und Stärke. Während die Threadripper™ bislang auf der Zen-2-Architektur basieren, verfügen die Epyc™-CPUs über Zen 3.

Beim Chip-Design selbst hat sich zwischen den beiden Generationen wenig verändert. Der Hauptunterschied ist im Kernkomplex (CCX) zu finden, der bei Zen 3 keine Crossbar mehr aufweist. Dadurch greifen alle Kerne auf den 32 MB großen L3-Cache des CCDs zu. Ein CCD setzt sich dabei aus 8 Cores zusammen. Diese sind direkt mit dem Cache verbunden, wodurch sich die Latenzen stark reduzieren. Jedem Kern stehen 4 MB L3-Cache bei gleicher Verteilung bereit. Allerdings können einem einzelnen Core maximal 24 MB zugeteilt werden, während sich die restlichen Kerne die übrigen 8 MB untereinander aufteilen.

 

Der Vollausbau liegt dementsprechend wie schon bei Zen 2 bei 64 Cores und 128 Threads. Der Sockel ist mit SP3 ebenfalls unverändert. Dank der 8 Speicherkanäle sind bei Vollbestückung des Mainboards und den unterstützten 256 GB pro Einzelmodul RAM-Gesamtkapazitäten von bis zu 4 TB im Bereich des Möglichen. Darüber hinaus sind die Epyc™-Prozessoren mit PCIe 4.0 ausgestattet und weiterhin mit bis zu 124 PCIe-Lanes bei Einzelbestückung der CPU kompatibel. Im Falle eines Dual-Sockel-Systems sind es bis zu 164 PCIe-Lanes.

Einige Modelle der 3. Generation im Überblick

Die 7003-Reihe der Epyc™-Prozessoren bietet CPUs mit unterschiedlichen technischen Spezifikationen an. Das kleinste Modell – EPYC™ 72F3 – verfügt über 8 Kerne und 16 Threads, während die größten Ausführungen mit 64 Cores und doppelt so vielen Threads aufwarten. Die Speicherkapazität des L3-Caches beträgt zwischen 128 und 256 MB. In puncto PCIe-Lanes sind  keine Unterschiede zu vermerken. Die Taktraten fallen bei den Kerngiganten erwartungsgemäß sowohl im Basis- als auch im Turbo-Modus geringer aus als bei den kleinen Varianten.

Modell Kerne/

Threads

Frequenz

(Basic / Boost)

L3-Cache PCIe-Lanes Sockelanzahl TDP
AMD Epyc™ 7713 64 / 128 2,0 GHz / 3,675 GHz 256 MB 128 1P / 2P 225 – 240 Watt
AMD Epyc™ 7663 56 / 112 2,0 GHz / 3,5 GHz 256 MB 128 1P / 2P 225 – 240 Watt
AMD Epyc™ 7643 48 / 96 2,3 GHz / 3,6 GHz 256 MB 128 1P / 2P 225 – 240 Watt
AMD Epyc™ 75F3 32 / 64 2,95 GHz / 4,0 GHz 256 MB 128 1P / 2P 225 – 280 Watt
AMD Epyc™ 7443 24 / 48 2,85 GHz / 4,0 GHz 128 MB 128 1P / 2P 165 – 200 Watt
AMD Epyc™ 7343 16 / 32 3,2 GHz / 3,9 GHz 128 MB 128 1P / 2P 165 – 200 Watt
AMD Epyc™ 72F3 8 / 16 3,7 GHz / 4,1 GHz 256 MB 128 1P / 2P 165 – 200 Watt

Alle CPUs lassen sich mit einem Server-Prozessor des gleichen Typs kombinieren, sodass Ihr die Produktivität und Effizienz Eures Rechenzentrums optimiert. Wie gewohnt stehen Euch insgesamt 8 Speicherkanäle bereit, die Ihr am Mainboard mit bis zu 256 GB RAM pro Slot bestückt. Besonders positiv ist an dieser Stelle hervorzuheben, dass AMD seine Probleme unter Verwendung von nur 6 von 8 Speicherkanälen weitestgehend bereinigt hat. Hierfür setzt das Unternehmen auf Memory Interleaving, wodurch Euch 75 % der Leistung des gesamten Speicherinterface zur Verfügung stehen. Bei der Vorgängergeneration reduzierte sich die Performance bei einer unbalancierten Bestückung auf rund 40 bis 60 %.

Wie schlägt sich die Epyc™-Serie im Performance-Vergleich mit Intel®?

Server-Prozessoren verarbeiten sehr große Datenmengen. Eingesetzt werden sie beispielsweise im Bereich des Cloud-Computings, der Daten-Analyse, der Virtualisierung oder der Forschung. Hierbei zählen vor allem Skalierbarkeit, Sicherheit und Amortisierung. Das bedeutet, dass Unternehmen einerseits eine Hochleistungs-CPU der Enterprise-Klasse benötigen und andererseits eine Hardware, die die Kosten minimiert und gleichzeitig über angepasste Features zum Schutz der Daten verfügt. Eine Anforderung, die nur Server-Prozessoren erfüllen.

Um die Performance der dritten Generation der Epyc™-Reihe zu ermitteln, wollen wir uns die Benchmarks von vier CPUs in unterschiedlichen Anwendungen betrachten. Dafür haben wir uns je zwei Modelle von AMD und Intel® herausgesucht, die den hohen Ansprüchen von Servern gerecht werden.

Die CPUs im Überblick

Für unseren Vergleich haben wir die Epyc™-CPUs 7713 und 7443 sowie die Xeon®-Platinum-Varianten 8380 und 8280 ausgewählt. Alle Prozessoren sind speziell für Server konzipiert. Bereits ein erster Blick auf die technischen Details offenbart große Unterschiede zwischen den einzelnen Modellen. Bei der Anzahl der Kerne und Threads ist AMD mit dem Epyc™ 7713 führend, während der höchste Takt von den kleinsten Exemplaren von AMD und Intel® geliefert wird. Unterstützt werden von allen Exemplaren Dual-Sockel-Systeme, sodass eine gezielte Optimierung auf die Serverumgebung ermöglicht wird.

Modell Kerne/

Threads

Frequenz

(Basic / Boost)

L3-Cache PCIe-Lanes Sockelanzahl TDP
AMD Epyc™ 7713 64 / 128 2,0 GHz / 3,675 GHz 256 MB 128 1P / 2P 225 – 240 Watt
AMD Epyc™ 7443 24 / 48 2,85 GHz / 4,0 GHz 128 MB 128 1P / 2P 165 – 200 Watt
Intel® Xeon® Platinum 8380 40 / 80 2,3 GHz / 3,4 GHz 60 MB 64 2S 270 Watt
Intel® Xeon® Platinum 8280 28 / 56 2,7 GHz / 4,00 GHz 38,5 MB 48 2S 205 Watt

Der L3-Caches fällt bei Intel® vergleichsweise gering aus. Allerdings sollte an dieser Stelle erwähnt werden, dass ein großer L3-Cache nicht immer die treibende Kraft hinter einer guten CPU ist. Vielmehr zählen auch die Zugriffszeiten, bei denen Intel® durch sein monolithisches Chip-Design einen Vorteil besitzt. Latenzen werden dadurch reduziert und die mangelhafte Dimensionierung des Caches ausgeglichen. Abgesehen vom kleinsten Ableger verfügen die Prozessoren über den PCIe-4.0-Standard, der bei den AMD-Epyc™-Prozessoren mit 128 PCIe-Lanes und beim Xeon® Platinum 8380 mit 64 PCIe-Lanes kompatibel ist. Der Xeon® Platinum 8280 weist hingegen nur PCIe 3.0 auf und kann bis zu 48 Lanes verwalten.

Sowohl mit den AMD-Server-Modellen als auch mit dem Xeon® Platinum 8380 lassen sich RAM-Speicher mit bis zu 8 Speicherkanälen betreiben, die mit einer maximalen Taktfrequenz von 3.200 MHz ausgestattet sind. Die Kapazitätsgrenze wird bei Intel® mit 6 TB und bei den beiden Epyc™-CPUs mit 4 TB erreicht. Der 28-Kerner von Intel® weist nur 6 Speicherkanäle auf, mit denen ein Arbeitsspeicher von bis zu 1 TB realisierbar ist.

Im Folgenden schauen wir uns verschiedene Benchmarks an, um zu ermitteln, wie gut die Epyc™-Server-CPUs gegenüber den Exemplaren des Marktführers Intel® abschneiden. Dabei werden wir Anwendungen aus den unterschiedlichen Bereichen, wie beispielsweise Simulationen, Rendering und vieles mehr, betrachten. Die Tests wurden von der Plattform hardwareluxx.de und immer unter Verwendung von zwei Prozessoren des gleichen Typs durchgeführt.

Das 3D-Rendering

Anwendungen zum Rendering von Objekten profitieren von vielen Kernen und Threads. Dementsprechend dürfte an dieser Stelle AMD seine Stärken ausspielen. Denn die Intel®-Xeon®-CPUs sind mit deutlich weniger Cores ausgestattet als das Spitzenmodell der Konkurrenz. Eine beliebte 3D-Grafiksuite ist Blender. Mit diesem Tool lassen sich Grafiken und Körper erstellen, modellieren und animieren. Die Software selbst bietet verschiedene Test-Szenen, die die CPU berechnen muss. Dabei ermittelt Blender die Zeit, die der Prozessor zum Rendern benötigt. Aus den sieben zur Verfügung stehenden Szenen haben wir uns vier herausgesucht, um die Performance der Server-Prozessoren miteinander zu vergleichen. Die Ergebnisse werden in Sekunden wiedergegeben.

Quelle: hardwareluxx.de

Wie bereits vermutet, schneidet der 64-Kerner von AMD im Rendern von 3D-Objekten am besten ab. Auf Platz zwei hat sich der Xeon® Platinum 8380 eingefunden, der neutral betrachtet die Szenen bmw 27, fishy_cat und koro in guten Zeiten berechnet. Lediglich in dem Benchmark für den classroom ist der Unterschied zwischen den Spitzenreitern von AMD und Intel® mehr als offensichtlich. Mit ganzen 15 Sekunden Vorsprung verweist der Epyc™ 7713 die Konkurrenz in ihre Schranken und zeigt, was eine 64-Kern starke Server-CPU zu leisten imstande ist.

Die Simulationen

Simulationen sind hoch rechenintensive Anwendungen, bei denen die Einflussnahme verschiedener Faktoren und deren Auswirkungen veranschaulicht werden. Dementsprechend komplex sind die Berechnungen, die die CPU durchführen muss. Da die Anforderungen an den Prozessor in diesem Gebiet sehr unterschiedlich ausfallen können, betrachten wir die Performance unserer vier Kandidaten im LAMMPS-, Monte-Carlo- und NAMD-Simulator.

Quelle: hardwareluxx.de

Der LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator) simuliert die Dynamik von Molekülen. Für den Performance-Test stehen zwei Szenarien bereit, einmal mit 20.000 Atomen und einmal mit dem Rhodopsin-Molekül. Wie beim 3D-Rendering sind auch hier viele Threads gefragt. Die Ergebnisse des Benchmarks sind in Nanosekunden pro Tag angegeben, wobei höhere Werte ein besseres Resultat bedeuten.

Im LAMMPS-Benchmark schneiden die Epyc™-CPUs erwartungsgemäß sehr gut ab. Allerdings zeigt sich, dass reine Kern-Power nicht immer ausreichend ist, um eine führende Position zu übernehmen. Denn der Xeon® Platinum 8380 verdrängt den Kerngiganten von AMD zumindest im Szenario mit 20.000 Atomen vom Thron. Auf den ersten Blick mag das verwundern, aber bei genauerer Betrachtung nicht mehr. Der Vorteil den Intel® an dieser Stelle ausspielt ist die AVX-512-Befehlssatzerweiterungen, die zu einer starken Beschleunigung der Arbeitsprozesse führt. Den Epyc™-Prozessoren fehlt diese Befehlserweiterung gänzlich, wodurch der Epyc™ 7713 bei der Simulation von 20.000 Atomen lediglich den zweiten Platz belegt.

Dass dieses Feature jedoch nicht in jedem Fall mit einer sehr guten Performance gleichzusetzen ist, offenbart der zweite Benchmark mit dem Rhodopsin-Molekül, bei dem sich die beiden Spitzenmodelle ein Kopf-an-Kopf-Rennen liefern.

Quelle: hardwareluxx.de

Nicht jede Simulation profitert von einer hohen Anzahl an Kernen. Das zeigt sich unter anderem beim Monte-Carlo-Benchmark. Dieser beruht auf Wahrscheinlichkeitsberechnungen und dient beispielsweise zur Ermittlung finanzieller Risiken. Der Test bestimmt die Zeit, die ein Prozessor benötigt, um eine bestimmte Aufgabe zu lösen. Dementsprechend sind die Ergebnisse in Sekunden angegeben, wobei ein geringerer Wert gleichzusetzen ist mit einer Reduzierung des Aufwands.

In dieser Disziplin schneidet der Epyc™ mit seinen 24 Kernen am besten ab. Der Xeon® Platinum 8380 kann den zweiten Platz belegen, während der Epyc™ 7713 die Bronze-Medaille erlangt. Weit abgeschlagen findet sich mit 280 Sekunden der Xeon® Platinum 8280. Doch wie ist dieser Benchmark zu verstehen? Immerhin haben wir ja gesagt, dass der Monte-Carlo-Test nicht auf viele Kerne setzt. Daher wäre die Vermutung naheliegend gewesen, dass der 28-Kerner von Intel® ebenfalls eine gute Position einnimmt.

Das Geheimnis bei diesem Benchmark liegt jedoch nicht allein in der Singlecore-Performance, sondern in der Kernleistung und dem Cache. Je mehr Instruktionen pro Zyklus (IPCs) ein Core ausführen kann und je höher der verfügbare L3-Cache ist, desto mehr Befehle lassen sich binnen kürzester Zeit verarbeiten. Hier profitieren die Epyc™-CPUs von ihrem 256 bzw. 128 MB großen Cache und von ihrem PCIe-4.0-Standard. Das sind zwei Aspekte, die dem Xeon® Platinum 8280 gänzlich fehlen.

Das Media-Encoding

Das Media-Encoding gehört mit zu den wichtigsten Aufgabenfeldern eines Servers. Immerhin bieten uns zahlreiche Streaming-Dienste die Option, Filme und Serien anzuschauen oder einen YouTuber live beim Zocken zu verfolgen. Die notwendigen Inhalte werden in Rechenzentren zur Verfügung gestellt und müssen von den Servern codiert und versendet werden. In welchem Format die Daten kodiert werden, ist abhängig vom Medium. Beliebte Verfahren zur Kompression von Videodateien sind beispielsweise AV1, VP9 und HEVC. Der folgende Benchmark zeigt, wie viele Bilder pro Sekunde die Prozessoren berechnen. Ein höherer Wert steht für eine bessere Leistung.

Quelle: hardwareluxx.de

In dieser Disziplin laufen die Epyc™-Prozessoren den Intel®-Modellen förmlich weg. Hier offenbart sich deutlich, dass im Media-Encoding viele Kerne und Threads von Vorteil sein können. Aber auch eine gute Taktfrequenz ist angesichts der übezeugenden Performance des Epyc™ 7443 nicht zu vernachlässigen.

Die Komprimierungen

Das Komprimieren von Dateien hat mehrere Vorteile. Zum einen nehmen die Archive weniger Speicherkapazität in Anspruch und zum anderen reduziert sich die Datenübertragungszeit deutlich. Beides führt wiederum zu Kosteneinsparungen im Segment der Speichermedien und der Netzwerkbandbreite. Daher nutzen Server zur Komprimierung von Dateien Programme wie 7Zip, das zahlreiche Formate unterstützt und die Option zur Verschlüsselung der Archive bietet.

Der folgende Benchmark veranschaulicht wie schnell die Prozessoren Daten Komprimieren und Dekomprimieren. Die Werte sind in MIPS (million instructions per second) angegeben. Dementsprechend ist ein höheres Ergebnis besser.

Quelle: hardwareluxx.de

Wie beim Kodieren von Medien-Inhalten sind auch hier Hyperthreading und hohe Taktraten gefragt. Daher überrascht es wenig, dass der Epyc™ 7713 mit seinen 64 Cores die meisten Befehle pro Sekunde bearbeitet. Unerwarteterweise ist jedoch der Xeon® Platinum 8380 in der Lage, mehr Instruktionen zu verwalten als der Epyc™ 7443, der mit höheren Taktraten aufwartet. Das ist ein Indiz dafür, dass beim Komprimieren von Dateien der Fokus vermehrt auf der Kernanzahl liegt und nicht auf der Taktfrequenz.

Die AI- und ML-Anwendungen

Künstliche Intelligenzen sind aus unserem Alltag nicht mehr wegzudenken. Und gerade im Server-Bereich spielen sie eine große Rolle. Mit ihnen lassen sich Bewegungsabläufe nachvollziehen, die Verbreitung eines Virus simulieren oder Renderings im Bereich der Filmproduktionen vornehmen. Letzteres zählt zu den klassischen Anwendungsgebieten und ist stark mit dem Raytracing verknüpft. Dieses sorgt dafür, dass animierte Szene in einem natürlichen Licht erstrahlen.

Um ein einzelnes Bild mit einer Auflösung von 2.048 x 858 Pixel mit realistischen Schatten- und Lichtverhältnissen zu versehen, benötigen Server-CPUs mehrere Minuten. Das anschließende Entrauschen, sozusagen das Bereinigen des Bildes von fehlenden Samples ist ebenfalls zeitaufwendig. Wird diese Methode auf die gesamte Spielzeit eines animierten Films mit einer Länge von 90 Minuten und rund 130.000 Einzelbildern angewandt, ist mit einer Renderzeit von mehreren hundert Tagen zu rechnen, wenn ein Server mit 2 Prozessoren ausgestattet ist. Anhand dieser einfachen Berechnung lässt sich sehr gut nachvollziehen, dass selbst wenige Performance-Boni eine enorme Zeitersparnis in der Bewältigung eines Projekts bedeuten.

Ein beliebtes Tool, um die Leistung einer CPU im Raytracing und Entrauschen zu testen, ist OSPRAY und der Open-Image-Denoiser. Dabei wird die Moana-Island-Szene von den Walt Disney Animation Studios gerendert. Der Benchmark ermittelt die Dauer, die die Prozessoren zur Berechnung des Raytracings und des Entrauschens aufwenden. Die angegebenen Werte spiegeln die Zeit in Sekunden wider, sodass niedrigere Resultate für eine bessere Performance stehen.

Quelle: hardwareluxx.de

Beim Raytracing kann der Epyc™ 7713 von seinen 64 Kernen Gebrauch machen und weist mit 131,2 Sekunden die kürzeste Dauer auf. Am längsten benötigt erwartungsgemäß der Epyc™ 7443, der aufgrund seiner 24 Cores hinter den Intel®-CPUs zurückfällt. In der Disziplin des Entrauschens müssen sich die AMD-Server-Prozessoren der Konkurrenz geschlagen geben. Das liegt weder an der Anzahl der Kerne noch an der Taktfrequenz oder der Kernleistung. Ganz im Gegenteil profitieren die Xeon®-Modelle, wie bereits bei den LAMMPS-Simultionen, von ihrer Befehlssatzerweiterung. Im Gesamtscore wirkt sich das so aus, dass der Intel® Xeon® 8380 im Rendern als Sieger hervorgeht. Allerdings muss an dieser Stelle angemerkt werden, dass es sich bei den 152,2 Sekunden um einen Tippfehler seitens hardwareluxx handelt. Fassen wir das Raytracing und Entrauschen zusammen, kommen wir auf eine Dauer von 157,4 Sekunden, was jedoch am Platz 1 nichts ändert. Die Silbermedaille erlangt der Epyc™ 7713 mit 179,2 Sekunden, während der 24 Kern starke Epyc™ 7443 mit 384,3 Sekunden weit zurückliegt.

Mit Epyc™-Prozessoren im Server-Bereich durchstarten?

Im Prozessoren-Segment steht Ihr vor der Wahl: AMD oder Intel®. Unter Betrachtung des Portfolios der beiden Unternehmen fällt sofort auf, dass AMD CPUs mit wesentlich mehr Kernen anbietet. Mit bis zu 64 Cores ist Team Red bis dato ungeschlagen. Intel® kann in diesem Gebiet nicht punkten. Die Obergrenze liegt hier derzeit bei 40 Kernen, sodass bei multithreaded Anwendungen auf ein Dual- oder Quad-Socket-System zurückgegriffen werden muss. Das erhöht allerdings die Anschaffungskosten enorm.

Darüber hinaus mangelt es den Intel®-Prozessoren an einem ordentlichen L3-Cache. Mit bisher maximalen 60 MB sind die Xeon®-CPUs gefühlt meilenweit entfernt von den Epyc™-Modellen. Dafür punktet Team Blue mit dem Befehlserweiterungssatz, der in einigen Tools für einen deutlichen Performance-Schub sorgt und die Schwächen von Intel® sehr gut ausgleicht.

Nach unserer Reflexion der Benchmarks für unterschiedliche Einsatzgebiete stellt sich ein gemischtes Ergebnis dar. Einerseits profitieren die Server-CPUs von AMD in vielen Bereichen von ihrer hohen Kernzahl und in gewissen Segmenten wie dem Kodieren von Medien-Inhalten oder dem Komprimieren von Dateien ist die Epyc™-Reihe momentan unbesiegbar. Gemischte Resultate zeigen sich vorwiegend bei Simulationen, während das Rendern von Objekten wieder zu den Stärken von AMD zählt.

Im Großen und Ganzen ist die Eignung der Epyc™-Server-Prozessoren von ihrem Anwendungsgebiet abhängig. Programme, die auf viele Kerne und Threads setzen, sind mit Sicherheit mit einer AMD-CPU gut bedient. Steht der Fokus zudem auf einen hohen Cache und gute Taktraten geht unsere Empfehlung glasklar zu einem Epyc™-Prozessor der dritten Generation.