Power10: Die Cloud-CPU von IBM bietet die dreifache Leistung

IBM hat den Power10 eingeführt, einen Prozessor für Cloud-Server. Mit drastisch überarbeiteten CPU-Kernen, einem Dual-Chip-Ansatz und doppelt so vielen Speicherkanälen sollte der Power10 die dreifache Geschwindigkeit des vorherigen Power9 erreichen.

Stellenmarkt

  1. HRI IT-Services GmbH, Berlin
  2. Upshift Media GmbH, Taunusstein bei Wiesbaden

Die technische Basis des Power10 ist ein Chip mit einer Fläche von 602 mm², der 18 Milliarden Transistoren enthält. Für die Produktion verwendet IBM das 7LPP-Verfahren von Samsung Foundry, dh 7 nm mit extremer ultravioletter Strahlung (EUV). Zum Vergleich: die Power9 kommt mit 8 Milliarden Transistoren auf 693 mm² und wurde mit Globalfoundries 14HP hergestellt. Das zugehörige Fab 10 in East Fishkill, Bundesstaat New York, gehörte einst IBM, wurde jedoch 2014 an Globalfoundries verschenkt.

Während der Power9 noch 12 Kerne mit SMT8 oder 24 Kerne mit SMT4 hatte, hat der Power10 physisch 8 Kerne mit SMT8 oder 16 Kerne mit SMT4. Es sind jedoch nur 15 davon aktiviert, weshalb die Anzahl der logischen Kerne oder Hardware-Threads von 96 auf 120 steigt. IBM hat die einzelnen Kerne erheblich verbessert, Big Blue spricht von 30 Prozent mehr Leistung. Um dies zu erreichen, kommt ein Drittel mehr Befehle aus dem L1I-Puffer, es gibt eine schnellere Verzweigungsvorhersage, doppelt so breite SIMD-Einheiten (128 Bit statt 64 Bit), größere Puffer und bis zu vierfache Caches mit kürzeren Latenzen.

Power10-Präsentation (Bild: IBM)

Ein Block für Matrixmultiplikationen ist völlig neu; Diese werden zur Inferenz verwendet, dh zur Ausführung eines bereits trainierten neuronalen Netzwerks. Diese Schlussfolgerung kann mit doppelter Genauigkeit (FP64), einfacher Genauigkeit (FP32), halber Genauigkeit (BF16 und FP16) und reduzierter Genauigkeit (INT8 und INT4) durchgeführt werden. Dank vier 512-Bit-Einheiten verwaltet ein SMT8-Kern bis zu 1.024 Operationen pro Takt. Im Vergleich zum Power9 erhöht sich die Inferenzgeschwindigkeit um das 10-fache (Resnet-50 mit FP32) gegenüber dem 15-fachen (Resnet-50 mit BF16) auf das 20-fache (Resnet-50 mit INT8).

READ  Viele Menschen mit Asthma suchten im World-wide-web Rat

Jeder Chip verfügt über 16 Schnittstellen für anfänglich 4 TB DDR4-3200, die Bandbreite beträgt 410 GB / s. Der ursprüngliche Power9 SO (Nimbus) erreicht 120 GByte / s, der spätere Power9 SU (Cumulus) 230 GByte / s und der nachfolgende Power9 AIO (Axone) bis 350 GB / s. Auch hier verwendet IBM die Open Memory Interface (OMI), um den Speicher zu verbinden. Neben DDR4 später auch DDR5 Grundsätzlich sind auch sogenannte OMI-DDIMMs (sic!) Mit Speicher mit hoher Bandbreite für über 1 TByte / s oder nichtflüchtigem Speicher der Speicherklasse denkbar.

Dank der überarbeiteten Architektur und des 7LPP-Prozesses konnte laut IBM die Leistung pro Watt um den Faktor 2,6 gesteigert werden. Big Blue bietet den Power10 daher als SCM (Single Chip Module) mit über 4 GHz und 32 PCIe Gen5-Lanes und als DCM (Dual Chip Module) mit über 3,5 GHz und 64 PCIe Gen5-Lanes an. Da zwei Chips in einem Paket berechnet werden, bietet der Power10 (DCM mit 30C / 240T) die dreifache Leistung des Power9 (12C / 96T) – unabhängig davon, ob es sich um Enterprise, Float oder Integer handelt. Nur die effektive Speicherbandbreite wurde nur verdoppelt, aber mit DDR5 sollte dies vervierfacht werden.

Als SCM-Variante bietet IBM den Power10 für bis zu 16 Sockets an, in der DCM-Variante sind bereits vier Sockets vorbei. Die CPUs unterstützen AIX, IBMi, Linux und OpenShift, wobei die Betriebssysteme und die Containerplattform auf dem PowerVM-Hypervisor parallel ausgeführt werden können. IBM erwartet die ersten Systeme mit Power10 in der zweiten Hälfte des Jahres 2021.

Bitte aktivieren Sie Javascript.
Oder benutze das Pures Golemangebot
und lies Golem.de

  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed

READ  Influenza, Erkältung oder Coronavirus: So diagnostizieren Sie Symptome richtig

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.