Performances serveurs Power E1080 vs Power E980

A chaque génération, la puissance d’un processeur augmente fortement par rapport à la génération précédente.

Cet article à pour but de comparer les performances brutes des nouveaux serveurs à base de processeur Power10 par rapport à ceux pourvus de processeurs POWER9 et de mesurer si le gain de performances est au rendez-vous.

Disponibles depuis mi-septembre, les premiers serveurs à base de processeur Power10 ne sont, pour l’instant, commercialisés que dans la gamme High-End. Ce « match » va donc opposer le Power E1080 à son prédécesseur le Power E980.

SOMMAIRE

1 – Comparaison des caractéristiques des processeurs POWER9 / Power10

Commençons par comparer les principales caractéristiques des processeurs POWER9 et Power10.

CaractéristiquesPOWER9Power10
Surface du die (mm2)695602
Dimensions du module complet (mm)68,5 x 68,568,5 x 77,5
Lithographie (nm)147
Fréquence max (GHz)4,004,15
Max Cores / Chip12 ou 2415 ou 30
Threads / core1 – 2 – 4 – 81 – 2 – 4 – 8
Cache L2 / core (KiB)5122 048
Cache L3 / chip (MiB)120120
Cache L3 / core (MiB)10 ou 58 ou 4
Max Threads / socket96120
  • La gravure des Power10 est à 7 nm contre 14 nm pour les POWER9, ce qui permet, sur une surface quasiment identique d’intégrer plus du double du nombre de transistor. Il y a désormais 18 milliards de transistors sur un chip Power10.
  • La fréquence maximale est légèrement supérieure à celle des POWER9 (4,15 GHz contre 4,00 GHz).
  • Le socket processor Power10 accueille 25% de cores en plus que son prédécesseur. On passe à 15 cores contre 12 pour la version full-core, et à 30 cores contre 24 pour la version half-core (dédiée aux serveurs Linux).
  • La taille du cache L3 est identique ce qui signifie que chaque core Power10 dispose de 20% de cache L3 en moins que les cores POWER9, en revanche, la taille des caches L2 par core a été quadruplée.
  • Le nombre maximal de threads par core reste le même, à savoir 8. Pour comparaison les processeurs Intel, n’en disposent que de … 2.
  • Plus de core par socket processeur signifie également plus de threads actifs simultanés. On passe en effet de 96 à 120 threads maximum par socket processor. C’est-à-dire qu’un processeur physique peut exécuter jusqu’à 120 process simultanés.

2 – Comparaison des caractéristiques des modèles Power E980 / Power E1080

Tableau comparatif des modèles High-End Power E980 / Power E1080.

CaractéristiquesPower E980Power E1080
Technologie processeurPOWER9Power10
Packaging processeurSingle Chip Module
(SCM)
Single Chip Module
(SCM)
Fréquence max (GHz)4,004,15
Core / SCM6 – 8 – 10 – 11 – 1210 – 12 – 15
Max cores / système192240
Sockets / node44
Nodes / système1 – 2 – 3 – 41 – 2 – 3 – 4
Mémoire max / node (TiB)1616
Mémoire max / système (TiB)6464
Bande passante / node (GiB/sec)9201 636
Bande passante / système (GiB/sec)3 6806 544
Pervasive memory encryptionNonOui
Nombre de slots PCIe / node8 x Gen 48 x Gen 5
Acceleration portsOui
CAPI 2.0
OpenCAPI 3.0
Oui
OpenCAPI 3.0
OpenCAPI 3.1
Support PCIe Hot PlugOuiOui
Drives / node4 x NVMe Gen 34 x NVMe Gen 4
Technologie mémoireDDR3 / DDR4DDR4 / DDR5
Techologie PCIePCIe Gen 4PCIe Gen 5
  • Le nombre de nodes maximum est identique.
  • Le nombre de socket par node est identique.
  • La quantité de mémoire par node et par système est identique.
  • En revanche, la bande passante par node et par système fait un bond de 80%.
  • Les différentes technologies utilisées (NVMe, PCIe, mémoire et accélération) passent à la génération supérieure (Gen + 1).

3 – Comparaison du nombre de threads par génération de processeur

Chaque génération de processeur POWER voit évoluer ses caractéristiques comme le nombre maximum de cores et la technologie mutithreading.

Vous pouvez vous référez à nos articles sur l’architecture processeur et sur le multithreading pour mieux comprendre la notion de thread.

Voici un tableau récapitulatif de l’évolution du nombre de threads maximum par processeur.

Technologie
processeur
Nombre maximum de cores / systèmeModes SMT
supportés
Nombre maximum
de threads
POWER432132
POWER5641 – 2128
POWER6641 – 2128
POWER72561 – 2 – 41 024
POWER81921 – 2 – 4 – 81 536
POWER91921 – 2 – 4 – 81 536
Power102401 – 2 – 4 – 81 920

1 : ST (Single Thread)
2 : SMT2 (Simultaneous MultiThreading 2 Threads)
4 : SMT4 (Simultaneous MultiThreading 4 Threads)
8 : SMT8 (Simultaneous MultiThreading 8 Threads)

Le Power10 repousse les limites du nombre maximum de threads par processeur mais également par système. Ainsi, le Power E1080 permet d’exécuter jusqu’à 1 920 thread simultanés contre 1 536 sur les POWER8 (Power E880 / Power E880C) et POWER9 (Power E980).

4 – Comparaison du nombre de transistors et de la lithographie par génération de processeur

Le nombre de transistors par processeur ne cesse d’augmenter à chaque génération, voici un graphique comparant les valeurs depuis le POWER4 jusqu’au Power10.

Pour information, l’unité de ce graphique est bien en milliards ! Cela n’est pas une erreur.

  • Un puce Power10 est composée de … 18 milliards de transistors. Ce chiffre est impressionnant. Le milliard de transistors avait été franchi avec les processeurs POWER7, quelques années plus tard, les puces IBM POWER en disposent de 15 fois plus !
  • Il y a 2,25 fois plus de transistors que sur la génération précédente (POWER9) et 4,3 fois plus que sur les POWER8.

L’augmentation du nombre de transistors permet d’accroître les capacités de traitement d’un processeur. Étant donné que les dimensions des processeurs n’augmentent pas, c’est donc la réduction de la taille des transistors et donc la finesse de gravure (la lithographie) qui permet d’augmenter considérablement le nombre de transistors sur une puce. Le tableau ci-dessous montre l’évolution depuis le POWER4 jusqu’au Power10.

  • La taille des transistors des Power10 a été divisée par 3 par rapport à celle de la génération POWER8 et par 2 par rapport à celle des POWER9.

5 – Comparaison des performances Power E980 / Power E1080

Le CPW (Commercial Processing Workload) est l’unité de mesure permettant de comparer les performances des systèmes POWER exécutant de l’IBM i.

IBM publie régulièrement ces mesures dans le document Performance Report. Nous allons comparer les résultats entre les deux systèmes.

Voici le tableau des performances du Power E980 (POWER9) par modèle et par nombre de cores. La colonne CPW correspond à la capacité totale du serveur alors que la colonne CPW par core (en jaune) permet une comparaison de la capacité d’un seul core.

On constate que la valeur maximale d’un système est supérieure à 2,7 millions de CPW (2 743 000) et que la valeur d’un core, suivant le modèle, est comprise entre 14 250 et 15 903 CPW.


Tableau des performances en CPW des serveurs Power E1080 (Power10).

La puissance maximale d’un serveur dépasse les 5,2 millions de CPW (5 266 000) et la valeur d’un core est comprise entre 21 883 et 23 531 CPW.


Pour comparer équitablement, il faut comparer des modèles à nombre de cores identiques. Etant donné que les gammes ne correspondent pas totalement car les Power E980 sont commercialisés en 6, 8, 10, 11 et 12 cores par socket et les Power10 le sont en 10, 12 et 15 cores par socket, seuls les modèles 10 et 12 cores par socket peuvent être comparés.

==> Le résultat est à la hauteur des espérances, la génération Power10 affiche des performances supérieures à celles du POWER9 de 50% sur les modèles 10-core et de près de 65% sur les modèles 12-core.

Les modèles Power10 Scale-Out (Power S1014, Power S1022 / H1022, Power S1024 / H1024) et Midrange (Power E1050) seront commercialisés dans quelques mois. On peut donc s’attendre à des gains de performances par rapport aux POWER9 d’au moins 50%.

La gamme et les noms des modèles ne sont pas officiels, mais on peut dire qu’il s’agit d’un secret de polichinelle et qu’elle devrait ressembler à celle présentée ci-dessous.

Twitter