Supercalculateurs IBM

Cet article est consacré aux supercalculateurs IBM récents. Le but est de fournir une description relativement succincte de ces superordinateurs méconnus du grand public. Ils ont la particularité d’utiliser des processeurs POWER9.

SUPERCALCULATEURS LES PLUS PUISSANTS DU MONDE

Le classement qui fait référence en la matière est celui de TOP500.org. Il liste, tous les 6 mois, les 500 supercalculateurs les plus puissants du monde.

IBM occupe les deux premières places depuis mai 2018 avec le SUMMIT et le SIERRA.

Au total, il y a 17 serveurs IBM dans cette liste, dont 13 avec des processeurs POWER, ils occupent les places suivantes :

  • 1er (SUMMIT) – IBM POWER9
  • 2ème (SIERRA) – IBM POWER9
  • 10ème (Lassen) – IBM POWER9
  • 11ème (PANGEA III) – IBM POWER9
  • 12ème (Sequoia) – IBM POWER7
  • 24ème (AiMOS) – IBM POWER9
  • 49ème (Vulcan) – IBM POWER7
  • 71ème (HPC2) – Intel Xeon
  • 85ème (SuperMUC) – Intel Xeon
  • 86ème (SuperMUC Phase 2) – Intel Xeon
  • 120ème (Longhorn) – IBM POWER9
  • 352ème (IBM Development Engineering) – IBM POWER7
  • 373ème (Satori) – IBM POWER9
  • 381ème (Blue Joule) – IBM POWER7
  • 422ème (Ansel) – IBM POWER9
  • 439ème (Yellowstone) – Intel Xeon
  • 494ème (MareNostrum) – IBM POWER9

Classement TOP500 de novembre 2019


Les deux supercalculateurs d’IBM occupant les premières places du classement (SUMMIT et SIERRA) font partie du projet CORAL (Collaboration Oak Ridge Argonne Livermore).

SUMMIT

Calculateur le plus puissant du monde depuis mai 2018. Situé au Oak Ridge National Laboratory (ORNL) dans le Tennessee, rendu célèbre en étant le principal site du projet Manhattan (construction des bombes atomiques américaines de la seconde guerre mondiale).

Le SUMMIT est utilisé pour des projets d’Intelligence Artificielle et pour des simulations dans les domaines de la médecine, de la biologie et de la physique.

  • 4 608 serveurs AC922 (256 racks de 18 serveurs)
  • 2 processeurs POWER9 22 cores par serveur AC922
  • 202 752 cores
  • 2,67 PiB de mémoire (512 GiB (POWER9) + 96 GiB (GPU) par serveur)
  • 27 648 GPU (6 par serveur)
  • 10 à 15 MW (environ 1 à 2% d’un réacteur nucléaire)
  • 200  millions de dollars US
  • 201 millions de milliards d’opérations à la seconde (201 Petaflops)

Vue globale du SUMMIT

Vidéo accélérée, de l’installation du SUMMIT.

Le 6 mars 2020, le Département US de l’Energie annonce que le SUMMIT va être mis à contribution pour apporter son aide dans la lutte contre le virus COVID-19.

US Dept of Energy Brings the World’s Most Powerful Supercomputer, the IBM POWER9-based Summit, Into the Fight Against COVID-19


SIERRA

Second calculateur le plus puissant du monde, il est situé au Lawrence Livermore National Laboratory en Californie.

  • 4 320 serveurs AC922 (240 racks de 18 serveurs)
  • 2 processeurs POWER9 22 cores par serveur AC922
  • 190 080 cores
  • 1,32 PiB de mémoire (256 GiB (POWER9) + 64 GiB (GPU) par serveur)
  • 17 280 GPU (4 par serveur)
  • 7,5 MW (environ 1% d’un réacteur nucléaire)
  • 125  millions de dollars US
  • 125 millions de milliards d’opérations à la seconde (125 Petaflops)

Vue globale du SIERRA


PANGEA III

Le PANGEA III n’est que 11ème dans le classement TOP500 mais il s’agit du plus grand supercalculateur industriel du monde, donc du plus grand supercalculateur privé du monde. En effet, tous les supercomputers en tête de cette liste font partie de laboratoires de recherche publics américains, chinois, suisses, japonais ou allemands, mais le PANGEA III est un supercalculateur appartenant à la société française Total.

  • 558 serveurs AC922 (31 racks de 18 serveurs)
  • 2 processeurs POWER9 18 cores par serveur AC922
  • 20 088 cores
  • 3 348 GPU (6 par serveur)
  • 1,5 MW
  • 25 millions de milliards d’opérations à la seconde (25 Petaflops)

PANGEA III est situé au Centre Scientifique et Technique Jean-Féger (CSTJF) à Pau (Pyrénées Atlantiques), qui est le principal centre technique et de recherche scientifique du groupe Total.

GRAF

GRAF (Global High-Resolution Atmospheric Forecasting System) est un système de prévisions météorologiques qui dispose de la plus haute résolution du monde. Basé sur des serveurs POWER9 AC922, il permet d’avoir une précision à 3 Km avec une réactualisation horaire. alors que les autres systèmes ont une précision à 10 -15 Km avec une réactualisation à 6-12 heures.

  • 84 serveurs AC922
  • 2 processeurs POWER9 par serveur AC922
  • + de 3 000 cores
  • 3,5 PB de stockage IBM Spectrum Scale
  • 336 GPU NVIDIA Tensor (4 par serveur)
  • 10 TB de données produites par jour

GRAF est utilisé par la société de météorologie The Weather Company, propriété d’IBM.

AC922 (Accelerated Compute)

Tous ces supercalculateurs sont des clusters élaborés à partir de serveurs IBM de la gamme Power et particulièrement du modèle Power AC922 (Accelerated Compute).

Le Power AC922 est un des modèles de la gamme Power Systems d’IBM comme ceux qui sont utilisés pour l’IBM i (ex : Power S914) à la différence près, qu’il ne supporte pas le moteur de virtualisation PowerVM et par conséquent il ne supporte pas les Operating Systems AIX et IBM i.

La grande différence hardware entre le modèle AC922 et les S9xx, est la présence de GPU (Graphics Processing Unit) couplées aux processeurs POWER9. Ces dernières permettent d’augmenter sensiblement les capacités de traitement.

Voici la gamme des serveurs POWER9 (décembre 2019) du configurateur IBM, dans laquelle on trouve le modèle AC922.

La gamme de serveurs POWER9 vue graphiquement avec, dans la partie HPC (High-Performance Computing) / AI (Artificial Intelligence), le serveur Power AC922.


Actuellement (décembre 2019), le serveur AC922 est commercialisé en deux modèles, chacun se déclinant en deux versions de processeur comprenant 2 POWER9 par serveur :

  • 8335-GTH (air cooling)
    • #EP71
      • POWER9 – 16-core – 2,70 à 3,30 GHz
      • 32 cores au total
      • 4 GPU NVIDIA Tesla V100
    • #EP73
      • POWER9 – 20-core – 2,40 à 3,00 GHz
      • 40 cores au total
      • 4 GPU NVIDIA Tesla V100

  • 8335-GTX (water cooling)
    • #EP72
      • POWER9 – 18-core – 3,15 à 3,45 GHz
      • 36 cores au total
      • 6 GPU NVIDIA Tesla V100
    • #EP74
      • POWER9 – 22-core – 2,80 à 3,10 GHz
      • 44 cores au total
      • 6 GPU NVIDIA Tesla V100

La principale différence entre les modèles GTH et GTX consiste dans le fait que le modèle GTH est refroidi à l’air tandis que le GTX est refroidi à l’eau afin de pouvoir supporter des fréquences plus élevées et un plus grand nombre de cores.

Ce sont ces modèles refroidis à l’eau, qui sont utilisés par les supercomputers SUMMIT, SIERRA et PANGEA III.

Pour information, les modèles 8335-GTC, 8335- GTG et 8335- GTW ne sont plus commercialisés.


Et pour terminer, quelques images du serveur et de ses principaux composants.

Vue arrière du serveur AC922


La GPU (Graphics Processing Unit) NVIDIA Tesla V100 avec NVLink intégré


Le processeur POWER9


Le design du processeur POWER9 (24-core)


Le processeur POWER9 recouvert du diffuseur de chaleur