Accueil Réflexion prospective Nous obtenons deux nouveaux superordinateurs massifs

Nous obtenons deux nouveaux superordinateurs massifs

2024

Vidéo: "Jean Zay", le nouveau super calculateur de Saclay, puissant comme 40 000 ordinateurs personnels (Novembre 2024)

Le gouvernement américain a fait le pari que des supercalculateurs plus rapides contribueraient à résoudre certains des problèmes les plus importants de la science, avec des plans pour construire deux énormes supercalculateurs, chacun étant plusieurs fois plus rapide que les machines les plus rapides d’aujourd’hui.

Cela comprend 325 millions de dollars pour la construction des nouveaux supercalculateurs, y compris une nouvelle machine appelée Summit at Oak Ridge National Laboratories (ORNL) et une autre appelée Sierra au Lawrence Livermore National Laboratory (LLNL), ainsi que 100 millions de dollars pour la recherche et le développement dans des environnements extrêmes. la technologie de calcul à grande échelle dans un programme appelé FastForward2. Summit devrait fournir 150 à 300 pétaflops / s en pointe (quadrillions de calculs en virgule flottante par seconde), et Sierra à plus de 100 pétaflops / s par rapport aux 54, 9 pétaflops en pointe / s de la machine la plus rapide du moment (le Tianhe-2) sur la route. vers "l'informatique exascale".

Pour mettre cela en perspective, la puissance de calcul totale des systèmes Top500 d'il y a quelques mois était de 274 pétaflops / s (une nouvelle liste Top500 paraîtra la semaine prochaine parallèlement au salon SuperComputing 14). Les deux systèmes seront construits par IBM et basés sur les processeurs à architecture IBM Power, les GPU Nvidia Tesla et les interconnexions Mellanox.

Tom Rosamilla, vice-président d’IBM Systems & Technology Group, a décrit les systèmes comme utilisant une nouvelle «architecture centrée sur les données», conçue pour éliminer autant que possible les mouvements de données en rapprochant celles-ci de l’informatique. Selon IBM, cette solution est conçue pour fournir une modélisation, une simulation, des applications et des analyses de pointe rentables sur le Big Data, et tire parti de l’initiative OpenPower (dont Nvidia et Mellanox sont membres).

Dans ce cadre, il utilisera les GPU Nvidia Tesla basés sur sa future architecture Volta (prévue pour 2017, à l'instar de l'architecture Pascal prévue pour 2016) et la technologie NVLink de la société pour les connexions entre tous les processeurs d'un même nœud de serveur. Sumit Gupta, directeur général de Tesla GPU Accelerated Computing pour Nvidia, a décrit NVLink comme "la première interconnexion à haut débit pour le GPU", permettant ainsi des communications point à point entre un GPU et un autre GPU, ainsi qu'entre le GPU et le Power CPU. (La première génération de NVLink est prévue pour 2016; les nouveaux systèmes utiliseront la deuxième génération.) Les nœuds au sein des systèmes seront connectés à l'aide de la nouvelle génération d'interconnexion Mellanox EDR 100 Gb / s InfiniBand.

Selon IBM, chaque système aura des performances maximales "bien supérieures à 100 pétaflops", équilibrées avec plus de cinq pétaoctets de mémoire dynamique et flash, et sera capable de transférer des données vers le processeur à plus de 17 pétaoctets par seconde l’entreprise équivaut à déplacer plus de 100 milliards de photos par seconde).

Jeffrey Nichols, directeur associé de laboratoire pour l'informatique et les sciences informatiques d'ORNL, a décrit l'architecture comme "un nombre réduit de noeuds avec une empreinte mémoire partagée beaucoup plus grande" et a déclaré que cela devrait permettre aux développeurs d'optimiser et d'exécuter plus efficacement les charges parallèles fonctionnant actuellement sur ORNL. Système Titan. ORNL indique que son système Summit comprendra plus de 3 400 noeuds, chacun comprenant plusieurs processeurs IBM Power 9 et plusieurs GPU Nvidia Volta, avec plus de 512 Go de DDR4 et de la mémoire à large bande passante (dans une conception cohérente, afin de fonctionner avec tous les CPU et GPU) avec 800 Go de RAM non volatile, offrant plus de 40 téraflops de performances optimales. Il aura un système de serveur de stockage GPFS avec une bande passante d’E / S de 1 To / s et une capacité de disque de 120 PB. Cela devrait éventuellement remplacer le système Titan actuel d'ORNL, qui est un système Cray basé sur les processeurs AMD Opteron et les processeurs Nvidia Kepler, capables de traiter 27 pétaflops / s, Nichols estimant que Summit devrait offrir des performances 5 à 10 fois supérieures à celles de Titan. Summit doit être livré en 2017 et disponible pour les utilisateurs en 2018.

Les applications cibles du système Summit comprennent la science de la combustion (essayant d'accroître l'efficacité des moteurs à combustion de 25 à 50%), la science du changement climatique, le stockage de l'énergie et l'énergie nucléaire. Nichols a déclaré que Summit devrait permettre à ORNL "d'élargir les horizons" des travaux scientifiques menés dans les laboratoires.

Le système LLNL, appelé Sierra, est destiné au programme de simulation et d’informatique avancée (ASC) de la National Nuclear Security Administration (NNSA), principalement conçu pour la science et l’évaluation de l’armement. Selon Mike McCoy, directeur du programme ASC de LLNL, le supercalculateur permet au laboratoire de faire des simulations sur le stock nucléaire du pays sans avoir à reprendre les essais nucléaires. Il a déclaré que le code de simulation d'armes 3D du laboratoire était "l'une des applications les plus compliquées de la planète". Il a souligné qu'il ne s'agissait pas d'un gouvernement achetant un système sur étagère, mais plutôt d'un "co-design" dans lequel les programmeurs et les concepteurs de systèmes travaillent ensemble sur l'architecture.

Les deux systèmes, qui font partie d'un programme du ministère de l'Énergie appelé Collaboration des laboratoires nationaux Oak Ridge (Argonne) et Lawrence Livermore (CORAL), visent à accélérer le développement de l'informatique haute performance. Selon IBM, la programmation de tels systèmes peut commencer aujourd'hui, mais les systèmes ne seront installés qu'en 2017 ou 2018. Dans le cadre du programme CORAL, Argonne National Lab disposera également d'un nouveau supercalculateur, mais ne l'a pas encore annoncé.

Globalement, Nichols a déclaré qu'il considérait Summit et Sierra comme "des premiers pas vers exascale" et qu'il était impatient de voir les systèmes futurs suivre le même chemin architectural et espérait une longue collaboration avec les fournisseurs. Environ cinq ans après la tenue du Sommet, a-t-il déclaré, il espère disposer d'un ordinateur exascale.

En outre, AMD a annoncé aujourd’hui avoir reçu 32 millions de dollars de subventions dans le cadre du projet FastForward2, dans le cadre du projet FastForward2, pour la recherche d’architecture de nœud exascale basée sur ses unités de traitement accéléré basées sur l’architecture de système hétérogène standard pour les futures interfaces de mémoire. DOE a déclaré que AMD, Cray, IBM, Intel et Nvidia dirigeront les projets FastForward2. (Intel et Cray ne participent pas aux supercalculateurs annoncés aujourd'hui, mais continuent d'être des acteurs importants dans le domaine. Il sera donc intéressant de voir s'ils participent aux projets d'Argonne.)