Vidéo: "Jean Zay", le nouveau super calculateur de Saclay, puissant comme 40 000 ordinateurs personnels (Novembre 2024)
De nos jours, il existe un certain nombre d'approches différentes de l'informatique haute performance, systèmes généralement appelés supercalculateurs. La plupart de ces systèmes utilisent un nombre considérable de processeurs Xeon, mais nous commençons à voir les nouvelles machines les plus intéressantes exécuter des accélérateurs, tels que Tesla de Nvidia ou Intel Xeon Phi. Certains pensent même que d'énormes systèmes basés sur ARM pourraient être efficaces à l'avenir. Mais si vous pouviez essayer toutes ces architectures au même endroit?
Voilà le défi et la promesse du nouvel ordinateur MareNostrum 4, qui est en cours de préparation pour l’installation au Centre de calcul intensif de Barcelone. La nouvelle conception comprend un système principal à usage général basé sur Xeon traditionnel, ainsi que trois nouveaux clusters technologiques émergents, basés sur IBM Power et Nvidia, Xeon Phi et l'informatique basée sur ARM. Lors de mon séjour à Barcelone pour le Congrès mondial de la téléphonie mobile, j'ai eu l'occasion de parler à Sergi Girona, directeur des opérations à la BSC, qui a expliqué le raisonnement qui sous-tend les quatre clusters.
Girona a indiqué que la mission principale du centre est de fournir des services de calcul intensif à des chercheurs espagnols et européens, en plus de l'industrie. Dans le cadre de cette mission, le centre souhaite disposer d'au moins trois "grappes technologiques émergentes" afin de pouvoir tester différentes alternatives.
Pour le cluster informatique général, Girona a déclaré que le centre avait choisi une conception Xeon traditionnelle car il était plus facile de migrer les applications fonctionnant sur le MareNostrum 3 actuel, qui devait être déconnecté la semaine prochaine. La conception devait également s'adapter à l'espace existant, dans une chapelle. (J'ai visité le centre l'année dernière et le supercalculateur actuel il y a un an.)
La nouvelle conception, qui sera construite par Lenovo, sera basée sur le nouveau Xeon v5 (Skylake), avec 3 456 nœuds, chacun avec deux sockets, et chaque puce contiendra 24 cœurs chacun, pour une performance maximale théorique de 11, 14 pétaflops par seconde. La plupart des cœurs auront 2 Go de mémoire, mais 6% en auront 8, pour un total de 331, 7 To de RAM. Chaque nœud aura un disque SSD de 240 Go, bien que certains aient éventuellement une mémoire 3D XPoint, lorsque celle-ci sera disponible. Les nœuds doivent être connectés via l'interconnexion Intel Omni-Path et Ethernet 10 Go. Le système disposera également de six racks de stockage IBM, d’une capacité de stockage de 15 pétaoctets, comprenant un mélange de lecteurs flash et de disques durs. Au total, la conception utilisera 62 baies: 48 pour l'informatique, 6 pour le stockage, 6 pour la mise en réseau et 2 pour la gestion. Il occupera 120 mètres carrés (un environnement très dense) et générera une puissance de 1, 3 mégawatts, en hausse par rapport au 1 mégawatt dessiné par le modèle précédent. L'opération devrait débuter le 1er juillet.
Une chose que j’ai trouvée intéressante ici est à quel point le passage à la nouvelle génération témoigne clairement de la progression de la technologie. La génération précédente affichait un pic de performance d'environ 1 pétaflop, et ce système devrait être plus de 10 fois plus rapide, tout en consommant 30% de puissance supplémentaire. À titre de comparaison, le supercalculateur MareNostrum d'origine, installé en 2004, avait une performance maximale de 42 téraflops et utilisait une puissance de 640 kilowatts. (Les détails des améliorations de performances sur quatre générations de MareNostrum figurent dans le graphique ci-dessus). Girona dit que cela signifie que ce qui aurait pris une année pour fonctionner sur MareNostrum 1 peut être fait en une seule journée sur le nouveau système. Assez impressionnant.
Pour les technologies émergentes, le site comportera trois nouveaux clusters. L'un consistera de processeurs IBM Power 9 et de GPU Nvidia, conçus pour avoir une capacité de traitement maximale de plus de 1, 5 Petaflop / s. Ce cluster sera construit par IBM et comprend le même type de conception que les supercalculateurs Summit et Sierra, que le département américain de l'Énergie a commandé pour les laboratoires Oak Ridge et Lawrence Livermore National dans le cadre de sa collaboration CORAL à Oak Ridge., Argonne et Lawrence Livermore.
Le second cluster sera composé de processeurs Intel Xeon Phi, Lenovo construisant un système utilisant la version à venir de Knights Hill (KNH) et OmniPath, avec une capacité de traitement maximale supérieure à 0, 5 Petaflop / s. Cela imite également le programme américain CORAL et utilise les mêmes processeurs que ceux qui se trouveront dans le supercalculateur Aurora, commandé par le département américain de l'Énergie pour le Laboratoire national Argonne.
Enfin, un troisième cluster sera constitué de processeurs ARMv8 64 bits fournis par Fujitsu dans une machine prototype conçue pour utiliser les mêmes processeurs que ceux développés par Fujitsu pour un nouveau système japonais qui supplanterait le supercalculateur K actuel. Cela aussi devrait offrir plus de 0, 5 pétaflop / s de performances maximales. Le calendrier exact pour le début des opérations sur les clusters émergents n'a pas encore été révélé, a déclaré Girona.
Au total, le système coûtera 34 millions de dollars, dans le cadre d’un contrat remporté par IBM et financé par le gouvernement espagnol. La recherche est l’une des principales raisons d’avoir les quatre types d’informatique sur place: la recherche. Le centre, qui emploie 450 personnes au total, compte 160 chercheurs spécialisés en informatique, y compris l'architecture et les outils. En tant que membre du PRACE (Partenariat pour l'informatique avancée en Europe), BSC tente en particulier de se concentrer sur l'optimisation des performances et l'informatique parallèle.
Girona a déclaré que BSC souhaitait influencer le développement de nouvelles technologies et prévoyait d'utiliser la nouvelle machine pour analyser ce qui se passerait dans le futur, en particulier pour s'assurer que le logiciel était prêt pour l'architecture quelle que soit la machine à venir, susceptible d'arriver. environ 3 ans - aura. BSC a longtemps travaillé sur des outils pour les architectures émergentes, a-t-il noté.
Les chercheurs étudient également la possibilité de développer un processeur informatique européen, probablement basé sur l’architecture ARM.
Barcelone n'aura pas le supercalculateur le plus rapide du monde; ce record est actuellement détenu par les Chinois, alors que les Américains et les Japonais tentent de se rattraper. Mais MareNostrum 4 sera le plus diversifié et potentiellement le plus intéressant.
Michael J. Miller est directeur de l'information chez Ziff Brothers Investments, une société d'investissement privée. Miller, rédacteur en chef de PC Magazine de 1991 à 2005, a écrit ce blog pour PCMag.com dans le but de partager ses réflexions sur les produits liés aux PC. Aucun conseil d'investissement n'est offert dans ce blog. Tous les droits sont déclinés. Miller travaille séparément pour une société d’investissement privée qui peut à tout moment investir dans des sociétés dont les produits sont décrits dans ce blog. Aucune divulgation d’opérations sur titres ne sera effectuée.