Vidéo: Jamais Trop Âgée Pour Jouer A La Poupée ! (Novembre 2024)
Il y avait quelques surprises à la conférence Supercomputing 17 de ce mois-ci, dont une très bonne performance pour l'accélérateur PEZY-SC2, ainsi que le changement de direction d'Intel pour sa ligne Xeon Phi. En outre, nous avons également vu les premiers systèmes basés sur le processeur évolutif Xeon d'Intel (Skylake) et le premier à utiliser l'accélérateur Volta de Nvidia.
Mais le plus notable est peut-être l’information selon laquelle les systèmes chinois comptent désormais 202 des 500 supercalculateurs de la dernière liste des 500 plus grands, contre 143 seulement aux États-Unis. Les systèmes américains dominent la liste depuis sa création il y a 25 ans, et il y a quelques mois à peine, les États-Unis comptaient 169 systèmes sur 160 en Chine. Il en va de même pour la performance globale, les systèmes chinois représentant à eux seuls 35, 4% la performance totale des systèmes Top 500.
Les ordinateurs les plus rapides du monde restent les deux énormes machines chinoises qui figurent en tête du classement depuis plusieurs années: Sunway TaihuLight, du Centre national chinois de superinformatique (Wuxi), avec une performance soutenue de plus de 93 pétaflops (93 000 milliards de opérations par seconde) et le Tianhe-2, du centre national chinois de super-ordinateurs de Guangzhou, avec des performances soutenues de plus de 33, 8 pétaflops. Celles-ci restent les machines les plus rapides, et par une marge énorme. Le système Piz Daint du Swiss National Supercomputing Center, un système Cray utilisant les processeurs Intel Xeons et Nvidia Tesla P100, s'est classé troisième avec la performance soutenue de Linpack à 19, 6 pétaflops.
Le plus gros changement au sommet est un nouveau système à la quatrième place: une version améliorée du supercalculateur Gyoukou, un système ZettaScaler-2.2 déployé à l'Agence japonaise pour la science et la technologie de la Terre et de la Terre. Cette machine utilise des accélérateurs PEZY-SC2, une puce de deuxième génération à cœur 2048 offrant des performances maximales de 4, 096 téraflops en double précision, ainsi que des processeurs Intel Xeon classiques, pour un total de 19 860 000 cœurs. (Une machine ZettaScaler antérieure avec le PEZY-SC2 figurait dans la liste à un niveau inférieur de la version de juin). Cela lui donne le plus grand nombre de cœurs utilisés ensemble - également connu comme le plus haut niveau de concurrence - à ce jour, dépassant le TaihuLight, qui compte 10, 6 millions de cœurs. La machine Gyoukou a obtenu une performance soutenue de 19, 14 pétaflops sur Linpack, mais il est intéressant de noter qu’elle utilise 1, 35 mégawatts de puissance, contre 2, 27 mégawatts pour PizDaint, 17, 8 mégawatts pour Tinahe-2 et 15, 4 mégawatts pour Taihulight. C'est encore beaucoup de puissance, mais c'est une réduction importante par rapport aux autres systèmes et une indication forte que les problèmes d'alimentation sont importants, même pour les machines les plus rapides du monde. Il convient également de noter que cela montre comment les nouvelles architectures peuvent réduire considérablement la consommation d'énergie.
Le principal système américain reste le superordinateur Titan du Oak Ridge National Laboratory, un système vieux de cinq ans qui utilise les accélérateurs GPU Nvidia K20x et délivre 17, 59 pétaflops, qui occupe désormais la cinquième place de la liste.
Dans la dernière liste des superordinateurs les plus écoénergétiques de Green 500, quatre des cinq emplacements les plus importants (y compris les trois premiers) sont passés aux systèmes japonais nouvellement installés, tous basés sur l'architecture ZettaScaler-2.2 et l'accélérateur PEZY-SC2. Le plus efficace d'entre eux est le Shoubu System B, installé dans le centre avancé d'informatique et de communication de RIKEN. Le Shoubu System B a atteint 17, 0 gigaflops / watt; Shoubu System B et les deux systèmes suivants, qui utilisent respectivement 16, 8 et 16, 7 gigaflops / watt, se trouvent tous dans la moitié inférieure de la liste des 500 meilleurs. Le cinquième système du classement vert est le système Gyoukou mentionné ci-dessus - le système numéro quatre figurant sur la liste des 500 meilleurs établissements, à 14, 2 gigaflops / watt.
Ce sont des avancées majeures pour l'accélérateur PEZY-SC2 et pourraient indiquer des orientations futures pour les architectures de superinformatique.
Le quatrième supercalculateur le plus écologique est le système interne DGX SaturnV Volta de Nvidia, qui a atteint 15, 1 gigaflops / watt et se classe 149 sur le top 500. Ce système comporte 22 440 volta core (qui semblent figurer sur une liste quelque peu différente de la liste.) Nvidia a connu une très bonne année pour son accélérateur et a de grands espoirs de disposer de davantage de machines utilisant la Volta. Architecture GPU.
Comme à l'accoutumée, les principaux constructeurs se réjouissaient de leurs succès sur la liste, Intel notant que ses processeurs se trouvaient dans six des dix systèmes les plus performants et un nombre record de 471 sur 500 systèmes. Intel a également noté que ses nouveaux processeurs évolutifs Xeon se trouvaient dans 18 supercalculateurs avec plus de 25 pétaflops de performances. Mais ce qui est peut-être plus remarquable, c’est que Intel a annoncé l’annulation de Knights Hill, le successeur prévu de 10 nm du processeur 14 nm Knights Landing Xeon Phi. La société a déclaré qu'elle envisageait maintenant une nouvelle plate-forme pour les systèmes exascale (1 000 pétaflops) d'ici 2021, mais n'a pas divulgué de détails.
Nvidia a souligné qu'elle avait 34 nouveaux systèmes avec ses accélérateurs sur la liste, ce qui porte le total de la société à 87. Nvidia et son partenaire IBM s'inquiètent de la possibilité que, lors de la prochaine liste, en juin, la machine Summit à Oak Ridge Laboratoire national (ORNL) devrait figurer parmi les machines en haut de la liste. Cette machine comporte 4600 nœuds, chacun avec deux UC de base IBM Power 9 et 6 accélérateurs Nvidia Volta, avec une performance projetée d’environ 200 pétaflops. Cela diffère de la solution interne de Nvidia en ce que les processeurs et les GPU communiquent tous via NVLink 2.0 de manière cohérente en cache avec OpenCAPI, de sorte que les GPU peuvent accéder directement à la RAM du système principal. Summit sera suivi par la machine Sierra du laboratoire national Lawrence Livermore et par la machine AI Bridging Cloud Infrastructure (ABCI) au Japon.
J'étais intéressé d'entendre Cray annoncer un supercalculateur «prêt à la production» basé sur le processeur Cavium ThunderX2 sur l'architecture Armv8-A 64 bits, désormais disponible dans le cadre de son supercalculateur XC50. Les machines ARM sont actuellement testées au Barcelona Supercomputer Center (dont la machine Mare Nostrum se classe 16ème sur la liste des 500 meilleurs), au supercalculateur "Post-K" au Japon et au supercalculateur Isambard au Royaume-Uni. Cavium avait quelques premiers points de repère sur le ThunderX2, qui montrait que la puce 14 nm fonctionnait mieux que la Skylake Xeons d’Intel sur les applications multi-threadées ou liées à la mémoire, bien qu’Intel reste le leader des teraflops mono-thread et bruts. Notez qu'en plus de la conception Cavium, Qualcomm a également annoncé une puce de serveur basée sur ARM appelée Centriq.
Dans d'autres actualités relatives aux processeurs, AMD a annoncé avoir intensifié la production de ses processeurs Epyc, bien que ceux-ci ne fassent pas encore partie des systèmes Top 500, tandis que NEC a annoncé des versions de sa carte d'accélérateur Vector Engine pour sa nouvelle série de supercalculateurs SX-Aurora TSUBASA. ont une bande passante mémoire particulièrement rapide.
En ce qui concerne les interconnexions, Mellanox a déclaré que 77% des nouveaux systèmes de la liste Top 500 utilisaient InfiniBand, tandis qu'Intel vantait les récents succès de son architecture Omni-Path, principalement utilisée dans ses systèmes à processeur évolutif Xeon (Skylake). Pendant ce temps, un certain nombre de fournisseurs se tournent vers Gen-Z, conçue pour être une approche centrée sur la mémoire et à faible temps de latence pour les connexions à très haut débit entre les périphériques de calcul et de mémoire / stockage.
En outre, il est intéressant de noter que pour la première fois, toutes les machines du Top 500 utilisent maintenant Linux.
Entre la première impression forte de PEZY-SC2, la décision d’Intel de se débarrasser de Knights Mill pour une nouvelle architecture, Nvidia's Volta, et la nouvelle concurrence de AMD, des fournisseurs ARM et de NEC, c’est une période passionnante dans le monde de la superinformatique. Les listes de l'année prochaine devraient être assez intéressantes, car nous voyons quelles architectures fonctionnent réellement et lesquelles sont les plus efficaces, car de nombreux fournisseurs et sites de superordinateurs essaient de se positionner dans la course à la production d'un ordinateur exascale (1000 pétaflops) avec un Puissance absorbée de -20 mégawatts.
Curieux de connaître votre vitesse Internet haut débit? Testez-le maintenant!