Vidéo: "Jean Zay", le nouveau super calculateur de Saclay, puissant comme 40 000 ordinateurs personnels (Novembre 2024)
La liste la plus récente des superordinateurs les plus rapides au monde n'a pas beaucoup changé, mais le salon annuel Supercomputing (SC14) a donné lieu à de nombreuses discussions sur les nouveaux systèmes de la liste, ainsi que plusieurs annonces informatiques hautes performances, comme les nouveaux accélérateurs d'Intel et Nvidia.
Le supercalculateur chinois Tianhe-2, qui utilise des processeurs Intel Xeon et des accélérateurs Xeon Phi, est resté en tête du classement Top500 avec des performances maximales de 54, 9 pétaflops (quadrillions d'opérations en virgule flottante par seconde). En fait, cette année, les neuf premiers systèmes étaient identiques à la dixième place la plus importante nouveauté: une machine système gouvernementale américaine non spécifiée, un Cray CS-Storm optimisé par les processeurs Intel Xeon E5-2660 v2 et les GPU Nvidia K40, connectés via un ordinateur. Infiniband.
Plus bas dans la liste, il y avait 78 nouveaux systèmes, même s'il s'agit d'un nouveau record. Et globalement, il semble que nous assistions à un ralentissement du taux de croissance de la puissance totale des 500 systèmes.
Le classement de ces systèmes est basé sur le benchmark LINPACK, bien que de nombreux efforts soient actuellement déployés pour créer de nouveaux benchmarks visant différents types d’informatique. J'ai trouvé intéressant que, dans un discours prononcé lors de l'émission, Horst Simon, rédacteur en chef de la liste Top500, ait déclaré que, malgré l'objectif d'atteindre un ordinateur exascale - 1 exaflops par seconde (environ 1 000 pétaflops) - d'ici 2020, il pensait que prenez-nous jusqu’à la fin de 2024. Cela s’explique en partie par le fait que nous aurons besoin de davantage de techniques d’économie d’énergie - telles que la photonique sur silicium, l’intégration et le packaging 3D - pour limiter la puissance nécessaire à un système exascale à 20 mégawatts. Ce sont de gros systèmes.
Malgré l'absence de gros changements au sommet, nous avons entendu deux nouvelles annonces, notamment celles d'Intel et de Nvidia, qui pourraient indiquer des machines plus rapides.
Nvidia, dont les GPU et le langage de programmation CUDA ont véritablement lancé le mouvement vers les accélérateurs et les coprocesseurs dans le calcul haute performance, couvrait toute la série avec de nombreux systèmes. Il propose actuellement l'accélérateur K40 et a annoncé au salon la prochaine version, la Tesla K80, qui utilise une approche à deux processeurs graphiques pour offrir une performance deux fois supérieure et une bande passante mémoire double de celle de son prédécesseur.
Nvidia indique que le K80 offre 4 992 cœurs CUDA et 24 mégaoctets de RAM, avec une capacité maximale de 2, 91 téraflops par carte. Il est intéressant de noter que le K80 est disponible maintenant et que de nombreux fabricants de systèmes proposent déjà des systèmes avec le tableau. Par exemple, Dell a présenté ses nouveaux serveurs PowerEdge C4130, qui vous permettent d’installer quatre cartes accélératrices Nvidia (ou accélérateurs Intel Xeon Phi) dans un serveur 1U, la version K80 offrant jusqu’à 7, 2 téraflops par boîte. Il s’agit là d’une quantité incroyable de puissance de calcul dans un rack (bien que celle-ci consomme beaucoup d’énergie et nécessite beaucoup de refroidissement).
Dans le même temps, Intel a annoncé que la prochaine version de sa puce Xeon Phi, une version connue sous le nom de Knight's Landing pour laquelle les premiers systèmes commerciaux devraient commencer à être commercialisés l’année prochaine, compte maintenant plus de 50 clients prévoyant d’utiliser la nouvelle version du processeur de la pièce (où le Xeon Phi agit en tant que processeur système dans les nouveaux superordinateurs. De nombreux autres systèmes utilisent la version de carte PCIe coprocesseur du produit.
Parmi les clients de Knights Landing, citons le supercalculateur Trinity, une initiative conjointe de Los Alamos et de Sandia National Laboratories, et le supercalculateur Cori, annoncés par le centre NERSC (National Energy Research Scientific Computing) du département américain de l'Énergie (DOE). Knight's Landing est censé offrir environ 3 téraflops de performances et intégrera la technologie Omni-Path Fabric d'Intel basée sur la photonique sur silicium, qui offrirait une vitesse de ligne de 100 Gbps et une latence de la matrice de commutateurs inférieure à 56% par rapport aux solutions InfiniBand. (Notez que les fournisseurs InfiniBand parlent également de nouvelles versions.)
Intel a déclaré que le suivi, connu sous le nom de Knight's Hill, sera construit à l'aide de la technologie de traitement Intel 10 nm et utilisera la nouvelle génération de la structure Omni-Path. Il suivra Knight's Landing, mais le moment exact n’a pas été révélé.
AMD n’est pas en reste, c’est AMD qui a annoncé et présenté sa carte à processeur unique FirePro S9150, qui peut offrir 2, 53 téraflops de performances. Ce système, programmé à l'aide d'OpenCL, est déjà disponible.
En fait, un nouveau supercalculateur appelé L-CSC du GSI Helmholtz Center, basé sur les GPU S9150 et les processeurs Intel Xeon 2690v2 à 10 cœurs, vient en tête de la nouvelle version de la liste Green500, qui répertorie les supercalculateurs par ordre de traitement de la puissance par watt. C'était la première fois qu'un système pouvait dépasser 5 gigaflops / watt (des milliards d'opérations par seconde par watt). À noter que sur cette liste, le système Suiren se classait au deuxième rang, propulsé par les accélérateurs multi-core PEZY-SC et les processeurs Xeon; tandis que le reste du top 10 utilise les GPU Nvidia Tesla, montrant la gamme de ces systèmes.
Il existe également d'autres options plus inhabituelles. Micron présente sa puce Automata, une puce spécialement conçue pour la correspondance de modèles, destinée à la sécurité du réseau et à la recherche génomique. Ceci est en cours de développement dans une carte PCIe 3 avec 32 puces et son lancement est prévu pour le premier trimestre de 2015, initialement en faible volume. (La société est également à l'origine de son cube de mémoire hybride pour la mémoire de nouvelle génération destinée à de tels systèmes.) IBM dispose de son processeur TrueNorth, qui, espère-t-il, ouvre la voie à davantage d'informatique «cérébrale». NEC travaille sur la prochaine génération de son processeur vectoriel SX-ACE, qui est plus facile à programmer que les GPU. Et, bien sûr, ARM tente également de s’imposer sur le marché des serveurs, le X-Gene1 d’Applied Micro étant utilisé comme processeur se connectant à diverses cartes accélératrices.
Un certain nombre de fournisseurs montraient de nouveaux systèmes. En plus du système Dell mentionné précédemment, Lenovo a présenté un système biprocesseur refroidi par eau reposant sur un processeur personnalisé Intel Xeon E5-2798A (avec 16 cœurs pouvant atteindre 3, 2 GHz), qui génère 1 083 téraflops. De plus, le processeur Knights Landing Xeon Phi de l’an prochain permettra un système "péta-cube" offrant plus d’un pétaflop dans seulement deux racks 42U standard.
Les serveurs One Stop ont présenté un accélérateur de calcul haute densité, qui utilise PCIe Gen3 pour prendre en charge jusqu’à 16 cartes d’accélérateur haut de gamme à partir d’un ou de plusieurs serveurs. La société a indiqué qu’elle fournissait jusqu’à 89, 6 téraflops à l’aide des cartes Tesla K80. Cela peut fonctionner avec le processeur IBM Power8. Huawei montrait la disponibilité aux États-Unis de son serveur de centre de données X6800 et d'une version à refroidissement par liquide de son serveur lame FusionServer 9000.
Pour relier des systèmes entre eux, Obsidian Technologies a lancé son initiative InfiniCortex, conçue pour établir une connexion InfiniBand 100 Gigabits sur de longues distances. La société a annoncé qu'elle apporterait son soutien à l'Agence pour la science, la technologie et la recherche de Singapour (A * STAR). Et Mellanox a montré une bande passante de 100 Gigabit Infiniband fonctionnant sur 100 mètres de fibre et 8 mètres de cuivre.
Pour créer les plus gros superordinateurs, les entreprises se tournent généralement vers des sociétés comme IBM et Cray pour assembler leurs systèmes, bien que leur construction prenne souvent plusieurs années. La plus grande annonce de ce genre au salon était un système de 80 millions de dollars appelé Shaheen II à l'Université des sciences et technologies King Abdullah en Arabie Saoudite pour un Cray XC40, comprenant un appareil d'analyse graphique Urika-GD.
Et, bien sûr, juste avant le spectacle, le DOE a attribué à IBM (et aux fournisseurs de composants Nvidia et Mellanox) un contrat énorme pour ce qui serait les deux plus grands supercalculateurs du pays, chacun comptant plus de 100 pétaflops.
Note de l'éditeur: Ce message a été mis à jour le 11/26. Le Tianhe-2 a une performance maximale de 54, 9 pétaflops, pas de téraflops.