Vidéo: NVIDIA GeForce RTX Série 30 | Événement de lancement officiel [4K] (Novembre 2024)
Lors de la conférence technologique GPU de Nvidia la semaine dernière, j'ai été surprise de voir à quel point les graphiques et la technologie GPU évoluaient - sur le bureau et sur les périphériques mobiles - et comment la manière dont les gens écrivent les logiciels devra changer pour en tirer parti.
Le grand mouvement s'oriente vers des logiciels hétérogènes, des programmes pouvant utiliser simultanément le processeur traditionnel à microprocesseur et le processeur graphique. Ce n'est pas un nouveau concept - Nvidia et AMD en parlent depuis un moment - mais les deux parties se rapprochent.
L’approche d’AMD a consisté à promouvoir ce qu’il appelle des "unités de traitement accélérées", qui combinent à la fois des GPU et des CPU sur une seule puce, et ce qu’on a appelé "une architecture de système hétérogène". Au cours des dernières années, il a fait la promotion de la technologie HSA et, l'an dernier, a créé la fondation HSA, avec 21 autres sociétés, afin de développer des normes ouvertes pour l'informatique hétérogène.
L'approche de Nvidia a été très différente, en se concentrant sur ses plates-formes CUDA pour l'écriture de logiciels sur ses GPU et sa version Tesla de GPU, qui sont maintenant utilisés dans des supercalculateurs comme le supercalculateur Titan du Oak Ridge National Laboratory. Dans de tels systèmes, un logiciel plutôt complexe gère ce que l’informatique fonctionne sur le processeur et ce qui fonctionne sur le GPU.
Jen-Hsun Huang, PDG de Nvidia, a déclaré: "L'informatique visuelle est un support puissant et unique. Au cours des 20 dernières années, ce support a transformé le PC d'un ordinateur pour l'information et la productivité en un outil de créativité, d'expression et de découverte. " Les prochaines années devraient indiquer si cette transition atteint un plateau ou si, en fait, elle ne fait que commencer."
Comme prévu, Huang a beaucoup parlé dans son discours de la croissance de l’informatique GPU basée sur CUDA. La société a livré 430 millions de GPU compatibles CUDA et 1, 6 million de téléchargements de kits de programmation CUDA; Les GPU Nvidia sont désormais utilisés dans 50 supercalculateurs du monde entier. Par exemple, Titan a récemment effectué la plus grande simulation mécanique de solides au monde, utilisant 40 millions de processeurs CUDA pour fournir 10 pétaflops de performances soutenues. Il a également déclaré que l'informatique GPU avait beaucoup de potentiel dans les applications "Big Data".
Huang a contacté un représentant de Shazam pour expliquer comment la société utilise les GPU pour faire correspondre la musique et l'audio d'un grand nombre d'utilisateurs. Huang a ensuite mentionné qu'une société appelée Cortexica utilise une technologie similaire pour la recherche visuelle.
Plus important encore, la société a présenté une nouvelle feuille de route pour son moteur GPU utilisé à la fois dans ses produits de jeu GeForce et dans la gamme Tesla. L’architecture actuelle du GPU est appelée "Kepler", qui a été livrée l’année dernière. La prochaine version, connue sous le nom de "Maxwell", doit paraître l'année prochaine. L'ajout d'une architecture de "mémoire virtuelle unifiée" représente un grand pas en avant vers l'informatique hétérogène, ce qui signifie que le processeur et le processeur graphique peuvent voir toute la mémoire du système.
Ceci est important car l'un des gros goulots d'étranglement de l'informatique GPU est le transfert de données entre les systèmes de mémoire principaux et la mémoire graphique et parce qu'il est difficile d'écrire des logiciels utilisant les deux types de processeurs. (AMD a annoncé une fonctionnalité similaire pour son processeur Kaveri, prévue pour la fin de cette année. Je ne sais pas trop comment cela fonctionne sans l'assistance directe des fabricants d'UC, mais c'est certainement une approche que nous verrons davantage aller de l'avant.)
Pour 2015, Huang a promis une autre version, appelée "Volta", qui prendra la mémoire graphique et l’empilera directement au-dessus du GPU, augmentant ainsi considérablement la bande passante de la mémoire à environ un téraoctet par seconde. À titre de comparaison, la bande passante maximale totale de Kepler est d'environ 192 gigaoctets par seconde.
Un certain nombre de sociétés, dont Intel, parlent d'empiler de la mémoire sur un processeur, mais le câblage permettant de connecter la mémoire au processeur, qui utilise une technique connue sous le nom de vias traversant le silicium, a été complexe. Autant que je sache, Volta est le premier processeur relativement grand public à proposer cette fonctionnalité.
La feuille de route mobile présente certaines des mêmes caractéristiques. La société a récemment annoncé ses processeurs Tegra 4 (nommé "Wayne") et Tegra 4i (nommé "Gray"). "Logan", qui devrait entrer en production en 2014, ajoute les premiers graphiques compatibles CUDA de la gamme Tegra. Cela sera suivi en 2015 avec «Parker», qui combinera la technologie de GPU Maxwell avec le premier concept de cœur de processeur unique de la société, un processeur ARM 64 bits appelé Project Denver. (Notez que, même si la conception du GPU est partagée par les deux processeurs, le nombre de cœurs graphiques réels sera probablement beaucoup plus petit dans un processeur mobile que dans une version de bureau.)
Cela devrait être intéressant à la fois en raison de l’architecture de la mémoire unifiée et du fait qu’elle devrait être fabriquée à l’aide de transistors FinFET 3D. Intel utilise cette technique dans ses processeurs 22 nm et le partenaire de longue date de Nvidia, Taiwan Semiconductor Manufacturing Corp. et son rival Globalfoundries, ont annoncé qu'ils disposeraient de FinFETS l'année prochaine. La production de masse devrait commencer en 2015.
"Dans cinq ans, nous allons multiplier par 100 les performances de Tegra", a promis Huang.
Bien sûr, la grande question est de savoir pourquoi nous allons utiliser la puissance informatique. Il est assez facile pour moi de voir les applications de calcul haute performance et les applications "Big Data" - celles-ci continuent à se développer et peuvent facilement utiliser les fonctionnalités de traitement parallèle des GPU. Nvidia proposera ces fonctionnalités de différentes manières, notamment via ses cartes Tesla pour les postes de travail et les superordinateurs; sa technologie de virtualisation de serveur GRID CPU pour les serveurs d’entreprise; et un nouvel appareil GRCA Virtual Computing Appliance (VCA), un châssis 4U doté de processeurs Xeon, de GPU basés sur Kepler et d'une mémoire, destiné aux départements.
Et bien sûr, les jeux utiliseront plus de graphiques, devenant de plus en plus réalistes à chaque génération. La taille et la résolution des écrans augmentent, et les utilisateurs veulent plus de graphiques. Huang a présenté la nouvelle carte graphique de bureau haut de gamme de la société, appelée Titan, exécutant une simulation océanique en temps réel de Waveworks. Il a également fait la démonstration de Faceworks, une tête parlante 3D appelée Ira (ci-dessus), créée avec l’Institute for Creative Technology de l’USC.
L'intégration de toutes ces fonctionnalités sur le mobile est particulièrement intéressante. Je ne suis pas tout à fait sûr d'avoir vraiment besoin de toute la puissance d'un processeur graphique de bureau haut de gamme dans un appareil mobile - après tout, sur un écran de cinq pouces, 1 980 sur 1 080 semble suffire - mais je ne doute pas que les gens vont en trouver des usages. L’un des soucis est que cela utiliserait trop d’énergie, mais Huang a déclaré que Logan ne serait "pas plus gros qu'un centime". En tout cas, je serais intéressé de voir ce que les gens vont faire avec autant de performance.
Dans l’ensemble, Nvidia, comme AMD, parie sur l’amélioration continue des graphiques, la mémoire unifiée et une approche hétérogène de la programmation du processeur et du processeur graphique. AMD dirait travailler avec des normes ouvertes, tandis que Nvidia soulignerait les succès remportés par CUDA, en particulier dans le domaine des hautes performances. Et bien sûr, il y a Intel, dont les graphiques accusent un retard à la fois sur AMD et Nvidia, mais qui domine toujours la zone de traitement du PC. Il dispose également de son propre ensemble d’outils logiciels. Les différentes approches devraient en faire un domaine fascinant à surveiller.