Les téraflops sont un moyen populaire de mesurer la «puissance graphique» depuis des années. Le terme fait référence au nombre de calculs qu’un GPU peut effectuer, mais bien qu’il soit sur les fiches techniques depuis toujours, plus récemment, le téraflop est devenu courant, apparaissant dans les messages marketing trouvés lors du lancement de consoles comme la Xbox Series X. atteignant cinq chiffres, il est agréable d’avoir un simple point de comparaison. Malheureusement, les téraflops n’ont jamais été moins utiles.

Le terme téraflop vient des FLOP, ou «opérations en virgule flottante par seconde», qui signifie simplement «calculs qui impliquent des points décimaux par seconde». Tera signifie mille milliards, donc ensemble téraflops signifie «mille milliards d’opérations en virgule flottante par seconde».

Le GPU le plus populaire parmi les utilisateurs de Steam aujourd’hui, la vénérable GTX 1060 de NVIDIA, est capable d’exécuter 4,4 téraflops, le 2080 Ti bientôt usurpé peut gérer environ 13,5 et la prochaine Xbox Series X peut en gérer 12. Ces chiffres sont calculés par prendre le nombre de cœurs de shader dans une puce, en multipliant cela par la vitesse d’horloge de pointe de la carte, puis en multipliant cette par le nombre d’instructions par horloge. Contrairement à de nombreux chiffres que nous voyons dans l’espace PC, c’est un calcul juste et transparent, mais cela n’en fait pas une bonne mesure des performances de jeu.

Presque toutes les familles de GPU arrivent avec ces gains générationnels

Le RX 580 d’AMD, un GPU de 6,17 téraflop de 2017, par exemple, fonctionne de la même manière que le RX 5500, une carte de 5,2 téraflop à budget limité que la société a lancée l’année dernière. Ce type d’amélioration «cachée» peut être attribué à de nombreux facteurs, des changements architecturaux aux développeurs de jeux utilisant de nouvelles fonctionnalités, mais presque toutes les familles de GPU arrivent avec ces gains générationnels. C’est pourquoi la Xbox Series X, par exemple, devrait surpasser la Xbox One X de plus que ne le suggèrent les chiffres «12 contre 6 téraflop». (Idem pour la PS5 et la PS4 Pro.)

Le fait est que, même au sein d’une même société de GPU, avec chaque année, les changements dans la façon dont les puces et les jeux sont conçus rendent plus difficile de discerner ce que signifie exactement «un téraflop» pour les performances de jeu. Prenez une carte AMD et une carte NVIDIA de toute génération et la comparaison a encore moins de valeur.

Lire aussi  Nintendo permet désormais aux joueurs d'annuler les précommandes de Switch eShop

Tout cela nous amène à la série RTX 3000. Ceux-ci sont arrivés avec des spécifications vraiment choquantes. La RTX 3070, une carte de 500 $, est répertoriée comme ayant 5 888 cœurs cuda (nom de NVIDIA pour shader) capables de 20 téraflops. Et la nouvelle carte phare de 1 500 $, la RTX 3090? 10 496 noyaux, pour 36 téraflops. Pour le contexte, la RTX 2080 Ti, actuellement la meilleure carte graphique « grand public » disponible, dispose de 4 352 cœurs cuda. ​​ » NVIDIA a donc augmenté le nombre de cœurs de son produit phare de plus de 140% et sa capacité téraflops de plus de 160%.

Eh bien, il a, et il n’a pas.

Les cartes NVIDIA sont constituées de nombreux «multiprocesseurs de streaming», ou SM. Chacun des 68 SM «Turing» du 2080 Ti contient, entre autres, 64 cœurs cuda «FP32» dédiés aux mathématiques en virgule flottante et 64 cœurs «INT32» dédiés aux mathématiques entières (calculs avec des nombres entiers). 

La grande innovation du Turing SM, en dehors de l’IA et de l’accélération du lancer de rayons, était la capacité d’exécuter simultanément des nombres entiers et des nombres flottants. Il s’agissait d’un changement significatif par rapport à la génération précédente, Pascal, où les banques de cœurs basculaient entre les nombres entiers et les virgule flottante sur une base soit ou soit.

NVIDIA

Les cartes RTX 3000 sont construites sur une architecture que NVIDIA appelle « Ampère », et son SM, à certains égards, adopte à la fois l’approche Pascal et Turing. Ampère conserve les 64 cœurs FP32 comme auparavant, mais les 64 autres cœurs sont maintenant désignés comme « FP32 et INT32. » Ainsi, la moitié des noyaux Ampere sont dédiés à la virgule flottante, mais l’autre moitié peut effectuer des calculs en virgule flottante ou en nombres entiers, tout comme en Pascal.

Avec ce commutateur, NVIDIA compte désormais chaque SM comme contenant 128 cœurs FP32, plutôt que les 64 que Turing avait. Les «5 888 cœurs cuda» du 3070 sont peut-être mieux décrits comme «2 944 cœurs cuda et 2 944 cœurs qui pouvez être cuda. ​​ »

À mesure que les jeux sont devenus plus complexes, les développeurs ont commencé à s’appuyer davantage sur les nombres entiers. Une diapositive NVIDIA du lancement original de RTX en 2018 suggérait que le calcul des nombres entiers représentait en moyenne environ un quart des opérations GPU dans le jeu.

Lire aussi  La GeForce RTX 3090 de NVIDIA est un GPU à 1499 $ pour les jeux 8K

L’inconvénient du Turing SM est le potentiel de sous-utilisation. Si, par exemple, une charge de travail est constituée de 25% de calculs en nombres entiers, environ un quart des cœurs du GPU pourraient rester sans rien à faire. C’est la pensée derrière cette nouvelle structure de noyau semi-unifiée, et, sur le papier, cela a beaucoup de sens: vous pouvez toujours exécuter des opérations en virgule flottante et entière simultanément, mais lorsque ces cœurs entiers sont dormants, ils peuvent exécuter des opérations en virgule flottante au lieu.

[Cet épisode de Mise à l’échelle a été produit avant que NVIDIA n’explique les changements SM.]

Lors du lancement du RTX 3000 de NVIDIA, le PDG Jensen Huang a déclaré que le RTX 3070 était « plus puissant que le RTX 2080 Ti ». En utilisant ce que nous savons maintenant sur la conception, les entiers, les virgules flottantes, les vitesses d’horloge et les téraflops d’Ampère, nous pouvons voir comment les choses pourraient se dérouler. Dans cette charge de travail «entier à 25%», 4 416 de ces cœurs pourraient exécuter des calculs FP32, dont 1 472 gérant l’INT32 nécessaire. 

Couplé à tous les autres changements qu’Ampère apporte, le 3070 pourrait surpasser le 2080 Ti de peut-être 10%, en supposant que le jeu ne craigne pas d’avoir 8 Go au lieu de 11 Go de mémoire pour travailler. Dans le pire des cas absolu (et hautement improbable), où une charge de travail est extrêmement dépendante des nombres entiers, elle pourrait se comporter davantage comme la 2080. D’un autre côté, si un jeu nécessite très peu de calculs en nombres entiers, l’augmentation par rapport au 2080 Ti pourrait être énorme.

Hormis les suppositions, nous avons jusqu’à présent un point de comparaison: un Fonderie numérique vidéo comparant le RTX 3080 au RTX 2080. DF a vu une augmentation de 70 à 90% à travers les générations dans plusieurs jeux que NVIDIA a présentés aux tests, avec un écart de performance plus élevé dans les titres qui utilisent des fonctionnalités RTX comme le traçage de rayons. Cette plage donne un aperçu du type de gain de performances variable auquel nous nous attendions compte tenu des nouveaux cœurs partagés. Il sera intéressant de voir comment se comporte une plus grande suite de jeux, car NVIDIA est susceptible d’avoir fait de son mieux avec la sélection de jeux sanctionnés. Ce que vous ne verrez pas, c’est l’amélioration de près de 3 fois que le passage du chiffre du téraflop de 2080 au chiffre du téraflop du 3080 entraînerait.

Lire aussi  Le support PSVR de 'Minecraft' arrive ce mois-ci

Avec les premières cartes RTX 3000 arrivant dans quelques semaines, vous pouvez vous attendre à ce que les critiques vous donnent bientôt une idée précise des performances d’Ampère. Bien que même maintenant, il semble prudent de dire qu’Ampère représente un bond en avant monumental pour les jeux sur PC. Le 3070 $ 499 est susceptible d’être un gros coup avec le produit phare actuel, et le 799 $ 3080 devrait offrir des performances plus que suffisantes pour ceux qui auraient pu auparavant opter pour le «Ti». Cependant, quelle que soit la manière dont ces cartes s’alignent, il est clair que leur valeur ne peut plus être représentée par une figure singulière comme des téraflops.