Accueil Tech Les cartes RTX 3000 de NVIDIA rendent le comptage des téraflops inutile

Les cartes RTX 3000 de NVIDIA rendent le comptage des téraflops inutile

Le GPU le plus populaire parmi les utilisateurs de Steam aujourd’hui, la vénérable GTX 1060 de NVIDIA, est capable d’exécuter 4,4 téraflops, le 2080 Ti bientôt usurpé peut gérer environ 13,5 et la prochaine Xbox Series X peut en gérer 12. Ces chiffres sont calculés par en prenant le nombre de cœurs de shader dans une puce, en multipliant cela par la vitesse d’horloge de pointe de la carte, puis en multipliant cela par le nombre d’instructions par horloge. Contrairement à de nombreux chiffres que nous voyons dans l’espace PC, c’est un calcul juste et transparent, mais cela n’en fait pas une bonne mesure des performances de jeu.

Presque toutes les familles de GPU arrivent avec ces gains générationnels

Le RX 580 d’AMD, un GPU à 6,17 téraflop de 2017, par exemple, fonctionne de la même manière que le RX 5500, une carte à 5,2 téraflop au budget que la société a lancée l’année dernière. Ce type d’amélioration «cachée» peut être attribué à de nombreux facteurs, des changements architecturaux aux développeurs de jeux utilisant de nouvelles fonctionnalités, mais presque toutes les familles de GPU arrivent avec ces gains générationnels. C’est pourquoi la Xbox Series X, par exemple, devrait surpasser la Xbox One X de plus que ne le suggèrent les chiffres «12 contre 6 téraflop». (Idem pour la PS5 et la PS4 Pro.)

Le fait est que, même au sein d’une même société de GPU, avec chaque année, les changements dans la façon dont les puces et les jeux sont conçus rendent plus difficile de discerner ce que signifie exactement «un téraflop» pour les performances de jeu. Prenez une carte AMD et une carte NVIDIA de toute génération et la comparaison a encore moins de valeur.

Tout cela nous amène à la série RTX 3000. Ceux-ci sont arrivés avec des spécifications vraiment choquantes. La RTX 3070, une carte de 500 $, est répertoriée comme ayant 5 888 cœurs cuda (nom NVIDIA pour shader) capables de 20 téraflops. Et la nouvelle carte phare à 1 500 $, la RTX 3090? 10 496 noyaux, pour 36 téraflops. Pour le contexte, la RTX 2080 Ti, actuellement la meilleure carte graphique «grand public» disponible, dispose de 4 352 cœurs cuda. ​​» NVIDIA a donc augmenté le nombre de cœurs de son produit phare de plus de 140% et sa capacité de téraflops de plus de 160%.

Eh bien, c’est le cas, et ce n’est pas le cas.

Les cartes NVIDIA sont constituées de nombreux «multiprocesseurs de streaming» ou SM. Chacun des 68 SM « Turing » du 2080 Ti contient, entre autres choses, 64 cœurs cuda « FP32 » dédiés aux mathématiques en virgule flottante et 64 cœurs « INT32 » dédiés aux mathématiques entières (calculs avec des nombres entiers).

La grande innovation du Turing SM, en dehors de l’IA et de l’accélération du lancer de rayons, était la capacité d’exécuter simultanément des nombres entiers et des nombres flottants. C’était un changement significatif par rapport à la génération précédente, Pascal, où les banques de cœurs basculaient entre les nombres entiers et les virgule flottante sur une base soit ou soit.

NVIDIA AMPERE SM

NVIDIA

Les cartes RTX 3000 sont construites sur une architecture que NVIDIA appelle «Ampère», et son SM, à certains égards, adopte à la fois l’approche Pascal et l’approche Turing. Ampere conserve les 64 cœurs FP32 comme auparavant, mais les 64 autres cœurs sont désormais désignés comme «FP32 et INT32». Ainsi, la moitié des cœurs Ampere sont dédiés à la virgule flottante, mais l’autre moitié peut effectuer des calculs en virgule flottante ou en nombres entiers, tout comme en Pascal.

Avec ce commutateur, NVIDIA compte désormais chaque SM comme contenant 128 cœurs FP32, plutôt que les 64 que Turing avait. Les «5 888 cœurs cuda» du 3070 sont peut-être mieux décrits comme «2 944 cœurs cuda et 2 944 cœurs qui peuvent être cuda».

À mesure que les jeux sont devenus plus complexes, les développeurs ont commencé à s’appuyer davantage sur les nombres entiers. Une diapositive NVIDIA du lancement original de RTX en 2018 a suggéré que le calcul des nombres entiers, en moyenne, représentait environ un quart des opérations GPU dans le jeu.

L’inconvénient du Turing SM est le potentiel de sous-utilisation. Si, par exemple, une charge de travail est constituée de 25% de calculs entiers, environ un quart des cœurs du GPU pourraient rester sans rien à faire. C’est l’idée derrière cette nouvelle structure de noyau semi-unifiée, et, sur le papier, cela a beaucoup de sens: vous pouvez toujours exécuter des opérations en virgule flottante et entière simultanément, mais lorsque ces cœurs entiers sont dormants, ils peuvent exécuter des opérations en virgule flottante au lieu.

[This episode of Upscaled was produced before NVIDIA explained the SM changes.]

Lors du lancement du RTX 3000 de NVIDIA, le PDG Jensen Huang a déclaré que le RTX 3070 était « plus puissant que le RTX 2080 Ti ». En utilisant ce que nous savons maintenant sur la conception, les entiers, les virgules flottantes, les vitesses d’horloge et les téraflops d’Ampère, nous pouvons voir comment les choses pourraient se dérouler. Dans cette charge de travail «d’entiers à 25%», 4 416 de ces cœurs pourraient exécuter des calculs FP32, dont 1 472 gérant l’INT32 nécessaire.

Couplé à tous les autres changements qu’Ampère apporte, le 3070 pourrait surpasser le 2080 Ti de peut-être 10%, en supposant que le jeu ne craigne pas d’avoir 8 Go au lieu de 11 Go de mémoire pour travailler. Dans le pire des cas absolu (et hautement improbable), où une charge de travail est extrêmement dépendante des nombres entiers, elle pourrait se comporter davantage comme la 2080. D’un autre côté, si un jeu nécessite très peu de calculs en nombres entiers, l’augmentation par rapport au 2080 Ti pourrait être énorme.

Mis à part les suppositions, nous avons jusqu’à présent un point de comparaison: une vidéo de Digital Foundry comparant le RTX 3080 au RTX 2080. DF a vu une augmentation de 70 à 90% entre les générations dans plusieurs jeux présentés par NVIDIA pour les tests, avec un écart de performance plus élevé. dans les titres qui utilisent des fonctionnalités RTX comme le lancer de rayons. Cette plage donne un aperçu du type de gain de performance variable auquel nous nous attendrions compte tenu des nouveaux cœurs partagés. Il sera intéressant de voir comment se comporte une plus grande suite de jeux, car NVIDIA est susceptible d’avoir fait de son mieux avec la sélection de jeux sanctionnée. Ce que vous ne verrez pas, c’est l’amélioration de près de 3x qu’impliquerait le passage du chiffre téraflop de 2080 au chiffre téraflop du 3080.

Avec les premières cartes RTX 3000 arrivant dans quelques semaines, vous pouvez vous attendre à ce que les critiques vous donnent bientôt une idée précise des performances d’Ampère. Bien que même maintenant, il semble prudent de dire qu’Ampère représente un bond en avant monumental pour les jeux sur PC. Le 3070 $ 499 est susceptible d’être un gros coup avec le produit phare actuel, et le 799 $ 3080 devrait offrir des performances plus que suffisantes pour ceux qui auraient pu auparavant opter pour le «Ti». Cependant, ces cartes s’alignent, il est clair que leur valeur ne peut plus être représentée par une figure singulière comme des téraflops.

  • Nvidia Quadro RTX 4000 - carte graphique - Quadro RTX 4000 - 8 Go
    Des performances fiablesFiabilité matérielle à toute épreuveInstallez et gérez votre matériel en toute confiance Répondez aux diverses demandes des nouveaux workflows professionnels avec d'innovantes capacités de ray tracing sur GPU, de Deep Learning et de shading avancé.#br/#La carte graphique NVIDIA Quadro
  • Nvidia Quadro RTX 5000 - carte graphique - Quadro RTX 5000 - 16 Go
    Des performances fiablesFiabilité matérielle à toute épreuveInstallez et gérez votre matériel en toute confiance Repousser les limites du possible avec NVIDIA Quadro RTX 5000.#br/#Basées sur l'architecture NVIDIA Turing et la plateforme NVIDIA RTX, les cartes graphiques RTX 5000 exploitent le ray tracing, le
  • Fierce PC Fierce Overlord PC Gamer - Vite 6 x 4.2GHz Hex-Core AMD Ryzen 5 3600, 480Go SSD, 16Go of 3000MHz DDR4 RAM, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé, Clavier (UK/QWERTY), Souris, moniteur 24 pouces 1137228 - Ord
    Fnac.com : Fierce Overlord PC Gamer - Vite 6 x 4.2GHz Hex-Core AMD Ryzen 5 3600, 480Go SSD, 16Go of 3000MHz DDR4 RAM, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé, Clavier (UK/QWERTY), Souris, moniteur 24 pouces 1137228 - Ordinateur de bureau. Remise permanente de 5% pour les
  • Fierce PC Fierce Overlord PC Gamer - Vite 6 x 4.2GHz Hex-Core AMD Ryzen 5 3600, 480Go SSD, 16Go of 3000MHz DDR4 RAM / Mémoire, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé 1137226 - Ordinateur - Unité centrale
    Fnac.com : Fierce Overlord PC Gamer - Vite 6 x 4.2GHz Hex-Core AMD Ryzen 5 3600, 480Go SSD, 16Go of 3000MHz DDR4 RAM / Mémoire, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé 1137226 - Ordinateur - Unité centrale. Remise permanente de 5% pour les adhérents. Commandez vos produits
  • Fierce PC Fierce Overlord PC Gamer - Vite 6 x 4.2GHz Hex-Core AMD Ryzen 5 3600, 480Go SSD, 16Go of 3000MHz DDR4 RAM, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé, Clavier (UK/QWERTY), Souris, moniteur 24 pouces, casque 11372
    Fnac.com : Fierce Overlord PC Gamer - Vite 6 x 4.2GHz Hex-Core AMD Ryzen 5 3600, 480Go SSD, 16Go of 3000MHz DDR4 RAM, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé, Clavier (UK/QWERTY), Souris, moniteur 24 pouces, casque 1137229 - Ordinateur de bureau. Remise permanente de 5%
  • Fierce PC Fierce Warblade RGB/RVB PC Gamer - Vite 8 x 4.4GHz Octa-Core AMD Ryzen 7 3700X, Refroidisseur liquide tout-en-un, 480Go SSD, 16Go of 3000MHz DDR4 RAM / Mémoire, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé 1137138
    Fnac.com : Fierce Warblade RGB/RVB PC Gamer - Vite 8 x 4.4GHz Octa-Core AMD Ryzen 7 3700X, Refroidisseur liquide tout-en-un, 480Go SSD, 16Go of 3000MHz DDR4 RAM / Mémoire, NVIDIA GeForce RTX 2060 Super 8Go, HDMI, USB3, Wi - Fi, Windows 10 installé 1137138 - Ordinateur - Unité centrale. Remise permanente de 5%