L'accélérateur NVIDIA A2 remplacera le NVIDIA T4, qui a été introduit en 2018. Les deux sont des modèles d'entrée de gamme et sont bien adaptés aux tâches d'inférence, bien qu'ils puissent également être utilisés pour la formation de petits modèles, le transcodage vidéo, l'analyse, le VDI, les postes de travail virtuels, etc.
NVIDIA A2 est une carte HHHL à un emplacement avec refroidissement passif et interface PCIe 4.0 x8 avec barre redimensionnable. Une différence importante par rapport au T4 était la plage plus large du niveau TDP réglable - de 40 à 60 watts. L'accélérateur est capable de fonctionner à des températures de 0 à +50 °C (pendant une courte période de -5 à +55 °C). Cela lui permet d'être utilisé en périphérie, y compris dans des conditions peu favorables (NEBS-3).
La fréquence de base du GPU est de 1140 MHz et le boost est de 1771 MHz. Le volume de la mémoire GDDR6 embarquée (128 bits, 6251 MHz) est de 16 Go, et la bande passante est de 200 Go/s (300 Go/s pour le T4). Il existe également deux moteurs pour le décodage des médias (y compris AV1) et un pour l'encodage. Le nouveau produit prend en charge CUDA 11.1, vGPU 14.0, SR-IOV (16 VF), NVIDIA AI Enterprise Secure Boot.
NVIDIA A2 utilise des tenseurs (le nombre n'est pas spécifié) et des cœurs RT (10 pcs.) Ampère. Les performances de calcul du FP32 ne sont que de 4,5 téraflops (T4 avait 8,1 téraflops). Pour TF32, c'est déjà 9 téraflops, et pour FP16 / BF16 - 18 téraflops. Pour INT8 et INT4, ces indicateurs sont respectivement de 36 et 72 Tops, et pour T4 - 130 et 260 Tops.
Cependant, NVIDIA préfère comparer les performances de l'A2 avec le CPU. Tout d'abord, dans les tâches d'inférence, où l'avantage peut être jusqu'à 20 fois supérieur. Néanmoins, la comparaison de A2 avec T4 dans les tâches d'analyse vidéo intelligente est également donnée, où l'avantage de la nouveauté est de 20 à 30%. En même temps, en termes de rapport qualité-prix, il est 1,6 fois meilleur que le T4 et 10 % plus économe en énergie que lui.
2021-11-09 16:39:41
Auteur: Vitalii Babkin