NVIDIA A2, Amperes kleinster Serverbeschleuniger, angekündigt

Der NVIDIA A2-Beschleuniger wird den bereits 2018 eingeführten NVIDIA T4 ersetzen. Beide sind Einstiegsmodelle und eignen sich gut für Inferenzaufgaben, können aber auch für das Training kleiner Modelle, Videotranskodierung, Analyse, VDI, virtuelle Workstations usw. verwendet werden.

NVIDIA A2 ist eine Single-Slot-HHHL-Karte mit passiver Kühlung und PCIe 4.0 x8-Schnittstelle mit Resizable Bar. Ein wichtiger Unterschied zum T4 war der breitere Bereich des einstellbaren TDP-Levels - von 40 bis 60 Watt. Der Beschleuniger kann bei Temperaturen von 0 bis +50 ° C (kurzzeitig von -5 bis +55 ° C) betrieben werden. Dies ermöglicht den Einsatz an der Peripherie, auch unter ungünstigsten Bedingungen (NEBS-3).

Die Basisfrequenz der GPU beträgt 1140 MHz, der Boost beträgt 1771 MHz. Das Volumen des integrierten GDDR6-Speichers (128 Bit, 6251 MHz) beträgt 16 GB, die Bandbreite beträgt 200 GB/s (300 GB/s beim T4). Es gibt auch zwei Engines zum Dekodieren von Medien (einschließlich AV1) und eine zum Enkodieren. Das neue Produkt unterstützt CUDA 11.1, vGPU 14.0, SR-IOV (16 VF), NVIDIA AI Enterprise Secure Boot.

NVIDIA A2 verwendet Tensor (die Anzahl ist nicht angegeben) und RT-Kerne (10 Stk.) Ampere. Die Rechenleistung des FP32 beträgt nur 4,5 Teraflops (T4 hatte 8,1 Teraflops). Bei TF32 sind es bereits 9 Teraflops und bei FP16 / BF16 - 18 Teraflops. Für INT8 und INT4 sind diese Indikatoren 36 bzw. 72 Tops und für T4 - 130 und 260 Tops.

NVIDIA vergleicht die A2-Leistung jedoch lieber mit der CPU. Zunächst bei Inferenzaufgaben, bei denen der Vorteil bis zu 20-fach sein kann. Trotzdem ist auch der Vergleich von A2 mit T4 in den Aufgaben der Smart Video Analytics gegeben, wo der Vorteil der Neuheit 20-30% beträgt. Gleichzeitig ist es im Preis-Leistungs-Verhältnis 1,6-mal besser als T4 und 10 % energieeffizienter als es.

2021-11-09 16:39:41

Autor: Vitalii Babkin

Bisherige | Nächster