NVIDIA A2, annunciato l'acceleratore per server più piccolo di Ampere

L'acceleratore NVIDIA A2 sostituirà NVIDIA T4, introdotto nel 2018. Entrambi sono modelli entry-level e sono adatti per attività di inferenza, sebbene possano essere utilizzati anche per l'addestramento di piccoli modelli, transcodifica video, analisi, VDI, workstation virtuali, ecc.

NVIDIA A2 è una scheda HHHL a slot singolo con raffreddamento passivo e interfaccia PCIe 4.0 x8 con barra ridimensionabile. Una differenza importante rispetto al T4 era la gamma più ampia del livello TDP regolabile, da 40 a 60 watt. L'acceleratore è in grado di funzionare a temperature da 0 a +50 ° C (per un breve periodo da -5 a +55 ° C). Ciò ne consente l'utilizzo in periferia, anche in condizioni non favorevoli (NEBS-3).

La frequenza di base della GPU è 1140 MHz e il boost è 1771 MHz. Il volume della memoria GDDR6 integrata (128 bit, 6251 MHz) è di 16 GB e la larghezza di banda è di 200 GB/s (300 GB/s per il T4). Ci sono anche due motori per la decodifica dei media (incluso AV1) e uno per la codifica. Il nuovo prodotto supporta CUDA 11.1, vGPU 14.0, SR-IOV (16 VF), NVIDIA AI Enterprise Secure Boot.

NVIDIA A2 utilizza tensore (il numero non è specificato) e core RT (10 pz.) Ampere. Le prestazioni di calcolo dell'FP32 sono solo 4,5 teraflop (il T4 aveva 8,1 teraflop). Per TF32, sono già 9 teraflop e per FP16 / BF16 - 18 teraflop. Per INT8 e INT4, questi indicatori sono rispettivamente 36 e 72 massimi e per T4 - 130 e 260 massimi.

Tuttavia, NVIDIA preferisce confrontare le prestazioni dell'A2 con la CPU. Prima di tutto, nei compiti di inferenza, dove il vantaggio può essere fino a 20 volte. Tuttavia, viene fornito anche il confronto di A2 con T4 nei compiti di analisi video intelligente, dove il vantaggio della novità è del 20-30%. Allo stesso tempo, in termini di rapporto qualità-prezzo, è 1,6 volte migliore del T4 e il 10% in più di efficienza energetica.

2021-11-09 16:39:41

Autore: Vitalii Babkin

Precedente | Il prossimo