O acelerador NVIDIA A2 substituirá o NVIDIA T4, que foi lançado em 2018. Ambos são modelos básicos e adequados para tarefas de inferência, embora também possam ser usados para treinar modelos pequenos, transcodificação de vídeo, análises, VDI, estações de trabalho virtuais, etc.
NVIDIA A2 é uma placa HHHL de slot único com refrigeração passiva e interface PCIe 4.0 x8 com barra redimensionável. Uma diferença importante do T4 foi a faixa mais ampla do nível de TDP ajustável - de 40 a 60 watts. O acelerador é capaz de operar em temperaturas de 0 a +50 ° C (por um curto período de -5 a +55 ° C). Isso permite que ele seja usado na periferia, inclusive em condições não mais favoráveis (NEBS-3).
A frequência básica da GPU é 1140 MHz e o reforço é 1771 MHz. O volume da memória GDDR6 on-board (128 bits, 6251 MHz) é de 16 GB e a largura de banda é de 200 GB / s (300 GB / s para o T4). Existem também dois mecanismos para decodificar mídia (incluindo AV1) e um para codificação. O novo produto é compatível com CUDA 11.1, vGPU 14.0, SR-IOV (16 VF), NVIDIA AI Enterprise Secure Boot.
NVIDIA A2 usa tensor (o número não é especificado) e núcleos RT (10 pcs.) Ampere. O desempenho de computação do FP32 é de apenas 4,5 teraflops (T4 tinha 8,1 teraflops). Para TF32, já são 9 teraflops, e para FP16 / BF16 - 18 teraflops. Para INT8 e INT4, esses indicadores são 36 e 72 Tops, respectivamente, e para T4 - 130 e 260 Tops.
No entanto, a NVIDIA prefere comparar o desempenho A2 com a CPU. Em primeiro lugar, em tarefas de inferência, onde a vantagem pode ser de até 20 vezes. No entanto, também é feita a comparação de A2 com T4 nas tarefas de análise de vídeo inteligente, onde a vantagem da novidade é de 20-30%. Ao mesmo tempo, em termos de relação preço-desempenho, é 1,6 vezes melhor do que o T4 e 10% mais eficiente em termos energéticos do que ele.
2021-11-09 16:39:41
Autor: Vitalii Babkin