Hot Chips 34에서 AMD는 Aldebaran CDNA 2 GPU를 기반으로 하는 Instinct MI200 시리즈 서버 가속기에 대한 세부 정보를 공유했습니다.이들은 MCM 레이아웃이라고도 하는 다중 칩 스택을 사용하는 AMD의 첫 번째 그래픽 솔루션입니다.
Instinct MI200의 주요 기능 중 일부는 다음과 같습니다.
FP64 및 FP32 계산을 가속화하는 2세대 매트릭스 코어가 있는 CDNA 2 아키텍처. 이전 세대의 AMD 서버 가속기에 비해 FP64 작업의 최대 4배 성능을 제공합니다.
이전 세대 AMD 서버 GPU보다 최대 1.8배 더 많은 코어와 최대 2.7배 더 많은 메모리 대역폭을 제공하는 동시에 3x, 2TB/s의 최대 메모리 대역폭을 달성하는 고급 2.5D EFB(Elevated Fanout Bridge) 패키징 기술
3세대 AMD Infinity Fabric 버스; 여러 AMD Instinct MI200 자체 간의 통신을 제공하는 최대 8개의 Infinity Fabric 레인과 시스템에 통합 CPU/GPU 메모리를 제공하고 최대 처리량을 증가시키는 3세대를 포함한 AMD EPYC 프로세서를 지원합니다.
AMD Instinct MI200 가속기의 일부로 두 개의 크리스털(칩)이 있는 그래픽 프로세서(기본 및 보조)가 사용됩니다. 각 칩에는 FP64, FP32 작업을 위한 14개의 컴퓨팅 유닛(CU)과 FP16 및 BF16 작업을 위한 2세대 매트릭스 엔진이 포함된 8개의 셰이더 엔진이 포함되어 있습니다.
따라서 다이당 112개의 컴퓨팅 장치 또는 7168개의 스트림 프로세서가 있고 전체 GPU에는 224개의 CU 또는 14,336개의 스트림 프로세서가 있습니다. GPU는 TSMC의 6nm 공정을 사용하여 제조됩니다. GPU에는 총 580억 개의 트랜지스터가 있습니다.
Aldebaran GPU는 고속 xGMI 버스를 사용합니다. 각 칩렛에는 VCN 2.6 엔진과 주 IO 컨트롤러, 각각 4개의 1024비트 HBM2e 메모리 컨트롤러가 있습니다. 각 칩렛에는 물리적으로 32개의 블록으로 분할된 8MB의 L2 캐시와 1.6TB/s의 처리량을 가진 64GB의 HBM2e 메모리도 있습니다. GPU의 총 HBM2e 메모리 양은 최대 128GB이고 대역폭은 3.2TB/s입니다. 이것은 80GB의 HBM2e 메모리가 장착된 NVIDIA A100보다 1.2TB/s 더 높습니다.
AMD Aldebaran은 8개의 Infinity Fabric 채널을 지원합니다. 그 중 하나는 CPU와 GPU를 연결하는 데 사용할 수 있습니다(PCI Express를 통해). 144GB/s의 일관된 데이터 전송 속도를 위해 설계되었습니다. 4개의 AMD Instinct MI200 가속기가 연결된 외부 Infinity Fabric 링크를 사용하거나 100GB/s 처리량을 위한 PCIe 4.0 ESM AIC를 사용하여 최대 500GB/s까지 확장할 수 있습니다.
AMD는 작업에 따라 Aldebaran이 NVIDIA A100보다 최대 3배 더 빠를 수 있다고 주장합니다.
CNDA 2 아키텍처를 기반으로 하는 AMD Instinct MI200 가속기는 이미 Frontier 엑사스케일 슈퍼컴퓨터의 일부로 사용되고 있으며, 이는 세계에서 가장 생산적인 슈퍼컴퓨터의 TOP500 등급을 차지합니다. 1.1 엑사플롭 수준의 성능을 제공합니다.
AMD는 또한 차세대 Instinct MI300 컴퓨팅 가속기를 출시할 계획을 발표했습니다. 그들은 또한 칩렛 레이아웃을 사용할 것이지만 이들은 이미 APU가 될 것입니다. CPU와 GPU 결정은 동일한 기판에 결합될 것입니다. Instinct MI300은 CDNA 3 GPU 및 Zen 4 아키텍처를 사용하고 CDNA 2 아키텍처보다 최대 5배 빠른 AI 성능을 제공한다고 주장합니다.
2022-08-22 20:52:44
작가: Vitalii Babkin