Compute Express Link 3.0 사양 발표

Compute Express Link 표준은 조금씩 시장에 출시되고 있습니다. 아직 지원되는 프로세서는 없지만 새로운 상호 연결을 위한 많은 인프라 요소와 이를 기반으로 하는 개념이 이미 준비되어 있습니다. 특히 새로운 컨트롤러 메모리 모듈은 정기적으로 시연됩니다. 그러나 표준 자체는 진화하고 있습니다. 2019년에 사양이 공개된 버전 1.1에서는 기반만 마련되었습니다.

그러나 이미 버전 2.0에서 CXL은 새로운 버스뿐만 아니라 전체 개념과 서버 아키텍처에 대한 접근 방식의 변화에 대해 이야기할 수 있는 많은 혁신을 받았습니다. 그리고 이제 표준 개발을 담당하는 컨소시엄이 최신 버전 3.0 사양을 발표하여 CXL의 기능을 더욱 확장했습니다.

확장뿐만 아니라 버전 3.0에서 새로운 표준은 지연을 늘리지 않고 64 GT / s에 대한 지원을 받았습니다. PCIe 6.0 표준을 기반으로 하기 때문에 놀라운 일이 아닙니다. 그러나 개발자의 주요 노력은 리소스 분해 및 구성 가능한 인프라 생성에 대한 아이디어의 추가 개발에 집중되었습니다.

CXL 3.0 패브릭 자체는 이제 다중 헤드 장치의 생성 및 연결, 확장된 공장 관리 기능, 메모리 풀 지원 개선, 고급 일관성 모드 및 다중 레벨 스위칭 지원을 허용합니다. 동시에 CXL 3.0은 모든 이전 버전(2.0, 1.1 및 1.0)과의 하위 호환성을 유지했습니다. 이 경우 사용 가능한 기능 중 일부가 단순히 활성화되지 않습니다.

주요 혁신 중 하나는 다단계 스위칭입니다. 이제 CXL 3.0 패브릭의 토폴로지는 상위 레벨 스위치에 연결된 스위치 그룹과 함께 선형에서 캐스케이드에 이르기까지 거의 모든 것이 될 수 있습니다. 동시에 프로세서의 각 루트 포트는 임의의 조합으로 스위치를 통해 다양한 유형의 장치를 동시에 연결할 수 있도록 지원합니다.

또 다른 흥미로운 혁신은 P2P(Peer-to-Peer) 직접 메모리 액세스 지원이었습니다. 간단히 말해서, 예를 들어 인접한 랙에 있는 여러 가속기는 호스트 프로세서에 영향을 주지 않고 서로 직접 통신할 수 있습니다. 모든 경우에 액세스 보호 및 통신 보안이 보장됩니다. 또한 각 장치의 메모리를 16개의 독립적인 세그먼트로 나눌 수 있습니다.

동시에 메모리와 캐시 내용의 일관성이 보장되는 계층적 그룹 구성이 지원됩니다(무효화 제공). 이제 풀에서 메모리에 대한 배타적 액세스 외에도 일관성을 위한 하드웨어 지원을 통해 여러 호스트가 한 번에 하나의 메모리 블록에 공유 액세스할 수도 있습니다. 풀링은 더 이상 타사 소프트웨어에 맡기지 않고 표준화된 공장 관리자를 통해 수행됩니다.

새로운 기능의 조합은 메모리와 컴퓨팅 리소스를 새로운 수준으로 분리한다는 아이디어를 가져옵니다. 이제 CXL 3.0 패브릭(Global Fabric Attached Memory, GFAM)에 연결된 단일 메모리 풀이 실제로 존재하는 시스템을 구축할 수 있습니다. 컴퓨팅 모듈과 별도로 동시에 최대 4096개의 연결 지점을 처리하는 기능은 공장의 물리적 한계에 부딪힐 것입니다.

풀에는 DRAM, NAND, SCM과 같은 다양한 유형의 메모리가 포함될 수 있으며 직접 또는 CXL 스위치를 통해 컴퓨팅 성능에 연결할 수 있습니다. 장치 자체에서 유형, 기능 및 기타 특성에 대해 보고하기 위한 메커니즘이 제공됩니다. 이러한 아키텍처는 차세대 신경망을 위한 데이터 세트가 이미 엄청난 규모에 도달하고 있는 머신 러닝 세계에서 수요가 있을 것이라고 약속합니다.

CXL 그룹에는 현재 Intel, Arm, AMD, IBM, NVIDIA, Huawei, Microsoft, Alibaba Group, Google 및 Meta를 포함한 주요 클라우드 제공업체와 HPE 및 델 EMC.

2022-08-02 13:13:46

작가: Vitalii Babkin

이전 | 다음