• 홈페이지
  • 차
  • 암호 화폐
  • 경기
  • 하이 테크
  • 할리우드
  • 과학
  • 우주
  • 스포츠
  • 세계

NVIDIA는 Grace Arm 프로세서와 Grace Hopper 하이브리드 칩의 구조에 대한 몇 가지 세부 정보를 공유했습니다.

NVIDIA는 Grace Arm 프로세서와 Grace Hopper 하이브리드 칩의 구조에 대한 몇 가지 세부 정보를 공유했습니다.

이번 봄 GTC 2022에서 NVIDIA는 처음으로 강력한 서버 프로세서 제조업체임을 발표했습니다. Arm v9 코어와 Hopper 아키텍처 기반의 가속기를 결합한 Grace 칩과 Grace Hopper 하이브리드 어셈블리에 대해 이야기하고 있으며, 내년 상반기에 출하를 시작할 예정입니다. 많은 슈퍼컴퓨터 개발자들은 이미 신제품에 관심을 갖고 있습니다. Hot Chips 34 컨퍼런스에 앞서 회사는 칩에 대한 여러 세부 사항을 공개했습니다.

Grace는 TSMC 4N 공정 기술을 사용하여 제조되었습니다. 이것은 대만 제조업체의 5nm 공정 시리즈의 일부인 NVIDIA 솔루션에 특별히 최적화된 N4의 변형입니다. 각 Grace 다이에는 SVE2 확장 가능한 벡터 확장 및 S-EL2를 지원하는 가상화 확장을 지원하는 72개의 Arm v9 코어가 포함되어 있습니다. 이전에 보고된 바와 같이 NVIDIA는 새 플랫폼에 Arm Neoverse 코어를 선택했습니다.

Grace 프로세서는 또한 RAS v1.1 호환 GIC(Generic Interrupt Controller) v4.1, SMMU(시스템 메모리 관리 장치) v3.1, MPAM(메모리 분할 및 모니터링)을 비롯한 여러 Arm 사양을 준수합니다. Grace는 총 144개의 코어를 제공하는 두 개의 기본 수정을 가지고 있습니다. 이는 Arm 및 x86 세계에서 모두 기록적인 수입니다.

Grace 실내기는 Arm Neoverse 설계에 사용되는 CMN-700 네트워크의 NVIDIA 변형인 SCF(Scalable Coherency Fabric)를 통해 연결됩니다. 이 상호 연결의 성능은 3.2TB/s입니다. Grace의 경우 117MB의 L3 캐시를 가정하고 4개의 소켓 내에서 일관성을 유지합니다(새 버전의 NVLink를 통해).

그러나 SCF는 확장을 지원합니다. 지금까지 하드웨어에서는 2개의 Grace 블록으로 제한되며 이는 이미 144개의 코어와 234MB의 L3 캐시입니다. 코어 및 캐시 파티션(SCC)은 내부 메시 팩토리 SCF를 통해 분산됩니다. 스위치(CSN)는 코어, 캐시 파티션 및 나머지 시스템에 대한 인터페이스 역할을 합니다. CSN 블록은 서로는 물론 LPDDR5X 및 PCIe 5.0/cNVLink/NVLink C2C 컨트롤러와도 직접 통신합니다.

이 칩은 PCI Express 5.0을 지원합니다. 전체적으로 컨트롤러는 68개 라인을 지원하며 그 중 12개는 cNVLink 모드(일관성이 있는 NVLink)에서도 작동할 수 있습니다. x16 인터페이스는 두 개의 x8 인터페이스로 분기될 수 있습니다. 또한 NVIDIA에서 제공하는 다이어그램에서 최대 16개의 듀얼 채널 LPDDR5x 컨트롤러를 볼 수 있습니다. 어셈블리에 대해 1TB/s 이상의 수준에서 선언된 메모리 대역폭(CPU 칩당 최대 546GB/s).

NVIDIA는 PCIe 5.0보다 7배 더 빠르고 최대 900GB/s의 양방향 데이터 전송 속도를 제공하면서 5배 더 경제적인 NVLink의 새 버전인 NVLink-C2C를 보고 있습니다. 참신함의 특정 소비량은 1.3pJ/bit로 1.5pJ/bit의 AMD Infinity Fabric보다 적습니다. 그러나 UCIe(~0.5pJ/bit)와 같은 보다 경제적인 솔루션도 있습니다.

NVLink-C2C를 사용하면 Grace Hopper를 위한 공통 주소 공간으로 통합 "플랫" 메모리 풀을 구현할 수 있습니다. 하나의 노드 내에서 이웃의 메모리에 자유롭게 접근할 수 있습니다. 그러나 여러 노드를 결합하려면 외부 NVSwitch 스위치가 필요합니다. 1U 높이이며 이중에서 최대 6.4TB/s의 집계 대역폭으로 128개의 NVLink 4 포트를 제공합니다.

또한 Grace 성능은 최적화된 아키텍처와 빠른 상호 연결 덕분에 최고 기록을 달성할 것을 약속합니다. NVIDIA에서 발표한 예비 수치에 따르면 단일 Grace 다이의 경우 370 SPECrate2017_int_base 포인트, 144코어 듀얼 다이 어셈블리의 경우 740 포인트에 대해 이야기하고 있으며 이는 미묘한 플랫폼 최적화 없이 일반적인 GCC 컴파일러를 사용하는 것입니다. 후자의 수치는 Arm v9 아키텍처를 사용하는 128코어 Alibaba T-Head Yitian 710과 64코어 AMD EPYC 7773X의 결과보다 훨씬 높습니다.


2022-08-21 03:51:49

작가: Vitalii Babkin

이전 | 다음

• GPS 및 태양광 충전 기능을 갖춘 Coros Dura 사이클 컴퓨터가 발표되었습니다

• 리얼미, 12GB 램을 탑재한 새로운 P1 Pro 5G 스마트폰 출시

• OnePlus Nord CE4 Lite, 5500mAh 배터리로 출시

• JBL 오디오 시스템이 탑재된 Lenovo Tab Plus 발표

• Hisense S7N CanvasTV 4K QLED 발표

• MSI가 게임용 모니터 MAG 27QRF QD E2 Monster Hunter Edition 출시

• AOC, Fast VA 화면과 280Hz 주사율을 갖춘 Gaming C27G2Z3/BK 모니터 출시

• 삼성은 애플의 예에 따라 자율주행 분야의 야망을 포기했습니다

• 영국에서 AI 안전성 평가 플랫폼 출시

• 법원이 코르타나 개발 시 기술 도용으로 Microsoft에 2억 4200만 달러의 벌금 부과

• 샤오미, 독특한 디자인의 Civi 4 Pro 스마트폰 공개

• 인텔 N100 프로세서와 16GB RAM을 장착한 콤팩트 PC인 GEEKOM Mini Air12의 가격은 249달러로 평가되었습니다

• Apple Watch 업데이트로 인해 배터리가 지나치게 빨리 소모됩니다

• iQOO 12 스마트폰, 70배 줌으로 사진 촬영 가능

© 2021-2023 Yoopply 한국어 - 매일 세계 뉴스
Deutsch | 日本 | France | Italy | 한국어 | Portugues

차 | 암호 화폐 | 경기 | 하이 테크 | 할리우드 | 과학 | 우주 | 스포츠 | 세계 | 소프트웨어

회사 소개 | 개인 정보 정책
Facebook | Twitter
Yoopply
40004, Ukraine, Sumska, Sumy, Pratsi str. building 37
Phone: +380958165974
Email: acca.in.ua@gmail.com