• Pagina iniziale
  • High Tech
  • Criptovalute
  • Gioco
  • Hollywood
  • Scienza
  • Spazio
  • Auto
  • Sport
  • Mondo

NVIDIA ha condiviso alcuni dettagli sulla struttura dei processori Grace Arm e dei chip ibridi Grace Hopper

NVIDIA ha condiviso alcuni dettagli sulla struttura dei processori Grace Arm e dei chip ibridi Grace Hopper

Al GTC 2022 di questa primavera, NVIDIA si è annunciata per la prima volta come produttore di potenti processori per server. Stiamo parlando dei chip Grace e degli assiemi ibridi Grace Hopper, che combinano core Arm v9 e acceleratori basati sull'architettura Hopper, la cui spedizione dovrebbe iniziare nella prima metà del prossimo anno. Molti sviluppatori di supercomputer sono già interessati a nuovi prodotti. In vista della conferenza Hot Chips 34, la società ha rivelato una serie di dettagli sui chip.

Grace è prodotto utilizzando la tecnologia di processo TSMC 4N: questa è una variante dell'N4 appositamente ottimizzata per le soluzioni NVIDIA, che fa parte della serie di processi a 5 nm del produttore taiwanese. Ogni die Grace contiene 72 core Arm v9 che supportano estensioni vettoriali scalabili SVE2 ed estensioni di virtualizzazione che supportano S-EL2. Come riportato in precedenza, NVIDIA ha scelto il core Arm Neoverse per la nuova piattaforma.

Il processore Grace è inoltre conforme a una serie di altre specifiche Arm, tra cui Generic Interrupt Controller (GIC) v4.1 conforme a RAS v1.1, System Memory Management Unit (SMMU) v3.1 e Memory Partitioning and Monitoring (MPAM). Grace ha due cristalli di base, che danno un totale di 144 core, un numero record sia nel mondo Arm che in quello x86.

Le unità interne Grace sono collegate tramite lo Scalable Coherency Fabric (SCF), la variazione di NVIDIA sulla rete CMN-700 utilizzata nei progetti Arm Neoverse. Le prestazioni di questa interconnessione sono di 3,2 TB/s. Nel caso di Grace, assume 117 MB di cache L3 e mantiene la coerenza all'interno di quattro socket (attraverso la nuova versione di NVLink).

Ma SCF supporta il ridimensionamento. Finora, nell'hardware, è limitato a due blocchi Grace, e questo è già 144 core e 234 MB di cache L3. I core e le partizioni cache (SCC) sono distribuiti sull'SCF di fabbrica mesh interno. Gli switch (CSN) fungono da interfacce per i core, le partizioni della cache e il resto del sistema. I blocchi CSN comunicano direttamente tra loro e con i controller LPDDR5X e PCIe 5.0/cNVLink/NVLink C2C.

Il chip supporta PCI Express 5.0. In totale, il controller supporta 68 linee, 12 delle quali possono funzionare anche in modalità cNVLink (NVLink with coherence). Un'interfaccia x16 può essere divisa in due interfacce x8. Anche sul diagramma fornito da NVIDIA, puoi vedere fino a 16 controller LPDDR5x dual-channel. Larghezza di banda di memoria dichiarata a livello di oltre 1 TB/s per l'assieme (fino a 546 GB/s per chip CPU).

NVIDIA vede una nuova versione di NVLink, NVLink-C2C, che è sette volte più veloce di PCIe 5.0 e in grado di fornire velocità di trasferimento dati bidirezionali fino a 900 GB/s, pur essendo cinque volte più economica. Il consumo specifico della novità è di 1.3 pJ/bit, che è inferiore a quello di AMD Infinity Fabric con 1.5 pJ/bit. Tuttavia, esistono anche soluzioni più economiche, ad esempio UCIe (~0,5 pJ/bit).

NVLink-C2C consente di implementare un pool di memoria "piatto" unificato con uno spazio di indirizzi comune per Grace Hopper. All'interno di un nodo è possibile accedere liberamente alla memoria dei vicini. Ma per combinare più nodi, avrai bisogno di uno switch NVSwitch esterno. Sarà alto 1U e fornirà 128 porte NVLink 4 con larghezza di banda aggregata fino a 6,4 TB/s in duplex.

Anche le prestazioni di Grace promettono di essere record grazie a un'architettura ottimizzata e a un'interconnessione rapida. Anche secondo i dati preliminari pubblicati da NVIDIA, si parla di 370 punti SPECrate2017_int_base per un singolo die Grace e 740 punti per un assembly dual-die a 144 core - e questo sta usando il solito compilatore GCC senza sottili ottimizzazioni della piattaforma. Quest'ultima cifra è significativamente superiore ai risultati mostrati dall'Alibaba T-Head Yitian 710 a 128 core, che utilizza anche l'architettura Arm v9, e dall'AMD EPYC 7773X a 64 core.


2022-08-21 03:51:49

Autore: Vitalii Babkin

Precedente | Il prossimo

• Presentato il ciclocomputer Coros Dura con GPS e ricarica solare

• Realme ha lanciato una nuova versione dello smartphone P1 Pro 5G con 12 GB di RAM

• Presentato OnePlus Nord CE4 Lite con batteria da 5500 mAh

• Presentato il tablet Lenovo Tab Plus con sistema audio JBL

• Presentata la TV Hisense S7N CanvasTV 4K QLED

• MSI ha rilasciato il monitor da gioco MAG 27QRF QD E2 Monster Hunter Edition

• AOC ha lanciato il monitor Gaming C27G2Z3/BK con schermo Fast VA e frequenza di 280 Hz

• Samsung, seguendo l'esempio di Apple, ha rinunciato alle ambizioni nel settore dell'auto-pilota

• Nel Regno Unito è stata lanciata una piattaforma per valutare la sicurezza dell'IA

• Un tribunale ha multato Microsoft per 242 milioni di dollari per la violazione di tecnologia nella creazione di Cortana

• Xiaomi ha mostrato il design insolito del telefono Civi 4 Pro

• Il PC compatto GEEKOM Mini Air12 con processore Intel N100 e 16 GB di RAM è stato valutato a 249 dollari

• L'aggiornamento di Apple Watch porta a un'eccessiva rapida scarica della batteria

• Lo smartphone iQOO 12 potrà scattare foto con uno zoom 70x

© 2021-2023 Yoopply Italy - Notizie dal mondo ogni giorno
Deutsch | 日本 | France | Italy | 한국어 | Portugues

Auto | Criptovalute | Gioco | High Tech | Hollywood | Scienza | Spazio | Sport | Mondo | Software

Chi siamo | Politica sulla riservatezza
Facebook | Twitter
Yoopply
40004, Ukraine, Sumska, Sumy, Pratsi str. building 37
Phone: +380958165974
Email: acca.in.ua@gmail.com