All'evento dell'Architecture Day di oggi, Intel ha presentato un nuovo sviluppo: un core produttivo per i futuri processori, precedentemente noto con il nome in codice Golden Cove (P-core). Farà parte dei processori client e server Alder Lake e Sapphire Rapids e fornirà un aumento del 19% di IPC (numero di istruzioni eseguite per ciclo di clock) rispetto alla generazione precedente Sunny Cove (da Ice Lake) e Cypress Cove (da Rocket Lake).
Come risulta dal rapporto Intel, il core Golden Cove è stato creato con un occhio alle alte prestazioni e alla bassa latenza nei carichi di lavoro a basso threading, pertanto, durante la sua creazione, è stata prestata attenzione all'aumento del numero di istruzioni elaborate contemporaneamente e all'aumento dell'efficienza di lavorare con i dati. Secondo gli sviluppatori, i vantaggi di Golden Cove si manifesteranno pienamente in applicazioni basate su codice biforcuto complesso.
Il vantaggio di velocità media fornito dal core Golden Cove rispetto al core Cypress Cove (dai processori Rocket Lake) alla stessa velocità di clock è stimato al 19%. Vale la pena ricordare che Cypress Cove è il 19% più produttivo di Skylake, e questo significa un vantaggio totale di Golden Cove su Skylake nella misura del 42% in termini di produttività specifica.
Per ottenere questi risultati, Golden Cove ha apportato tutta una serie di miglioramenti alla microarchitettura. Il core ha ricevuto sei decoder (invece di cinque in Skylake e Cypress Cove), aumentato a 4 mila record della cache di micro-ops (invece di 1,5 e 2,25 mila rispettivamente per Skylake e Cypress Cove) e 12 porte di esecuzione (invece di 8 e 10 per Skylake e Cypress Cove). Inoltre, la dimensione del file di registro fisico in Golden Cove è aumentata e la dimensione del buffer di riordino delle istruzioni è aumentata di quasi una volta e mezza rispetto a Cypress Cove.
Tra gli importanti miglioramenti, gli sviluppatori evidenziano anche la migliore precisione del blocco di previsione del ramo, la ridotta latenza della cache L1 e le ottimizzazioni della larghezza di banda della cache L2 basate sul prefetch dei dati. Il core di Golden Cove ha tre porte per il download dei dati e due per l'upload, contro lo schema 2 + 1 o 2 + 2 di Skylake e Cypress Cove, rispettivamente. Allo stesso tempo, la microarchitettura Golden Cove presuppone un aumento significativo della dimensione della cache L2 fino a 1,25 MB per core nei processori client o fino a 2 MB per core nei processori server (in precedenza era di 256 o 512 KB). Il volume della cache dati di primo livello rimarrà invariato e ammonterà a 48 KB.
Un'importante innovazione nei core delle prestazioni di Golden Cove sarà l'introduzione del nuovo set di istruzioni Intel Advanced Matrix Extensions (AMX), volto ad accelerare i calcoli del tensore utilizzati nell'apprendimento automatico. Si tratta infatti di operazioni con matrici: il set AMX include istruzioni per elaborare 2mila interi o mille operandi reali per ciclo di clock. Le istruzioni AMX raggiungono un'esecuzione 7 volte più veloce degli algoritmi AI rispetto alle implementazioni basate sul codice AVX-512. Nella Fase 1, le estensioni AMX saranno disponibili solo su processori server con core Golden Cove.
La microarchitettura dei core Golden Cove troverà applicazione nei processori client Alder Lake, che saranno prodotti utilizzando la tecnologia di processo Intel 7 (ex 10 nm Enhanced SuperFin) e saranno rilasciati nel quarto trimestre del 2021. Successivamente, questi core saranno inclusi nei processori per server Sapphire Rapids: dovrebbero arrivare sul mercato nel secondo trimestre del 2022.
2021-08-19 15:29:56
Autore: Vitalii Babkin