Auf dem heutigen Architecture Day hat Intel eine Neuentwicklung vorgestellt – einen produktiven Kern für zukünftige Prozessoren, der früher unter dem Codenamen Golden Cove (P-Core) bekannt war. Es wird Teil der Client- und Serverprozessoren von Alder Lake und Sapphire Rapids sein und eine Steigerung des IPC (Anzahl der pro Taktzyklus ausgeführten Befehle) um 19 % gegenüber den Vorgängergenerationen Sunny Cove (von Ice Lake) und Cypress Cove (von Rocket Lake) Kerne.
Wie aus dem Intel-Bericht hervorgeht, wurde der Golden Cove-Kern mit Blick auf hohe Leistung und geringe Latenz bei Low-Thread-Workloads entwickelt, daher wurde bei der Erstellung darauf geachtet, die Anzahl der gleichzeitig verarbeiteten Anweisungen zu erhöhen und die Effizienz von mit Daten arbeiten. Laut den Entwicklern werden sich die Vorteile von Golden Cove in Anwendungen voll manifestieren, die auf komplexem gegabelten Code basieren.
Der durchschnittliche Geschwindigkeitsvorteil des Golden-Cove-Kerns gegenüber dem Cypress-Cove-Kern (von Rocket-Lake-Prozessoren) bei gleicher Taktrate wird auf 19% geschätzt. Es sei daran erinnert, dass Cypress Cove 19% produktiver ist als Skylake, was einen Gesamtvorteil von Golden Cove gegenüber Skylake in Höhe von 42% in Bezug auf die spezifische Produktivität bedeutet.
Um diese Ergebnisse zu erzielen, hat Golden Cove eine ganze Reihe von mikroarchitektonischen Verbesserungen vorgenommen. Der Kern erhielt sechs Decoder (anstelle von fünf in Skylake und Cypress Cove), erhöhte auf 4.000 Datensätze des Caches von Mikrooperationen (anstelle von 1,5 bzw. 2,25 Tausend für Skylake und Cypress Cove) und 12 Ausführungsports (statt 8 und 10 für Skylake und Cypress Cove). Darüber hinaus ist die Größe der physischen Registerdatei in Golden Cove und die Größe des Befehls-Neuordnungspuffers im Vergleich zu Cypress Cove um fast das Eineinhalbfache gestiegen.
Unter den wichtigen Verbesserungen heben die Entwickler auch die bessere Genauigkeit des Branch Prefetching Blocks, die reduzierte L1-Cache-Latenz und die Optimierungen der L2-Cache-Bandbreite basierend auf Data Prefetching hervor. Der Golden Cove-Kern verfügt über drei Ports für Daten-Downloads und zwei für Uploads, im Gegensatz zum 2 + 1- oder 2 + 2-Schema in Skylake bzw. Cypress Cove. Gleichzeitig geht die Golden-Cove-Mikroarchitektur von einer deutlichen Erhöhung der L2-Cache-Größe auf bis zu 1,25 MB pro Kern bei Client-Prozessoren bzw. bis zu 2 MB pro Kern bei Server-Prozessoren aus (vorher waren es 256 bzw. 512 KB). Das Volumen des Datencaches der ersten Ebene bleibt unverändert und beträgt 48 KB.
Eine wichtige Innovation bei den Leistungskernen von Golden Cove wird die Einführung des neuen Intel Advanced Matrix Extensions (AMX)-Befehlssatzes sein, der darauf abzielt, Tensorberechnungen beim maschinellen Lernen zu beschleunigen. Tatsächlich sprechen wir über Operationen mit Matrizen: Der AMX-Satz enthält Anweisungen zur Verarbeitung von 2.000 ganzzahligen oder 1.000 reellen Operanden pro Taktzyklus. AMX-Befehle erreichen eine 7-mal schnellere Ausführung von KI-Algorithmen im Vergleich zu Implementierungen, die auf AVX-512-Code basieren. In Phase 1 werden AMX-Erweiterungen nur auf Serverprozessoren mit Golden Cove-Kernen verfügbar sein.
Die Mikroarchitektur der Golden Cove-Kerne wird in Alder Lake-Client-Prozessoren Anwendung finden, die mit der Intel 7-Prozesstechnologie (ehemals 10 nm Enhanced SuperFin) hergestellt und im vierten Quartal 2021 veröffentlicht werden. Anschließend werden diese Kerne in die Serverprozessoren von Sapphire Rapids aufgenommen - sie sollen im zweiten Quartal 2022 auf den Markt kommen.
2021-08-19 15:29:56
Autor: Vitalii Babkin