Das slowakische Unternehmen Tachyum hat offiziell Prodigy-Serverprozessoren vorgestellt, an denen es seit mehreren Jahren arbeitet. Laut den Machern sind dies die weltweit ersten wirklich universellen Chips, die gleichzeitig CPU, GPU und TPU ersetzen können. Darüber hinaus behauptet Tachyum, dass seine Prozessoren nicht nur schneller als alle anderen, sondern auch billiger und energieeffizienter sind.
Die Vielseitigkeit von Prodigy liegt unter anderem in der Fähigkeit, Binärdateien auszuführen, die für x86-64-, Arm- und RISC-V-Architekturen kompiliert wurden, zusätzlich zu Anwendungen, die für diese 64-Bit-ISA nativ sind. Tachyum sagt, dass seine Chips für KI- und HPC-Aufgaben geeignet und auch für Hyperscaler attraktiv sein werden. Das Unternehmen wird noch in diesem Jahr mit dem Versand von Testmustern beginnen, der Start der Massenproduktion ist für die erste Hälfte des Jahres 2023 geplant. Darüber hinaus bietet das Unternehmen IP-TPUs für IoT/Edge-Inferenzsysteme an.
Das Modell ist das älteste in der Familie der neuen 5-nm-CPUs, die acht Geräte umfasst, und verfügt über 128 vereinheitlichte Kerne, die mit einer Frequenz von 5,7 GHz arbeiten. Nach vorläufigen Daten verfügt jeder Kern über 64 KB L1-Cache für Daten und Anweisungen sowie 128 MB L2 + L3. Die Details zur Architektur und Mikroarchitektur neuer Produkte werden noch nicht beschrieben, aber die Ausführung außerhalb der Reihenfolge und die Fähigkeit, bis zu vier Befehle pro Takt auszuführen, sowie die Unterstützung für Virtualisierung und erweiterte RAS-Funktionen werden erwähnt. Jeder Kern hat zwei 1024-Bit-Vektorblöcke und einen 4096-Bit-Matrixblock.
Der Prozessor ist mit 16 Speichercontrollern mit Unterstützung für DDR5-7200-Module mit einer Gesamtkapazität von bis zu 8 TB ausgestattet. Gleichzeitig ist es möglich, Zwei- und Vier-Prozessor-Systeme aufzubauen. Für die Kommunikation mit der Außenwelt sorgen 32 PCIe-Controller, die insgesamt 64 PCIe-5.0-Lanes ergeben. TDP für dieses Modell ist nicht angegeben, aber das Unternehmen spricht von der Möglichkeit, Luft- und Flüssigkeitskühlung zu verwenden.
Die Basisspezifikationen sind beeindruckend, aber noch überraschender sind die Leistungsansprüche des kommenden Flaggschiffs. In SPECrate 2017 Integer ist er etwa viermal schneller als der Xeon Platinum 8380 und dreimal schneller als der EPYC 7763, die Intel- und AMD-Prozessoren der aktuellen Generation. Darüber hinaus verspricht das Unternehmen, dass die FP64-Leistung der neuen Produkte dreimal höher sein wird als die der kommenden NVIDIA H100-Beschleuniger, also etwa 180 TFlops betragen wird.
Und in FP8-Berechnungen wird die Leistung auf einmal sechsmal höher sein als die des H100 - 24 Pflops! Gleichzeitig werden neue Artikel laut Tachyum energieeffizienter sein als all diese Chips. Für Prodigy, Unterstützung für die Formate FP64, FP32, TF32, BF16, INT8, FP8 und einige TAI-Formate sowie die Arbeit mit den sog. spärliche (sparsed) Berechnungen, die für KI-Workloads wichtig sind. Bisher kann die Ankündigung zwar als "Papier" bezeichnet werden, da das Unternehmen keine detaillierten Eigenschaften der Chips angegeben hat und sich auf Geschichten darüber beschränkt, wie gut sie sind.
Tachyum berichtet jedoch regelmäßig über Entwicklungsfortschritte. Im Moment bietet das Unternehmen Entwicklern einen FPGA-basierten Hardware-Emulator an – nur 8 Prodigy-Kerne, aber mit der Möglichkeit, auf bis zu 64 Kerne zu skalieren. Das Unternehmen selbst verwendet diesen Emulator zum Debuggen von Software. Es hat bereits den Linux-Kernel und die Basisumgebung UEFI, KVM/QEMU, GCC angepasst und auch FreeBSD erfolgreich auf seine Architektur portiert.
2022-05-11 18:59:32
Autor: Vitalii Babkin