La société slovaque Tachyum a officiellement présenté les processeurs pour serveurs Prodigy, sur lesquels elle travaille depuis plusieurs années. Selon les créateurs, ce sont les premières puces véritablement universelles au monde qui peuvent remplacer simultanément le CPU, le GPU et le TPU. De plus, Tachyum affirme que ses processeurs sont non seulement plus rapides que tous les autres, mais aussi moins chers et plus économes en énergie.
La polyvalence de Prodigy réside, entre autres, dans la possibilité d'exécuter des fichiers binaires compilés pour les architectures x86-64, Arm et RISC-V en plus des applications natives de cet ISA 64 bits. Tachyum affirme que ses puces conviendront aux tâches d'IA et de HPC, et seront également attrayantes pour les hyperscalers. La société commencera à envoyer des échantillons de test cette année et le début de la production de masse est prévu pour le premier semestre 2023. De plus, la société propose des TPU IP pour les systèmes d'inférence IoT/Edge.
L'aîné de la famille des nouveaux processeurs 5 nm, qui comprend huit appareils, le modèle dispose de 128 cœurs unifiés fonctionnant à une fréquence de 5,7 GHz. Selon les données préliminaires, chaque cœur dispose de 64 Ko de cache L1 pour les données et les instructions, ainsi que de 128 Mo L2 + L3. Les détails sur l'architecture et la microarchitecture des nouveaux produits ne sont pas encore décrits, mais l'exécution dans le désordre et la possibilité d'exécuter jusqu'à quatre instructions par horloge, ainsi que la prise en charge de la virtualisation et des fonctions RAS avancées sont mentionnées. Chaque cœur possède deux blocs vectoriels de 1024 bits et un bloc matriciel de 4096 bits.
Le processeur est équipé de 16 contrôleurs de mémoire prenant en charge les modules DDR5-7200 d'une capacité totale allant jusqu'à 8 To. Dans le même temps, il est possible de créer des systèmes à deux et quatre processeurs. La communication avec le monde extérieur est assurée par 32 contrôleurs PCIe, qui donnent au total 64 voies PCIe 5.0. Le TDP pour ce modèle n'est pas indiqué, mais la société parle de la possibilité d'utiliser un refroidissement par air et par liquide.
Les spécifications de base sont impressionnantes, mais encore plus surprenantes sont les revendications de performances du prochain produit phare. Dans SPECrate 2017 Integer, il est environ quatre fois plus rapide que le Xeon Platinum 8380 et trois fois plus rapide que l'EPYC 7763, les processeurs Intel et AMD de génération actuelle. De plus, la société promet que les performances FP64 des nouveaux produits seront trois fois supérieures à celles des prochains accélérateurs NVIDIA H100, c'est-à-dire qu'elles seront d'environ 180 Tflops.
Et dans les calculs du FP8, les performances seront six fois supérieures à celles du H100 d'un coup - 24 Pflops ! Dans le même temps, les nouveaux objets, selon Tachyum, seront plus économes en énergie que toutes ces puces. Pour Prodigy, prend en charge les formats FP64, FP32, TF32, BF16, INT8, FP8 et certains formats TAI, ainsi que le travail avec ce qu'on appelle. les calculs clairsemés (parsemés), qui sont importants pour les charges de travail d'IA. Certes, jusqu'à présent, l'annonce peut être qualifiée de "papier", car la société n'a pas fourni de caractéristiques détaillées des puces, se limitant à des histoires sur leur qualité.
Cependant, Tachyum rend régulièrement compte des progrès du développement. À l'heure actuelle, la société propose aux développeurs un émulateur matériel basé sur FPGA - seulement 8 cœurs Prodigy, mais avec la possibilité d'évoluer jusqu'à 64 cœurs. L'entreprise elle-même utilise cet émulateur pour le débogage des logiciels. Il a déjà adapté le noyau Linux et l'environnement de base, UEFI, KVM/QEMU, GCC, et a également porté avec succès FreeBSD sur son architecture.
2022-05-11 18:59:32
Auteur: Vitalii Babkin