スロバキアの会社Tachyumは、数年前から使用されているProdigyサーバープロセッサを正式に発表しました。作成者によると、これらはCPU、GPU、TPUを同時に置き換えることができる世界初の真にユニバーサルなチップです。さらに、Tachyumは、そのプロセッサが他のすべてのプロセッサよりも高速であるだけでなく、より安価でエネルギー効率が高いと主張しています。
Prodigyの汎用性は、とりわけ、この64ビットISAにネイティブなアプリケーションに加えて、x86-64、Arm、およびRISC-Vアーキテクチャ用にコンパイルされたバイナリファイルを実行できることにあります。 Tachyumは、そのチップはAIおよびHPCタスクに適しており、ハイパースケーラーにも魅力的であると述べています。今年から試験サンプルの発送を開始し、2023年前半に量産を開始する予定です。さらに、同社はIoT/エッジ推論システム用のIPTPUを提供しています。
8つのデバイスを含む新しい5nmCPUファミリーの中で最も古いモデルであり、5.7GHzの周波数で動作する128の統合コアを備えています。予備データによると、各コアには、データと命令用に64 KBのL1キャッシュと、128MBのL2+L3があります。新製品のアーキテクチャとマイクロアーキテクチャの詳細はまだ説明されていませんが、アウトオブオーダー実行とクロックごとに最大4つの命令を実行する機能、および仮想化と高度なRAS機能のサポートについて説明しています。各コアには、2つの1024ビットベクトルブロックと1つの4096ビットマトリックスブロックがあります。
プロセッサには、最大8TBの合計容量を持つDDR5-7200モジュールをサポートする16個のメモリコントローラが装備されています。同時に、2プロセッサおよび4プロセッサのシステムを作成することも可能です。外界との通信は32個のPCIeコントローラーによって提供され、合計で64個のPCIe5.0レーンが提供されます。このモデルのTDPは示されていませんが、同社は空冷および液体冷却を使用する可能性について話し合っています。
基本スペックは印象的ですが、さらに驚くべきことは、次のフラッグシップのパフォーマンスの主張です。 SPECrate 2017 Integerでは、Xeon Platinum 8380の約4倍、現世代のIntelおよびAMDプロセッサであるEPYC7763の3倍の速度です。さらに、同社は、新製品のFP64パフォーマンスが今後のNVIDIA H100アクセラレーターの3倍、つまり約180Tflopsになることを約束しています。
また、FP8の計算では、パフォーマンスはH100のパフォーマンスの6倍になります(24 Pflops)。同時に、Tachyumによると、新しいアイテムはこれらすべてのチップよりもエネルギー効率が高くなります。 Prodigyの場合、FP64、FP32、TF32、BF16、INT8、FP8、および一部のTAI形式をサポートし、いわゆるで動作します。スパース(スパース)計算。これはAIワークロードにとって重要です。確かに、これまでのところ、発表は「紙」と呼ぶことができます。なぜなら、同社はチップの詳細な特性を提供しておらず、チップの良さについての話に限定しているからです。
ただし、Tachyumは開発の進捗状況を定期的に報告しています。現在、同社は開発者にFPGAベースのハードウェアエミュレーターを提供しています。Prodigyコアは8つだけですが、最大64コアまでスケールアップできます。会社自体がこのエミュレータをデバッグソフトウェアに使用しています。 Linuxカーネルとベース環境であるUEFI、KVM / QEMU、GCCをすでに適応させており、FreeBSDをそのアーキテクチャーに正常に移植しています。
2022-05-11 18:59:32
著者: Vitalii Babkin