先日、第2世代のIntel Habana AIアクセラレーターが発表されましたが、これらのチップの第1世代をベースにした最初の本格的なVoyager AIスーパーコンピューターがついに組み立てられ、操作できるようになりました。
2021年、カリフォルニア大学サンディエゴ校スーパーコンピューティングセンター(SDSC)は、Voyager実験用AIスーパーコンピューターとして、当時Intelに買収されたHabanaLabsからアクセラレーターを選択しました。実際、これは、IntelAIソリューションのみを使用するこのクラスの最初のシステムです。これまでのところ、ハードウェアの動作、ソフトウェアの適応、パフォーマンスの評価、およびチューニングのより深い研究を含む、テクノロジーのテストを目的としています。
Voyagerには42個のSupermicroX12ノードが含まれており、それぞれに第3世代の従来型IntelXeonスケーラブルプロセッサのペアと8個の第1世代HabanaGaudiアクセラレータが搭載されています。各アクセラレータには、1 TB/sのスループットで32GBのHBMメモリがあります。また、8つのHabanaGoyaHL-100推論アクセラレータを備えたSuperServer4029GP-Tノードのペアも含まれています。マシンは超大型AIモデルで動作するように設計されているため、400GbE RDMAファブリックがメインの相互接続として使用されます。各サーバーにはそのようなポートが6つあり、通信にはノンブロッキングのAristaスイッチが使用されます。
Voyagerからのレコードのかなり深刻なパラメータにもかかわらず、待つべきではありません。機械の最初の3年間の操作はテスト段階になり、その間に研究者と科学者の選択されたグループがそれにアクセスし、作業に関するすべての情報が注意深く収集され、研究されます。次のフェーズは2年間続き、この期間中、Voyagerへのアクセスははるかに自由になります。この時点で、SDSCはすべてのバグをキャッチし、ソフトウェアを適応させ、スーパーコンピューターを操作するための最適な方法を開発することを望んでいます。
2022-05-20 05:13:15
著者: Vitalii Babkin