特殊なAIアクセラレーターは今では驚くことではありません。モデルをトレーニングするために設計されたバージョンは、最新のGPUの複雑さと消費電力にすでに追いついていますが、トレーニングされたモデルを実行するために使用されるチップは必ずしも単純ではありません。
Neuchipsは、RecAccel N3000 ASICの発表で反対の方向に進んでいます。これは、高レベルのパフォーマンスで効率が向上し、発熱が少ないことを特徴としています。これにより、厳しい熱および電力の制約内で動作することを余儀なくされることが多い「スマート」エッジコンピューティングプラットフォームに適したものになります。この場合、コンパクトでありながら強力な推論システムについて話します。
新製品は、TSMCの7nmプロセス技術を使用して作成されており、元々は深層学習推奨モデル(DLRM)を実行するように設計されていました。同社は今年の後半に、サーバー用のOCPモジュールを、デュアルM.2とPCIExpress5.0インターフェイスを備えた拡張カードの2つのフォームファクタで同時に市場に投入する予定です。
同社はMLPerfでRecAccelN3000を完全にテストしており、新製品の成功に自信を持っています。アクセラレータは、FP32の99.95%の精度を保証する独自の8ビット量子化およびキャリブレーションアルゴリズムを使用します。組み込みのキャッシングシステムにより、外部LPDDR5メモリへのトラフィックが50%削減され、メモリ帯域幅の使用効率が低下します。 、30%増加します。
Neuchipsが設計したアーキテクチャは、結果あたり1µJの領域でエネルギー効率を達成し、開発者は、新しいASICプラットフォームが以前に計画された20Wでの毎秒20Mの推論よりも優れたパフォーマンスを発揮すると主張できます。現時点では、既存のソリューションと比較してこの指標を評価することは非常に困難です。これは、それらのアプリケーションのさまざまなモデルとシナリオについて話すことができるためです。
そのような加速器は2020年にすでに存在していたことに注意してください。現在知られているのは、RecAccel N3000がハードウェアRoTを受け取り、DLRM、WND、DCN、NCFを含むすべての一般的なAI推奨モデルをサポートすることだけです。ただし、カスタムASICとIPブロックを開発するTSMCの子会社であるGlobal Unichip Corporationの元責任者によって設立されたため、これがすべて空の約束ではないと考える理由があります。
2022-06-09 14:51:53
著者: Vitalii Babkin