本日のArchitectureDayイベントで、Intelは新しい開発を発表しました。これは、以前はコードネームGolden Cove(P-core)で知られていた将来のプロセッサ向けの生産的なコアです。これは、AlderLakeおよびSapphireRapidsクライアントおよびサーバープロセッサの一部であり、前世代のSunny Cove(Ice Lakeから)およびCypress Cove(から)と比較して、IPC(クロックサイクルごとに実行される命令の数)が19%増加します。 Rocket Lake)コア。
Intelレポートからわかるように、Golden Coveコアは、低スレッドのワークロードでの高性能と低レイテンシを目的として作成されたため、作成時には、同時に処理される命令の数を増やし、データの操作。開発者によると、Golden Coveの利点は、複雑なフォークコードに基づくアプリケーションに完全に現れます。
同じクロック速度でのサイプレスコーブコア(ロケットレイクプロセッサから)に対するゴールデンコーブコアによって提供される平均速度の利点は、19%と推定されます。サイプレスコーブはSkylakeよりも19%生産性が高いことを思い出してください。これは、特定の生産性の点で、SkylakeよりもGolden Coveが42%優れていることを意味します。
これらの結果を達成するために、GoldenCoveは多数のマイクロアーキテクチャの改善を行いました。コアは6つのデコーダー(SkylakeとCypress Coveでは5つではなく)を受け取り、micro-opsのキャッシュのレコードを4,000レコード(SkylakeとCypress Coveではそれぞれ1.5と2.25千ではなく)と12の実行ポート(ではなく)に増やしました。 SkylakeとCypressCoveの場合は8と10)。さらに、Golden Coveの物理レジスタファイルのサイズが大きくなり、命令並べ替えバッファのサイズがCypressCoveと比較して約1.5倍になりました。
重要な改善点の中で、開発者は分岐予測ブロックの精度の向上、L1キャッシュの待ち時間の短縮、データのプリフェッチに基づくL2キャッシュ帯域幅の最適化も強調しています。ゴールデンコーブコアには、スカイレイクとサイプレスコーブの2 +1または2+ 2スキームに対して、データのダウンロード用に3つのポート、アップロード用に2つのポートがあります。同時に、Golden Coveマイクロアーキテクチャは、L2キャッシュサイズがクライアントプロセッサではコアあたり最大1.25 MB、サーバープロセッサではコアあたり最大2 MB(以前は256または512 KBでした)の大幅な増加を想定しています。第1レベルのデータキャッシュのボリュームは変更されず、48KBになります。
ゴールデンコーブのパフォーマンスコアにおける重要な革新は、機械学習で使用されるテンソル計算を加速することを目的とした、新しいIntel Advanced Matrix Extensions(AMX)命令セットの導入です。実際、行列を使用した演算について説明しています。AMXセットには、クロックサイクルごとに2,000個の整数または1,000個の実数オペランドを処理するための命令が含まれています。 AMX命令は、AVX-512コードに基づく実装と比較して、AIアルゴリズムの実行を7倍高速化します。フェーズ1では、AMX拡張機能はGoldenCoveコアを搭載したサーバープロセッサでのみ使用できます。
ゴールデンコーブコアのマイクロアーキテクチャは、Intel 7プロセステクノロジ(以前の10 nm Enhanced SuperFin)を使用して製造され、2021年の第4四半期にリリースされるAlderLakeクライアントプロセッサに適用されます。その後、これらのコアはSapphireRapidsサーバープロセッサに含まれる予定です。2022年の第2四半期に市場に投入される予定です。
2021-08-19 15:29:56
著者: Vitalii Babkin