
Intelの第4世代XeonファミリーであるSapphire Rapidsは、AVX-512ワークロードにおいて、AMDのEPYC Genoaラインアップに対して驚くべき結果を示している。
AMD Genoa、Intel Sapphire Rapids、Ice Lakeの各CPUで完成したAVX-512の性能ベンチマーク
先週、Intelは第4世代のXeon Scalableプロセッサ、通称Sapphire Rapidsを発表し、サーバーベースのプロセッサの性能向上を約束した。彼らは、人工知能と機械学習の改善の拡大を支援するために、全く新しいISA、Advanced Matrix Extensionsなどを導入しました。
しかし、AIやHPC、MLでの利用もあるAVX-512拡張セットでは、スケーラブルなプロセッサの改善利得について、発売時にもっと情報が必要だった。Linuxのアナリストであり、LinuxハードウェアのウェブサイトPhoronixのエディターであるMichael Larabel氏は、この新しいプロセッサに数々のベンチマークを実施した。前任のIce LakeやAMDの新しいGenoaプロセッサーと比較し、その結果が物語っています。
Larabel氏は、Phoronix Test Suite、Phoromatic、およびOpenBenchmarkingウェブサイトを通じていくつかのテストを開始し、すべてのプロジェクトでリード開発者を務めています。3つのCPUで実施されたテストは、すべて次のようなワークロードでAVXの性能をテストすることに基づいています。
中略
ほとんどのテストでアクティブな AVX-512 拡張機能はすべての CPU で良好な向上を示しましたが、Sapphire Rapids Xeon CPU では AVX-512 で最大 44% の最大の向上が見られましたが、EPYC Genoa では 21% の向上が見られました。
AMDがEPYC GenoaチップでAVX-512のマーケティングに力を入れたのに対し、IntelがSapphire RapidsチップでAVX-512についてあまり触れなかったことを考えると、驚くべきことに、IntelはAVX-512で大きな性能向上を実現しただけではなく、最高の効率性も実現したのである。AVX-512を有効にすると、Intel Sapphire Rapids CPUはGenoaチップと同等かそれ以上の性能を発揮し、AVX-512によってのみ、EPYCチップはブーストアップを実現することができたのだ。性能向上は世代対世代の比較であり、MilanがAVX-512サポートを提供していなかったので、AMD Genoaとの直接比較ではないことに注意してください。
以下は、Phoronixの調査結果に関するコメントです。
幾何平均は、第4世代EPYC GenoaがHPCワークロードで第4世代Xeon Scalableに対して競争力を持つために、AVX-512がいかに重要であるかも示しています。もしZen 4がAVX-512を追加していなかったら、EPYC 9654 2P AVX-512無効の結果は、AVX-512有効のXeon Platinum 8490H 2Pにわずかに及ばない結果になっていた。AVX-512を搭載しないZen 4サーバープロセッサであれば、より多くのワークロードでSapphire RapidsとGenoaの首位争いが繰り広げられたことでしょう。しかし、AVX-512を搭載したEPYC 9654 2Pは、このベンチマークセットにおいて、Xeon Platinum 8490Hプロセッサよりも19%高速になりました。
Intelが第4世代Xeon Scalableの発売時にAVX-512の改良をもっとアピールしなかったことに、私はむしろ驚いています。しかしいずれにせよ、AVX-512がより高い性能を発揮しながら、前世代のAVX-512プロセッサで見られたような電力消費への大きな影響もないのは、良いことです。これは、AMXと新しいアクセラレータを使用するために適応しなければならないのと比較して、多くの既存のソフトウェアにすぐに利益をもたらすことができます。より効率的なAVX-512とSapphire Rapids、そしてAVX-512を搭載したAMD Zen 4 CPUの組み合わせにより、より多くのソフトウェア開発者が自分のソフトウェアのためにAVX-512の最適化を検討するようになることを願っています。
Phoronix経由
Larabelは、開発者がすでに市場に出ているAVX-512互換のソフトウェアを引き続き利用し、より新しいAMX拡張セットに適応するための負担を軽減できると予測しています。
驚愕