NVIDIA 可说是引领异构加速AI 技术的厂商,不过随着 AI 加速技术广泛被市场采纳,有越来越多的竞争对手也推出 AI 加速器产品,并试图挑战 NVIDIA 的领先地位; NVIDIA 稍早公布第四年参与MLPerf 基准测试成绩,除了仍在各项基准测试维持出色的成绩,已经上市两年的 NVIDIA A100 GPU 仍席卷各项测试成绩,在 8 项训练测试夺下 6 项最快完成的成绩,同时也是唯一一款能够完成 MLPerf 训练 2.0 八个完整测试项的平台,显见 NVIDIA 加速平台不仅具备高效能,也能涵盖各类主流 AI 训练与加速。
▲ NVIDIA 的 Saleen 超算 AI 系统夺下 8 项中的 4 项冠军
NVIDIA 与合作夥伴递交的 MLPerf 成绩占总体的 9 成,其中由 NVIDIA 自建的 AI 超算系统 Selene 在 8 项训练测试当中占据其中四项最快完成的出色表现,其它夥伴的系统也在另外两项训练测试取得领先,由 NVIDIA A100 所驱动的系统即占其中 6 项冠军,且相较其它竞争对手的架构无法执行其中的几项训练, NVIDIA A100 则能够完成所有的训练测试项。
▲ NVIDIA 与合作夥伴的系统共拿下 8 项测试中的 6 项冠军,同时也是所有系统当中唯一能完整执行 8 个测试项的加速器产品
NVIDIA 强调,除了硬体架构的升级,不断的软体创新也是使 AI 效能持续提升的关键, NVIDIA 借助多项创新技术与功能使相同硬体也能再度突破,诸如提供降低作业负载的 CUDA Graphs 软体,与用於 GPU 深度学习加速的cuDNN 函式库持续最佳化,还有能快速加载大量音讯、图片与影片资料的 NVIDIA DALI 函式库等,都能进一步提升 NVIDIA GPU 在 AI 深度学习的效能。
且值得注意的是,虽然 NVIDIA A100 已是 2年前所推出的硬体架构,然而借助软体堆叠不断调整与提升, A100 平台相较第一次测试提升达 6 倍以上的效能,同时对比 NVIDIA 在 3.5 年前以 NVIDIA V100 参与 MLPerf 的效能提升达 23 倍, NVIDIA 也期许今年发表的 NVIDIA Hopper 架构能够进一步带来突破性的表现。此外 NVIDIA 也将这些成果提供给 MLPerf 的资源库,并将成果放入 NGC 容器,供 NVIDIA GPU 的客户也能享受这些成果。