首个AI性能评测标准MLPerf发布英伟达创下六项人工智能性能记录

Susan1 · 发表于 2018-12-18 11:52:07

英伟达发布了业界第一个人工智能基准套件，创下了六项人工智能性能记录。

在谷歌、英特尔、百度、英伟达及其他数十家科技行业领军企业的支持下，新型基准测试套件MLPerf 可测定一系列深度学习工作负载。该套件涵盖了计算机视觉、语言翻译、个性化推荐以及强化学习任务等领域，旨在成为业内首个客观的人工智能基准测试套件。

最佳性能表现

英伟达在其提交的六个MLPerf 基准测试结果中均取得了最佳表现。这些测试涵盖了多种工作负载和基础架构规模，从单节点上的16颗GPU到跨80节点上的多达640颗GPU。

这些测试分为六大类别，分别为图像分类、对象实例分割、目标检测、临时翻译、复发性翻译与推荐系统。

英伟达并未提交第七类别，即强化学习的基准测试，原因是该类别尚未充分利用到GPU加速。

英伟达在语言翻译测试类别中表现突出

NVIDIA在语言翻译这一关键基准测试类别中表现尤为出色，仅需6.2分钟即完成了Transformer 神经网络的训练。

英伟达工程师利用 NVIDIA DGX 系统实现了这些测试结果。该系统包括全球最强大的人工智能系统NVIDIA DGX-2，搭载了16颗完全连接的V100 Tensor Core GPU。

首个AI性能评测标准MLPerf发布英伟达创下六项人工智能性能记录

唯一一家参与多达六项基准测试的科技公司

英伟达是唯一一家参与多达六项基准测试的科技公司，充分展现出 V100 Tensor Core GPU 在部署人工智能工作负载方面的通用性。

英伟达副总裁兼加速计算总经理伊恩巴克（IanBuck）表示：“全新基准MLPerf展示了NVIDIA Tensor Core GPU非凡的性能与通用性。我们的TensorCore GPU 拥有高性价比，且可通过各地的云服务提供商及电脑制造商实现供货，进而帮助世界各地的开发人员在开发过程中的每一个阶段推进人工智能的应用”。

一流的人工智能计算需要“全栈式”创新

要想在复杂多样的计算工作负载中实现优异性能，不仅仅需要出色的芯片。加速计算也不单单与加速器有关，还需要实现全栈式创新。

英伟达堆栈包括 NVIDIA TensorCores、NVLink、NVSwitch、DGX 系统、CUDA、cuDNN、NCCL、经过优化的深度学习框架容器以及英伟达软件开发套件。

超高易用性

英伟达的人工智能平台是最便捷且高性价比的选择。TensorCore GPU 可通过各地的云服务提供商及电脑制造商实现供货。

注册NGC云容器可持续更新堆栈

借助售价仅为2,500 美元的超强桌面级 GPU - NVIDIA TITAN RTX，用户在桌面上也可实现相同的Tensor Core GPU 强大功能。如果按照3 年使用期来计算，该 GPU 每小时的费用仅相当于几美分。

通过NVIDIA GPU Cloud (NGC)云容器注册，用户可持续更新这些软件的加速堆栈。

开发人员可将这些软件用于任意地点以及各大开发阶段：

对于桌面数据科学家：此容器支持利用NVIDIATITAN RTX GPU 开展前沿研究。

对于工作组：此容器同样可运行于NVIDIADGX Station。

对于企业：利用来自阿里云、AWS、百度云、谷歌云、IBM 云、Microsoft Azure、Oracle Cloud Infrastructure 以及腾讯云的英伟达GPU加速实例，此容器可加快将人工智能用于其云端数据。