p100 NVIDIA Tesla P100计算卡性能首测:震撼地球!

GTX 1080/1070虽然性能强劲,但在全新的Pascal系列中只能算是中档水平。真正的杀手是顶级大核GP100,拥有3840 FP32单精度和1920 FP64双精度CUDA核,主要面向高性能计算领域。
特斯拉P100作为首发
,仅开启3584个单精度和1792个双精度内核。即便如此,单精度和双精度的浮点性能高达10.6次和5.3次,同时配备4096位16GB HBM2高带宽视频内存,支持全新的NVLink互连总线,取代传统的PCI-E。

那么它到底性能如何呢?圣地亚哥超级计算中心的 Scott Le GrandRoss Walker、亚马逊网络服务的 Scott Le Grand 联合编写了一个通用计算测试工具琥珀
,可模拟生物分子周围的力场,并与 NVIDIA 合作对 Tesla P100 进行了一番测试,包括单路、双路、四路。因为测试用的硬件还是工程样本,操作系统是Linux,测试工具和方法是专门为了考察纯计算性能而设计的,结果只反映纯计算能力,与游戏性能无关。其实GP100核心应该永远不会出现在消费领域,GTX 1080 Ti、GTX泰坦X 2等顶级卡都会用GP102。
在参与对比的产品中,特斯拉M40基于麦克斯韦的架构和大核心的GM 200,3072流处理器。单精度性能超过7TFlops,双精度只有0.21TFlops,384位12GB GDDR5内存。
特斯拉k80采用两个开普勒架构大内核GK210,4992流处理器,单双精度浮点性能8.74,2.91TFlops,两套384位12GB GDDR5。
特斯拉K40的核心是GK110,2880流处理器,单双精度浮点性能4.29,1.43TFlops,384位12GB GDDR5。
Gtx1080,Titan X,980 Ti,980也比较,还有几个纯CPU,包括双E5-2697 v4/2698 v3/2650 v3,分别是32/32/20核。
具体的测试原则和流程就不多说了。专业性太强,只看结果:

相比前代M40,P100的计算性能有了很大的提升,大部分项目都在50%左右,有的甚至超过80%,有的甚至接近100%!
事实上,大多数情况下,一个P100可以干掉一个双M40
,领先幅度 10-20%不等。与消费级游戏卡相比,P100单通道相当于GTX泰坦X四通道水平,也可以看到 GTX 1080 同样十分凶猛,多数情况下都达到或者接近 M40 的水平,但不够稳定,有时候相当于单块 Titan X,有时候超过人家两块。遗憾的是,NV-Link总线的威力并没有得到充分发挥,双通道和四通道P100的推广普遍不如PCI-E..【p100 NVIDIA Tesla P100计算卡性能首测:震撼地球!】八路特斯拉P100

    推荐阅读