高端显卡的各项指标都很高,具备更多的 CUDA 核心,具备更大的显存空间,具备更高的显存带宽,使用的领域更广。下面我们对 Quadro RTX 8000 做一个整体的开箱评测。
整体外观
和其他 Quadro RTX 显卡包装一样, 使用绿白灰搭配,正面的灰色格子采用渐变的颜色很有现代感和立体感,包装的正面和顶部、侧面都有显卡型号的标识。整体拿在手里分量感十足,包装的材质很结实。
RTX 几个字有金属反光效果,凸显了这代显卡最重要的功能之一——实时光线追踪。
显卡包装
内部包装也和丽台以往的包装不一样,外壳和防震泡沫是一体的,显卡安放其中。给人的感觉是坚固、牢靠。
显卡配件盒
显卡外面还有一层透明防静电袋,配线盒里面有用户手册、支持手册、8 pin 转双6 pin 电源线、DP 转 DVI 转接头、DP 转 HDMI 转接头等,这是众多使用 DVI 显示器或 HDMI 显示器的福音,再也不用另外单独购买转接头了。
显卡正面
显卡显示接口
显示接口有了新的变化,不是 4xDP + 1xDVI 的配置,改成了4xDP + 1xVirtuallink的配置。
DP 接口都支持 DP 1.4 的协议,最高分辨率可以达到 7680x4320。而 Virtuallink接口则是下一代 VR 设备使用的标准接口,一个接口可完成供电、显示传输、控制信号多个功能。
显卡PCB板
SPECviewperf 13 是基于专业应用上衡量图形性能被广泛应用的测试软件。该软件对基于 OpenGL 和 Direct X 的专业绘图软件进行基准评测,SPECviewperf 13带来了全新的 9 个专业图形测试场景,SPECviewperf 13 测试更加贴近真实的工作应用, 其中一些测试场景甚至包含有超过 6,000 万个定点数据,能够充分反映出显卡的专业图形性能,此次测试我们使用软件默认配置进行评测。
从测试结果来看,RTX 8000看来Turing架构增加的不仅仅是光线追踪的效率和深度学习的效率。在专业应用的性能也非常不错。
这款软件更像是在一个复杂的游戏环境,在不同的光场效果中对显卡 DX 和OpenGL 渲染性能及稳定性的评测,这次评测使用的 4K 分辨率进行测试。
OpenGL 测试结果
DirectX 测试结果
Chaos Group 的 VRay 在渲染领域早已被广大用户认可了, 由于 GPU 渲染性能的提升,Chaos Group 在 VRay Next 上推出了 VRay GPU NEXT版本,支持调用Nvidia CUDA 核心进行渲染,随着技术的不断更新 GPU 渲染的质量上几乎和CPU 没有区别。GPU 算力强劲渲染时间成本会更低,并且支持多卡加速渲染,本次评估仅测试单卡的渲染性能。
测试截图
从测试结果看使用 RTX8000 只用了 44 秒,对于单卡的渲染速度来讲,已经是很快了。
就像我们熟知的 CPU-z 、GPU-z 一样,CUDA-z 是对 NVIDIA GPU 处理器的一些基本信息的采集, Geforce、Quadro、Tesla 卡都可以配合使用。
测试截图
在 CUDA-z 的测试项目中,我们实际用到最多的是单精度浮点运算,如果有使用到双精度科学计算的,推荐使用 GV100 或者 GP100 双精计算能力高的 GPU。
RTX8000 单精计算的能力达到了 11.7T。这么强的单晶浮点数是 CPU 不能匹敌的,越来越多的应用把计算从 CPU 转向了 GPU,48GB 的大显存可以加载更多计算数据,在显存中进行交互,加快计算速度。
测试截图
测试结果
目前 NVIDIA 的 RTX 渲染的 Benchmark功能, 3Dmark 的 Port Royal 可以支持。测试场景里带了大量金属的材质,反射效果惊艳。RTX8000 渲染 FPS 达到了38 左右帧,还算流畅。目前游戏行业已经有 BF5 使用这种技术,相信未来在工业制造领域、影视后期领域也会被广泛的使用。
我们选择 NVIDIA Tensorflow 的一个示例来测试显卡的性能。在相同参数设置的情况下,哪块卡在一秒内训练的图片数越多,说明显卡在示例学习方面的性能越好
可以看到,RTX 8000 在满载额时候每秒处理的数量最多为 643 张。
Quadro RTX 高端卡都具有 Tensor Core,可以实现图像加 AI 的一些应用。例如在渲染的同时可以实现去 AI 噪点,或者其他 AI 推理的一些工作。